Google Cloudは2022年4月6日、データ分析関連で多数の発表を行った。これにはデータレイクとデータウェアハウスを統合する「BigLake」、 複数のツールで統一したBIができる「BigBI」、データ製品間の相互運用性とベストプラクティスを推進する連合「Data Cloud Alliance」などが含まれる。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Google Cloudは2022年4月6日、データ分析関連で多数の発表を行った。これにはデータレイクとデータウェアハウスを統合する「BigLake」、 複数のツールで統一したBI(ビジネスインテリジェンス)ができる「BigBI」、データ製品間の相互運用性とベストプラクティスを推進する連合「Data Cloud Alliance」などが含まれる。
BigLakeは各種データレイクとデータウェアハウスを統合するストレージエンジン。次の2つの機能を果たす。1つはさまざまなデータレイク、データウェアハウスのデータを複製したり移動したりせずに統合し、多様なBI、機械学習/AIツールなどで分析できるようにすること。これによって、データのサイロ化を防ぐ。もう1つはデータレイクのデータに、データウェアハウスと同様なセキュリティおよびガバナンスを統一的に適用できることだという。
BigLakeは BigQuery における経験とオープンソースエコシステムを融合したものだとGoogle Cloudは説明する。
「業界標準となっているオープンなプラットフォームやストレージエンジン全てに対応する。ファイルフォーマットではParquetなど、データエンジンではSparkなど、テーブルフォーマットではDelta Lake、Icebergなど、あらゆる(主要なオープンソース技術)をサポートする。これは完全にオープンな仕組みだ」(Google Cloud プロダクトマネジメント ディレクター、スディール・ハスべ氏)
Copyright © ITmedia, Inc. All Rights Reserved.