Google Cloudがアナリティクスサービス「BigQuery」のマルチクラウド対応を発表した。AWSやAzureに保存されているデータを転送したり複製したりすることなく、BigQueryで分析できるようになる。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Google Cloudは2020年7月14日(米国時間)、アナリティクスサービス「BigQuery」のマルチクラウド対応を発表した。Amazon Web Services(AWS)やMicrosoft Azure上のデータを動かすことなく、BigQueryによるマルチクラウドのデータ分析ができる。
Google Cloudは同日、AWSの「Amazon S3」に対応したプライベートα版の提供を開始した。Azureへの対応は近い将来(「soon」)に行うという。
BigQuery Omniでは、Google Cloudがマルチクラウド対応を進めるマネージドKubernetesサービス、「Anthos」を活用する。BigQuery OmniとしてAWSやAzureに展開するAnthosクラスタ上で、BigQueryのクエリエンジンである「Dremel」をマネージドサービスとして動かす。その上で、Google Cloud Platform(GCP)上のBigQueryユーザーインタフェース(UI)を通じたユーザーによるクエリを受け、Dremelがターゲットクラウドのデータストレージ上のデータに対して直接クエリを行い、結果をGCPのBigQuery UIに返す、またはターゲットクラウドのデータストレージに戻すことができる。
これにより、ターゲットクラウド上のデータをGCPへコピーするなどせずに、BigQueryで分析できる(ターゲットクラウド上のBigQueryクラスタへの一時的なデータ移動は発生する)。
BigQueryはもともとクエリエンジンとストレージを分離した設計になっているため、これが実現できたという。
Google Cloudのデータアナリティクス担当ゼネラルマネージャー兼エンジニアリングバイスプレジデント、デバンジャン・サハ(Debanjan Saha)氏は、BigQuery Omniのメリットを次のように説明した。
Copyright © ITmedia, Inc. All Rights Reserved.