Google、BigQueryにHadoop対抗の新機能:SQL風のクエリで大規模データを分析
米Googleは3月14日、企業向けビッグデータ分析サービス「BigQuery」に、マルチテラバイト級の大規模データセットを横断的に分析できる新機能を導入した。
米Googleは3月14日、企業向けビッグデータ分析サービス「BigQuery」に、マルチテラバイト級の大規模データセットを横断的に分析できる新機能を導入したと発表した。
新機能は、SQLライクなクエリを使って大規模データセットを高速結合できる「Big JOIN」と、さまざまな値のデータをグループ化する「Big Group Aggregations」、新しいデータタイプの「Timestamp」の追加など。
これにより、SQLライクのクエリまたはサードパーティ製のツールを使用して、マルチテラバイト級のデータセットを横断的に分析できるようになり、複雑なコーディングプロジェクトは不要になるという。
今回の新機能には、Apache Hadoopに対抗する狙いがあると見られる。Googleは「従来のデータ分析では、テラバイト級のデータテーブルを組み合わせるためには高度なMapReduceの知識やパワフルなハードウェアが必要とされ、相当の時間を要していた。しかしBigQueryの新機能によってこの速度が大幅に向上し、手間は大幅に少なくなった」と解説している。
この技術はこれまでGoogle社内で使っていたもので、例えばApp EngineチームはBig JOINを利用して2Tバイトのアプリ利用データと10Gバイトの設定データを60秒で結合し、Big Group Aggregationsによってこの情報を顧客別に分類。Tableauクライアントを使って情報をビジュアル化し、予想外のトレンドを見極めているという。
BigQueryの料金に変更はなく、従来通りデータ処理量に応じて課金される。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- GoogleがCloud Platformを値下げ、インスタンス追加や新機能も
米Googleは11月26日、クラウドストレージ料金の値下げなどを柱とする「Google Cloud Platform」の強化を発表した。 - Hadoop普及のキモは既存「言語」の取り込みにある
Hadoopを使ったビッグデータ分析はエンタープライズ領域に本当に浸透する? Clouderaはエンタープライズ市場の開拓に向けて着実に開発を進めているようだ - いまさら聞けないHadoopとテキストマイニング入門