検索
ニュース

「Google Cloud Dataproc」が正式リリース分単位でHadoop/Sparkが利用できるマネージドサービス

グーグルは、「Apache Hadoop」や「Apache Spark」を簡単に利用できるクラウドサービス「Google Cloud Dataproc」を正式にリリースした。

Share
Tweet
LINE
Hatena

 米グーグルは2016年2月22日(米国時間)、「Apache Hadoop(Hadoop)」および「Apache Spark(Spark)」のマネージドサービス「Google Cloud Dataproc(Cloud Dataproc) 1.0.0」を正式にリリースした。Cloud Dataproc 1.0.0はHadoop 2.7.2、Spark 1.6.0および「Hive 1.2.1」「Pig 0.15.0」に対応する。


Cloud Dataprocの公式サイト

 この他、「BigQuery」「Cloud Storage」「Cloud Bigtable」「Google Cloud Logging」といったグーグルのクラウドサービス「Google Cloud Platform」と統合されており、Spark/Hadoopクラスタにとどまらず、包括的なデータ処理プラットフォームとして利用できるという。

 Cloud DataprocはGoogle Cloud Platformを構成するサービスの1つで、2015年9月からβ版が提供されていた。Hadoop/Sparkクラスタの構築/立ち上げ、スケーリング、停止といった一連の作業を自動化できる。

 Cloud Dataprocの料金単価は、仮想CPU当たり0.01ドル/時間(併用するGoogle Cloud Platformのリソースは別)。最低利用時間は10分で、分単位の課金となっている。

 マネージドサービスであることから、管理・運用工数が掛からず、テスト済みで最新安定版のSparkとHadoopを利用できる他、下位互換性も維持するという。オペレーションの開始、停止にかかる時間は平均90秒以下で、他のオンプレミスおよびIaaSソリューションと比べて2〜10倍高速だとしている。


Cloud Dataprocの特徴(出典:米グーグル)

 Cloud Dataprocクラスタの作成/監視/削除は、Google Cloud PlatformのコンソールとCloud SDKから行える。高度なユースケースの場合には「Cloud Dataproc REST API」と「Python」などのプログラミング言語を使って操作できるという。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る