グーグルは、「Apache Hadoop」や「Apache Spark」を簡単に利用できるクラウドサービス「Google Cloud Dataproc」を正式にリリースした。
米グーグルは2016年2月22日(米国時間)、「Apache Hadoop(Hadoop)」および「Apache Spark(Spark)」のマネージドサービス「Google Cloud Dataproc(Cloud Dataproc) 1.0.0」を正式にリリースした。Cloud Dataproc 1.0.0はHadoop 2.7.2、Spark 1.6.0および「Hive 1.2.1」「Pig 0.15.0」に対応する。
この他、「BigQuery」「Cloud Storage」「Cloud Bigtable」「Google Cloud Logging」といったグーグルのクラウドサービス「Google Cloud Platform」と統合されており、Spark/Hadoopクラスタにとどまらず、包括的なデータ処理プラットフォームとして利用できるという。
Cloud DataprocはGoogle Cloud Platformを構成するサービスの1つで、2015年9月からβ版が提供されていた。Hadoop/Sparkクラスタの構築/立ち上げ、スケーリング、停止といった一連の作業を自動化できる。
Cloud Dataprocの料金単価は、仮想CPU当たり0.01ドル/時間(併用するGoogle Cloud Platformのリソースは別)。最低利用時間は10分で、分単位の課金となっている。
マネージドサービスであることから、管理・運用工数が掛からず、テスト済みで最新安定版のSparkとHadoopを利用できる他、下位互換性も維持するという。オペレーションの開始、停止にかかる時間は平均90秒以下で、他のオンプレミスおよびIaaSソリューションと比べて2〜10倍高速だとしている。
Cloud Dataprocクラスタの作成/監視/削除は、Google Cloud PlatformのコンソールとCloud SDKから行える。高度なユースケースの場合には「Cloud Dataproc REST API」と「Python」などのプログラミング言語を使って操作できるという。
Copyright © ITmedia, Inc. All Rights Reserved.