米グーグルがHadoop/Spark運用サービス「Cloud Dataproc」のベータ提供を開始:料金は1VM1時間1セント(あるいはそれ以下)
米グーグルは2015年9月23日(米国時間)、同社のクラウドサービス「Google Clooud Platform」で、Hadoop/Sparkクラスタ運用サービス、「Cloud Dataproc」のベータ提供を開始した。平均90秒というクラスタの迅速な展開と、1仮想インスタンス当たり1セント(あるいはそれ以下)という低料金が特徴。
米グーグルは2015年9月23日(米国時間)、同社のクラウドサービス「Google Clooud Platform」で、Hadoop/Sparkクラスタ運用サービス、「Cloud Dataproc」のベータ提供を開始した。
Dataprocは、Hadoop/Sparkクラスタの構築/立ち上げ、拡張/縮小、停止という一連の作業を自動化するサービス。Microsoft Azureの「Azure HDInsight」、Amazon Web Servicesの「Amazon Elastic MapReduce」と競合する。発表時点では、Spark 1.5およびHadoop 2.7.1を使っている。
グーグルは、Cloud Dataprocの特徴として、クラスタ運用にかかわる待ち時間が短い点をアピールしている。
「Dataprocを使わずに、オンプレミスあるいはIaaS事業者を通じてSparkおよびHadoopのクラスタを作成するには、5〜30分掛かる。これに比べ、Cloud Dataprocクラスタは立ち上げ、スケール、シャットダウンが迅速で、それぞれのオペレーションに掛かる時間は平均90秒、あるいはそれ以下だ」と、同社プロダクトマネージャーのジェームズ・マローン(James Malone)氏は同サービスを紹介するブログポストに書いている。
もう一つの特徴は低料金。1仮想インスタンス1時間当たり、1セントという。課金は、Google Cloud Platformの他のサービスと同様に分単位で、最低利用時間は10分。
Dataprocは、「preemptive instance」により、さらに低料金で使うこともできる。preemptive instanceとは、最長で24時間の寿命しかない仮想インスタンス。通常より最大70パーセント低い料金が設定されている。
DataprocはBigQuery、Cloud Storage、Cloud Bigtableといったサービスと統合されており、Google Developers Console,、Google Cloud SDK、Cloud Dataproc REST APIで操作できる。
Copyright © ITmedia, Inc. All Rights Reserved.