非構造化データの分析ニーズに対応

エンタープライズ向けHadoop提供へ、米EMC

2011/05/10

 Hadoopのエンタープライズ向けディストリビューションを6月末までに提供すると、米EMCが5月9日に発表した。EMCといっても、ストレージ機器の事業部門ではない。同社が2010年7月に買収した、元米Greenplumの事業部門だ。これにより、非構造化データの分析ニーズの高まりに対応していくという。

 Greenplumはこれまで、オープンソース技術をベースとした、データウェアハウス/ビジネスデータ分析向けのデータベースシステムである「Greenplum Database」を提供してきた。多数のPostgreSQLインスタンスを並列に動作させてデータ処理を実行する仕組みを通じ、データロードおよびクエリ処理の高速化とスケーリングを実現し、大規模データウェアハウスを可能としている。Greenplum製品群としては現在、有償のソフトウェア製品に加え、無償の「Greenplum Database Community Edition」、さらにハードウェアと一体化したアプライアンス形態の「Greenplum Data Computing Appliance」などがある。

greenplum01.jpg スコット・ヤラ氏

 Greenplum Databaseは構造化データのデータ処理を実現する製品だ。しかし、「最近急増しているデータの大部分は非構造化データ。そしてHadoopは過去2、3年、この急増する非構造化データの問題を解決するための基盤的技術として浮上してきた。Hadoopを活用することで、Greenplumは構造化データ、非構造化データの双方について、ビッグデータ分析のための統合的なソフトウェアスタックを提供する商用技術プロバイダになれる」と、Greenplumの共同創設者で、現在はEMC DataData Computing Products部門の製品担当バイス・プレジデントであるスコット・ヤラ(Scott Yara)氏は説明した。

 GreenplumはInformaticaやSASなどのBI/データ分析製品との提携を強化してきており、企業における分析ニーズが増す非構造化データを、こうしたツールから活用しやすくなることは大きな前進だという。

greenplum02.jpg 構造化データ、非構造化データの双方にまたがる共通のデータ分析基盤を提供する

 EMCは今四半期中に、同社のHadoopディストリビューションである「Greenplum HD」製品群を提供開始する。無償のCommunity Editionは仮想アプライアンス形式のソフトウェア。「われわれはHadoopコミュニティに貢献する。耐障害性、ワークロード管理、スケジューリングなどの課題を解決する」(ヤラ氏)。EMCは同社によるサポートを含んだ商用版ソフトウェア製品のEnterprise Editionも同時に提供開始。「ミッションクリティカルな利用に適した機能や管理ツールを組み込む」(ヤラ氏)。技術パートナーとして、現在はまだステルスモードのベンチャー企業であるMapR Technologiesと組んだ。

greenplum03.jpg Greenplum HD製品群

 また、EMCはアプライアンス形態の製品「Greenplum HD Data Computing Appliance」を、今年第3四半期中に提供開始する。これは、Greenplum DatabaseとHadoopの双方を搭載し、構造化データと非構造化データの双方を単一のシステムで処理できるものになるという。なお、Greenplum Databaseはシェアードナッシングの大規模並列処理が特徴で、ストレージには各サーバ機の内蔵ディスクドライブを活用する仕組みだ。Hadoopについてもこれは同じ。従って、Greenplum HD Data Computing ApplianceはEMCのネットワークストレージ製品を活用するものとはならない。

(@IT 三木泉)

情報をお寄せください:

Server & Storage フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

キャリアアップ

- PR -

注目のテーマ

ソリューションFLASH

「ITmedia マーケティング」新着記事

「マーケティングオートメーション」 国内売れ筋TOP10(2024年11月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。

広告制作に生成AI活用 成功企業が語る「100万ドルのコスト削減」だけじゃないメリット
IT管理プラットフォームのAteraは、「Sora」や「Midjourney」などの生成AIツールを使用し...

CMOはつらいよ マッキンゼー調査で浮かび上がるAI時代の厳しめな業務実態
生成AI、研究開発、価格戦略……。慢性的なリソース不足の中でマーケターの業務範囲はま...