SQLクエリが使えるHadoop環境を即立ち上げできるPureData System製品が登場。統合管理ツールと併せてチューニング済みの状態で提供する。
日本IBMは2013年10月15日、同社垂直統合システム「Pure System」の中でもデータ処理に特化した「Pure Data System」ラインアップに新たにApache Hadoop向け「IBM PureData System for Hadoop H1001」とNetezzaの技術を基にした高速並列処理向け製品のエントリモデル「IBM PureData System for Analytics N2002-002」を追加した。IBM PureData System for Hadoop H1001は同日販売開始、IBM PureData System for Analytics N2002-002は10月18日に出荷開始を予定している。
Pure System製品群は、Webサーバやアプリケーションミドルウェアなどのシステム構成を「パターン」として設定してあり、UI操作で検証済みの構成をすぐに立ち上げられるのが特徴。シリーズには既に下記のラインアップがある。
今回発表になったIBM PureData System for Hadoop H1001では、Hadoop基盤ソフトウェアとして「IBM InfoSphere BigInsights」を採用する。BigInsgightsに格納したデータに対してSQLクエリを可能にするBigSQLやスプレッドシートインターフェイスBigSheetsなど、BigInsightsが持つ機能が利用できる。また、ハードウェアパフォーマンスを含めた統合管理ツールも提供する。
また、DWHとの連携には「IBM InfoSphere Optim EasyArchive for PureData Hadoop」を利用でき、「IBM PureData System for Analytics」上のデータのインポート/エクスポートが可能だ。
システムはデータノード18台とマスターノード2台で構成され、ノード間通信には10G/40Gビットイーサネットを利用する。データノードのディスクはHDFSでフォーマット済み。圧縮して格納するため、最大1Pバイトのデータを格納可能だという。
一方の「IBM PureData System for Analytics N2002-002」は、従来のIBM PureData System for Analyticsのエントリモデルに位置づけられる。処理基盤は従来製品と同様で、ハードウェアを利用した並列処理を得意とするNetezzaのエンジンを採用している。構成を中堅中小規模企業の要件に合わせ、ブレード数やディスク数を削減して価格を抑えている。
Copyright © ITmedia, Inc. All Rights Reserved.