いろいろ出てきたPureSystems製品群のうち、PureDataラインアップの特徴を整理しよう。後半はSQL標準策定の動向を識者に突撃取材。
日本IBMは2013年2月14日、IBM PureSystems新製品発表会を行い、PureSystemsのラインアップを拡充しました。当日はPower7+を採用したアプリケーションプラットフォーム「PureApplication」の新しいモデルおよびパターンの発表などもありましたが(関連記事1、関連記事2)、ここではデータプラットフォーム「PureData」に目を向けましょう。
PureDataに関して、今回発表されたのは「PureData System for Analytics N2001」です。データ分析向けのPureData製品にパフォーマンスの高い新モデルを新たに新たに投入した形です。
従来モデルがN1001、新モデルが「N2001」です。N1001の実体はNetezza TwinFinといってもよいでしょう。2009年8月にNetezzaが発表したデータウェアハウスのアプライアンス製品の第4世代目に相当します。TwinFinは開発コード名がそのまま製品名として定着したものです。
NetezzaがTwinFinを発表した直後、IBMがNetezzaを買収し、2012年に発表したPureData SystemシリーズからNetezza製品はPureData System for Analyticsに……という経緯がありました。いまでもPureData System for Analyticsには「powered by Netezza technology」と添えられていたりします。ブランドの再構成によりラックの扉は緑から青になりましたが、中身はNetezzaのハードウェアが生きています。
一方、新モデルN2001は歴代のNetezzaプラットフォームの中でも飛躍的に性能が向上しています。従来モデルと比較すると、分析クエリのパフォーマンスは平均して約3倍、ラック当たりのデータスキャン効率も向上し128GB/秒、さらにデータの集積率が向上したためラック当たりのユーザーデータ量も50%アップしました。処理が3倍速くなり、データが1.5倍積めるようになったということです。
従来の特徴である超並列演算処理もより高度になっています。N1001では92並列であったストリーム処理が、N2001では240並列になりました。ここだけなら単純に2.6倍ですが、これにN2001ではハードウェアが強化された分が加わり、結果的には3倍の性能向上につながっています。
2012年にはソフトウェアをバージョンアップし、Netezza Performance Software V7.0を投入しています。ソフトウェア単体で比較するのは難しいですが、IBMによると「約2倍のクエリ性能向上を実現」とのことです。
今回、実際に従来比「3倍」がどのくらいかを知るために、日本IBM ソフトウェア事業 インフォメーション・マネジメント事業部 原沢滋氏がデモを披露しました。
原沢氏にはデモサンプルとして、200GB、21億件の売上明細データを用意していただきました。
このサンプルデータを使い、N1001とN2001で同じコマンドを同時に入力して応答時間を比較します。発行したSQLコマンドは、全件を対象としたcount、sum、group byです。かかった時間はN2001で約2秒、N1001で6〜7秒程度でした。
原沢氏はPureData System for Analyticsの強みとして「簡易性」「スピード」「低TCO」を挙げていました。PureData System for AnalyticsはNetezzaの時から分析向けに徹底的に割り切ることで性能を高め、運用負荷を減らすような製品にしています。そうした強みや特徴がますます顕著になっているという印象です。
Copyright © ITmedia, Inc. All Rights Reserved.