IBM SPSS Analytic Server V1.0を導入することで、SPSS ModelerからHDFSに直接アクセスしてHadoop基盤上にあるデータを分析可能になる。
日本IBMは2013年5月30日、予測分析ソフトウェア「IBM SPSS Modeler」とApache Hadoopを連携するソフトウェア「IBM SPSS Analytic Server V1.0」を発表した。RDBに加え、Hadoop上のデータをSPSS Modelerの分析対象とすることができる。1TB当たりの基本価格は17万5350円、同日から販売を開始する。
Hadoop上の非構造化データをSPSS Modelerで活用するには、RDB形式へのデータ変換が必要であったり、変換したデータを保存するストレージが別途必要であったりと、効率やコストの面で課題があった。
SPSS Analytic Serverは、SPSS ModelerとHadoop基盤の間に設置する。SPSS Modelerは、SPSS Analytic Serverを経由してHadoop MapReduceフレームワークに対応する。HDFSに直接アクセスしてHadoop基盤上にあるデータを分析可能になる。オープンソースのHadoopのほか、「IBM InfoSphere BigInsights」、Cloudera、HortonworksなどのHadoopディストリビューションに対応する。
IBMでは、分析アルゴリズムのためのインターフェイス「Analytic Framework」を独自開発し、SPSS Analytic Serverに実装し、SPSS ModelerとHadoopの連携を自動的に処理している。Hadoopに対して、データの加工やサンプリング、分析結果の書き込みなども行うことができる。
Copyright © ITmedia, Inc. All Rights Reserved.