直近の情報系ITインフラに関わるニュースをまとめて紹介。10月冒頭は、データ転送・処理速度を重視したLTEツール、機械学習演算を高速化する技術、データ分析専門家集団との協業が相次いで発表となった。
富士通は2013年10月8日、需給計画策定を支えるリアルタイム情報インフラである「Interstage Information Integrator Enterprise Edition V11」の販売を開始した。
流通や小売、製造業などで必須となりつつある日次やあるいはそれ以上に短期間での集計・分析などを必要とするシステムに適したリアルタイム性のあるデータ収集と統合が特徴だ。
同製品は、米Syncsortの「DMExpress」が持つ高速データ加工技術と富士通が持つ高速データ転送技術を使っている。データ基盤には「Interstage Information Integrator」を利用する。データクレンジングとソートやマージ、集計処理をDMExpressで事前処理してデータウェアハウスに渡すことで、処理速度向上が見込める。
OracleやSQL Server、Sybase IQなどとの接続インターフェイスも持つ。富士通が展開するUNIXサーバ「SPARC M10」(関連記事)や、同じく富士通が展開する企業向けパブリッククラウドサービス「FUJITSU Cloud IaaS Trusted Public S5」などとの組み合わせも可能だ。
同日、NECも分散処理技術を活用したデータ分析基盤のラインアップを強化した。Apache Hadoopを使った機械学習によるデータ処理を従来の10倍の処理速度で実行できるとしている。機械学習は、レコメンドエンジンや需給予測などに利用されるデータ処理アルゴリズムの1つ(関連記事:@IT内検索「機械学習」)。
繰り返し演算と行列演算を使うことが多く、MapReduceを使った処理を多用する。繰り返し演算処理におけるボトルネックはMapReduceにおけるディスクI/Oにある場合が多い。同製品ではこの課題を解消するため、メモリ上でMapReduceの処理を行う。一方の行列演算では、サーバ間通信がボトルネックとなるケースが多い。このため、メッセージングの部分にMPI(Message Passing Interface)を採用して高速化している。
この分散処理は、メモリ上で展開することから、計算ノード上のデータ消失リスクがある。通常、分散処理では何らかの方法で一部のデータが欠落しても正しい値を保証する仕組みを持っているが、許容以上の計算ノードのデータが処理中に消失した場合には復旧が難しい。一般にはメモリに展開しているデータを丸ごと不揮発性のドライブに格納するが、同製品では、処理の継続に必要なデータを選別して、より少ないデータ量の格納のみで済むようにしているという。
同技術は新エネルギー・産業技術総合開発機構の「グリーンネットワーク・システム技術研究開発プロジェクト」の成果を基にしている。今回の成果は「IEEE International Conference on Big Data 2013」でも発表する予定だ。
2013年10月9日には、日立製作所(日立)がブレインパッドとの協業に合意したと発表した。ブレインパッドは日本国内でマーケティング領域を中心にデータ分析サービスなどを提供する企業。
両者は広告・宣伝、販売促進、流通チャネル設計などのマーケティング領域でのデータ分析サービスを提供していく予定だ。具体的には、ブレインパッドが持つBI、BAソフトウェア製品群、SaaSサービスを、日立グループが持つ顧客に対して共同で提供する。将来的にはマーケティングオートメーションシステム構築や運用支援も提供する構想だ。
今回の協業合意により、データ分析専門の人材が不足する企業であっても、一定水準のデータ分析に基づくマーケティング活動が可能になるシステムやプロセスを提供していくとしている。
日立では、社会インフラ向けのセンサネットワークシステムや情報活用システムを既に持っており、ブレインパッドの製品やデータ分析ノウハウを組み合わせた新製品・サービスの共同開発も検討していくとしている。
Copyright © ITmedia, Inc. All Rights Reserved.