PFI、ビッグデータ分析製品「Sedue for BigData」を6月に発売：SedueとJubatusを統合

「Sedue for BigData」は、検索エンジン「Sedue」と機械学習フレームワーク「Jubatus」を統合したビッグデータ分析製品。レスポンス性でHadoopより優れるなどの特徴がある。

[藤本和彦，＠IT] PC用表示関連情報

LINE

Hatena

　プリファードインフラストラクチャー（PFI）は5月20日、検索技術と機械学習技術を統合し、リアルタイム処理に対応したビッグデータ分析製品「Sedue for BigData」を6月20日から販売開始すると発表した。

　Sedue for BigDataは、同社が開発する検索エンジン「Sedue」（関連記事）と機械学習フレームワーク「Jubatus」を統合したもの。秒間数千～数万件の規模で流入するデータをリアルタイムに分析し、検索インデックスを作成する。非構造化データと構造化データを合わせて分析でき、分析結果をリアルタイムに可視化・集計する機能も提供する。レコメンデーション、連想検索、自然言語処理、機械学習などをサポートする。

　リアルタイムデータ処理には、CEP（複合イベント処理）という技術があるが、CEPはデータをどのように処理するかを事前にルールとして記述する必要があるのと、データを蓄積・参照する仕組みがないなどの課題がある。Sedue for BigDataでは、機械学習技術を利用することでデータから自動的にルールを抽出し、検索技術を使ってデータを蓄積・参照することができる。これにより、CEPの持つ課題を解決することができるとしている。

　DWHやApache Hadoopとも違った特徴があるという。Sedue for BigDataでは、DWHの苦手とする非構造化データに対する検索・分析が可能なほか、構造化データに対する分析においてもカラム指向アーキテクチャとオンメモリによる分析処理を取り入れている。1つの製品で構造化データと非構造化データに対する分析を同時に実現できる。

　一方のHadoopは、非構造化データに対する分析を得意とするが、基本的にはバッチ処理であるため、リアルタイム性で劣る。Sedue for BigDataでは、Hadoopと同様のデータ処理を、リアルタイムで実現することができるとしている。

PFI、ビッグデータ分析製品「Sedue for BigData」を6月に発売：SedueとJubatusを統合

関連記事

関連リンク

総合記事ランキング