PFI、ビッグデータ分析製品「Sedue for BigData」を6月に発売:SedueとJubatusを統合
「Sedue for BigData」は、検索エンジン「Sedue」と機械学習フレームワーク「Jubatus」を統合したビッグデータ分析製品。レスポンス性でHadoopより優れるなどの特徴がある。
プリファードインフラストラクチャー(PFI)は5月20日、検索技術と機械学習技術を統合し、リアルタイム処理に対応したビッグデータ分析製品「Sedue for BigData」を6月20日から販売開始すると発表した。
Sedue for BigDataは、同社が開発する検索エンジン「Sedue」(関連記事)と機械学習フレームワーク「Jubatus」を統合したもの。秒間数千〜数万件の規模で流入するデータをリアルタイムに分析し、検索インデックスを作成する。非構造化データと構造化データを合わせて分析でき、分析結果をリアルタイムに可視化・集計する機能も提供する。レコメンデーション、連想検索、自然言語処理、機械学習などをサポートする。
リアルタイムデータ処理には、CEP(複合イベント処理)という技術があるが、CEPはデータをどのように処理するかを事前にルールとして記述する必要があるのと、データを蓄積・参照する仕組みがないなどの課題がある。Sedue for BigDataでは、機械学習技術を利用することでデータから自動的にルールを抽出し、検索技術を使ってデータを蓄積・参照することができる。これにより、CEPの持つ課題を解決することができるとしている。
DWHやApache Hadoopとも違った特徴があるという。Sedue for BigDataでは、DWHの苦手とする非構造化データに対する検索・分析が可能なほか、構造化データに対する分析においてもカラム指向アーキテクチャとオンメモリによる分析処理を取り入れている。1つの製品で構造化データと非構造化データに対する分析を同時に実現できる。
一方のHadoopは、非構造化データに対する分析を得意とするが、基本的にはバッチ処理であるため、リアルタイム性で劣る。Sedue for BigDataでは、Hadoopと同様のデータ処理を、リアルタイムで実現することができるとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- DWH用プラットフォームの最上位機種:日本テラデータ、「Teradata Active EDW 6700」を販売開始
日本テラデータのTeradata Active EDW 6700は、InfiniBandを搭載し、Teradata UDAとの連携を強化している。 - 日本人が立ち上げたシリコンバレー発ベンチャー:トレジャーデータ、日本国内での事業展開を本格化
クラウド型ビッグデータ処理基盤を提供する米国トレジャーデータが日本国内における事業展開を本格化させる。 - 今後も月次でリリース予定:Hadoopアプリ開発キット「Cloudera Development kit」を公開
Hadoop環境用のアプリケーション開発やデータ操作を容易にする開発キットをClouderaが公開。「いまどき」のアプリケーション開発者に扱いやすい環境を整備する。 - ビッグデータ活用に向け業務データを一元管理・利用:山崎製パン、基幹システムをSOA基盤上に刷新
山崎製パンは、同社基幹システム「ヤマザキ基幹システム」をSOA基盤上に刷新、稼働を開始した。生産や配送業務の効率化、現場の進捗状況など経営判断に必要な情報の見える化、商品管理などの運用負荷軽減やコスト削減を見込んでいる。