PostgreSQL互換のストリームデータ分析DB「PipelineDB」に商用版が登場:オープンソースのストリームデータ処理基盤
ストリームデータ分析に適したオープンソースのデータベースに商用版が登場。PostgreSQL互換で、SQLで直接クエリを投げられるため、ETLなどが不要な点が特徴だという。
2016年1月14日、PostgreSQLをベースにしたオープンソースのデータベース「PipelineDB」の商用版「PipelineDB Enterprise」がリリースされた。
PipelineDBは、ストリームデータに対して継続的にSQLクエリを走らせることができるため、リアルタイムでデータを分析することが可能だ。SQLで定義できるものであればETL(データの取り出し、変形、読み込み)操作なしで利用できる。
PipelineDBに特徴的な実装としては「Continuous view」が挙げられる。PipelineDBのWebサイトでは、Continuous viewを「非常にスループット性能が高くリアルタイムでインクリメンタルに更新されるマテリアライズドビューのようなもの」と説明されている。Continuous viewでは、ストリームデータを格納する「ストリームバッファ」から「Workerプロセス」を経て「combinerプロセス」で統合され、結果がデータベースに格納される(下図)。つまり、最終的なアウトプットが必ずデータベースに格納される点が大きな特徴だ。
PipelineDBは企業のミッションとして、「スケーラブルなリアルタイムアプリケーションを特別な実装なしに構築できるようにすること」を掲げている。現在PostgreSQL 9.4ベースにしているが、2016年3月までにはPostgreSQL 9.5との互換性も持たせる予定だという。PipelineDBでは、2015年7月の会社設立以来、企業名は明かせないものの既に金融、テレコム、広告、ゲーム、ネットワークなどの業界で商用版の先行採用が進んでいるとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- PostgreSQL 9.4の主要な改良点、9.5以降の展望
エンタープライズ性能を高めたPostgreSQLが次の6年で目指すのは「フレキシビリティ」。開発プロジェクト コアコミッターの講演で展望を聞いた。 - PostgreSQL 9.4 GINインデックスの評価、JSONBデータ型の使い方
PostgreSQL 9.4で注目が集まるGINインデックスの性能を検証、バイナリJSONデータ型の使い方も紹介する。 - SQLでストリーム分析ができる「Norikra v1.0.0」公開
SQLクエリでストリームデータ分析系の操作ができるNorikraを、LINEに勤務する田籠氏がOSSで公開。「ユーザーフレンドリーなストリーム処理を理解している初のソフトウェア」だという。 - SPL言語学習なしでもストリームデータ処理の実装が可能になった「InfoSphere Streams V3.0」
センサネットワークなどから送出されるストリームデータの分析がより身近に。IBMは専用言語スキルがなくても機能を組み合わせて分析プラットフォームを実装可能にする製品を発表した。 - データ分析基盤をApache Sparkベースに置き換え、BluemixではSparkサービスも――米IBM
米IBMは、年次イベント「IBM Insight 2015」で、データアナリティクスに関する複数の発表を行った。ビッグデータ分析基盤はApache Sparkベースになり、PaaS「Bluemix」上でもApache Sparkサービスを提供する。CognosはセルフサービスBIを念頭にUXシナリオを再設計している。