OSSを含むアプリケーション実行環境をPaaSとして提供する「Bluemix」に蓄積データの分析・加工を得意とする「dashDB」とPaaS版「InfoSphere Streams」(β版)が加わった。データ分析基盤でのPaaS利用は進むか。
米IBMは2015年8月13日(現地時間)、同社が提供するPaaS(Platform as a Service)である「Bluemix」向けの新しいサービスを発表した。開発者にとって使いやすいデータ分析関連サービスだという。今回発表されたのは「IBM Streaming Analytics(Streaming Analytics)」と「IBM dashDB(dashDB)」の二つ。現時点で選択できるロケーションは「US South」。
Streaming Analyticsは、「InfoSphere Streams」のPaaS版と考えると理解しやすいだろう。現在はオープンβ版として無料で利用できる。アプリケーション構築はInfoSphere Streamsと同様に「Streams Processing Language(SPL)」で行う。
Streaming Analyticsでは、専用の仮想マシンにInfoSphere Streamsをホストして提供している。数千のデータソースに対応しており、リアルタイムデータ分析を得意とする。秒間数百万件規模のデータを瞬時に分析するような用途を想定しているため、プローブ交通情報収集やIoT(モノのインターネット)データ活用基盤として利用できる。
関連記事:プローブ交通情報を活用した事例としては、「『リーフ』のプローブ情報分析結果がクラウド経由で利活用可能に」(@IT)などがある。
dashDBは、既存のリレーショナルデータベースの情報保管先として利用できる。dashDBはSQLアクセスの他に、「Netezza Analytics」のライブラリや「Watson Analytics」、統計向けのプログラム言語「R」によるデータ分析が可能。この他、BIツール「Tableau」「Cognos」などのデータ分析ツールとも連携できる。列データを効率よく扱う「BLUアクセラレーション」の機能が盛り込まれており、インメモリでのカラムナーデータベース処理も高速化している。また、大規模データを扱うプランでは、MPP(超並列処理)機能を盛り込み、照会(参照)処理の性能を向上させているという。
関連記事:dashDBはIBM Watsonのバックエンドで採用されているデータベースとしても知られています。詳しくは「“Watson”はどんなDBで動いている?」(@IT)をご覧ください。Watson Analyticsについては、「IBMがWatsonエンジンをサービス化、間もなくベータテスト版提供へ」(@IT)、「Watson Analyticsのテーマは、データ分析という作業をなくすこと」(@IT)を参照ください。BLUアクセラレーションについては「DB2はインメモリ/カラムストアDBの実装で『ハイブリッドデータベース』になる」(@IT)を参照ください。
dashDBのエントリプランは、1Gバイトまで無料で利用できる(最大50Gバイトまで月次で50米ドル、2015年8月20日時点)。最大規模のプランではベアメタルサーバーを使った3ノード以上のクラスター構成を選択できる(プリロードデータ4Tバイトまで、価格は個別)。
Bluemixは、CloudFoundryをベースにしたPaaSプラットフォーム。用意されたカタログから必要なサービスを選んで利用する。データ分析関連では、既に「Cloudant」「MongoDB」「Redis」などのNoSQL、「BigInsights for Hadoop」や「Apache Spark」「Elasthicserach」などを提供している。自社プロダクトのPaaS提供だけでなくオープンソースプロダクトを多数含んでいる点が特徴だ。
Copyright © ITmedia, Inc. All Rights Reserved.