「IBM DB2」最新版のリリースと前後し、最近、IBMの主眼がデータベース製品から「データそのもの」に軸足を移してきている。今回はこの重要な“変化”に目を向けて、その動きや狙いを確認する。
データベースウォッチャーとしては悩ましい事態です。本連載はデータベース業界の動きをウォッチしており、実質的にはデータベース製品の進化を追いかけてきました。新バージョンに実装される新機能の仕組みやメリットに目を向けてきたわけです。しかし「DB2」の最新版リリースと前後して、IBMに大きな変化が見られています。
2016年6月、IBMはRDBMS(リレーショナルデータベース管理システム)製品「IBM DB2」の最新版、「IBM DB2 V11.1(以下、DB2 V11.1)」を正式リリースしました。DB2 V11.1では主に、「ハイブリッドクラウド環境への対応」と「パフォーマンス向上」が施されています。早速、DB2 V11.1の新機能や特徴をじっくり確認しましょう……と言いたいところですが、今回はそれを踏まえた“重要な変化”に目を向けることにします。
日本IBMは2016年5月11日、DB2の最新版とともに、IBMのデータやデータ活用環境に関する方針を示した「Open for Data戦略」を発表しました。日本IBM 執行役員 IBMアナリティクス事業部長の三浦美穂氏はOpen for Data戦略について、「これまで活用できていなかった“ダークデータ”を活用し、価値を生み出していく取り組みが求められている。IBMはお客さまの革新を支援し、その企業価値を高めるために、分析をするための開かれたデータ活用環境およびデータを提供する」とビジョンを話していました。
Open for Dataにおけるデータ活用環境は、確かに具体的なデータベース製品から構成されています。重要なポイントは、IBMの主眼がデータベース製品から「データそのもの」にも軸足を移してきていることです。ここはデータベースウォッチャーとしては戸惑うところです。
これまでIBMは、データベースのエンジンやツールといった技術を中心に提供していました。ところが昨今では、「データそのものに価値がある」と考えています。提供するものが技術1本から、「技術とデータの両方」へと変わりつつあるということになります。そうしたスタンスが形になったのがOpen for Data戦略と考えられます。これまで培った技術は当然含まれていつつも、IBMはデータそのものの提供も視野に入れはじめています。
近年の米ツイッターとの提携や「weather.com」を運営する米Weather Companyの買収は、確実にデータ重視を示す表れといえます。データを保有する企業と組むことでデータを入手し、自社の持つ分析技術を駆使して差別化が図れるデータを提供できるようにと考えています。例えると、これまでジャムの製造機を販売していた企業がイチゴ農園やオレンジ農園を買収し、ジャムの製造機だけではなく、独自のジャムも売ろうとしているということです。
実際に「Open for Data」とはどのような製品やサービスから構成されているのでしょう。大きく分けて、「データを処理する層」と「データの層」があります。
IBMが説明会で示した図によると、データを処理する層ではデータガバナンスの「DataStage on Cloud」や「DataWorks」、オペレーショナルデータ管理の「DB2」や「dashDB TX」、非構造化データ管理・集計を行う「Compose」、高度分析・機械学習を行う「Spark」や「SPSS」、リアルタイム分析やストリーミングを行う「Quarks」を用います。
もう1つ、データの層にはこれまでDB2が処理してきたような、企業活動で生成されたデータだけではなく、ツイッターなどのソーシャルデータやIoTデバイスから得られたデータも想定されています。ソーシャルメディアに投稿される情報は社会の今の動向を把握し、ビジネス競争を勝ち抜くため。IoTなどのデータは各種センサーが取得したデータ、例えば電力メーターや車のセンサーが取得するデータ、位置情報や気象など、日々刻々と生み出されるデータを指します。分析次第で、多くの新しい洞察が得られるとされている領域です。
IBMはこのように、データ処理とデータをうまく連携させてデータ活用環境の全体をとらえて統合を図ろうとしています。特にIBMが重視しているのは、データ活用環境(技術)もデータも「オープン」であることです。
続いて、データ処理の層を深く見ていきましょう。ここはIBMが技術力を発揮する領域です。今のところIBMは、データを「SQLで処理できるもの」と、「そうでないもの(NoSQL)」とで分けています。
前者に使われるのはDB2、dashDB TX、「PureData System for Analytics」などです。DB2は言うまでもなく長い実績を持つRDBMSです。dashDB TXは、クラウドで使われるデータウェアハウス(DWH)「dashDB」にトランザクション処理最適化したもので、「for Transactions」を表す「TX」が追加された製品です。大まかに考えると、DB2がオンプレミス、dashDBがクラウドでの利用を想定しています。PureData System for Analyticsは、ハードウェア一体型のDWHアプライアンスで、FPGA(Field-Programmable Gate Array)を活用した旧Netezzaの技術をベースにした製品です。
SQLの領域が従来まで使われてきた、いわゆる枯れた技術の世界だとしたら、他方のNoSQLの領域は「新たに模索を続けている世界」です。具体的にはCompose、MongoDB、Cloudant、Hadoop、Graphなど、オープンソースソフトウェア(OSS)が多く、(リレーショナルではない)多様なデータフォーマットに対応したものです。
そしてSQLの領域とNoSQLの領域を橋渡しするのが、DataWorksやDataStageです。どちらもデータ連携のためのツールです。DataWorksはNoSQL環境との親和性が高いものとして提供される、比較的新しいサービスです。DataStageはこれまで同社も実績を積んできた、Extract(抽出)/Transform(変換)/Load(ロード)のためのETLツールで、2016年6月10日から新たにクラウド版も提供されました。
しかし、こうして見渡してみると、同社の製品やサービスの多さに目が回りそうです。OSSや買収した製品などが混在しており、目的別に分ければ重複もあります。しかし、IBMはデータ活用環境をトータルで提供することを目指していることから、今後は統廃合が進んでいきそうです。
Copyright © ITmedia, Inc. All Rights Reserved.