企業価値向上につながるインサイトをIT技術者はどう提供していけるか:「インサイトエコノミーの時代」そこにデータを資産とする思想はあるか?
クラウドインフラの活用や企業活動データの蓄積が当たり前となったいま、データをどう使い、どう生かすかが問われる時代になった。企業価値向上につながるインサイト(洞察)を提供するプラットフォームは、データに対する思想抜きに選択することはできない。
企業の重要資産である「データ」をどのように集め、どう使っていけるかが、将来の企業価値を左右する――ビッグデータがトレンドになった時代から語られてきたことだが、リアリティのあるソリューションが出現してきたいま、情報システム部門のアクションやデータガバナンスへの姿勢が具体的に問われるようになってきた。企業価値向上につながるインサイト(洞察)を、IT技術者はどう提供していけるだろうか。
本稿では、IBMアナリティクス・プラットフォーム事業部 理事 事業部長 望月敬介氏と、データベースやデータ活用に詳しいITジャーナリスト 谷川耕一氏の対談から、「インサイトエコノミー時代」のデータ活用の存り方を探る。
企業価値を高めるために必要なのは「インサイトエコノミー」への意識
谷川氏(以下、敬称略) クラウドやビッグデータへの理解が広がる中、企業のデータ活用への取り組みが変わりつつあります。IBMは、「IBM Watson」や「Twitter社などとの提携」をはじめ、アナリティクスの分野でリーダーと見なされることも多いと思いますが、実際に、顧客と接していてその辺りの反応はどうですか。
望月氏(以下、敬称略) この数年で大きく変わったという印象です。経営トップの方の多くが、ビッグデータから得られるインサイト(洞察)が経営に大きなインパクトを与えることを理解されるようになりました。それを象徴するのが「インサイトエコノミー(Insight Economy)」という言葉でしょう。ビッグデータから得られる知見やノウハウ、洞察が貨幣と同じ価値を持つようになり、それが企業の活動を支えるという考え方が広く支持されるようになりました。
質の良いインサイトを早く見つけることが企業競争力の源泉
谷川 2011年ごろ、企業ITシステムではデータをどうためるかに関心が集まっていました。しかし今では、ビッグデータの取り組みが当たり前になってきたことから、むしろ「いかにインサイトを見つけて、それをビジネスの現場で活用できるか」に関心が移ってきた印象です。
望月 ある調査によると、「データから質の良いインサイトを得ることができれば、分析システムへの1ドルの投資から13ドルのビジネス価値を得ることができる*」そうです。先進的な企業ほど、いち早くインサイトを見つけ、いち早く実行できるようにすることが企業競争力につながると理解しています。
*"Analytics Pays Back $13.01 for Every Dollar Spent", research note, Nucleus Research, September 2014.
谷川 「素早くインサイトを見つけること」につながりますが、システムの開発や改修のスピードはずいぶんと速くなってきました。以前のように、「1年かけて分析システムを作り、それを我慢して3年間使う」という時代ではなくなってきた印象です。
望月 分析を業務に活用する企業ほど、ユーザーの分析スキルは高くなります。そして「速く柔軟に分析したい」というニーズがより高まっていきます。一方で、そうした分析ニーズにITが追い付いていないのが現状です。
素早い分析でインサイトを得るプロセスにITが追い付いていない理由
谷川 課題はどこにあるのでしょうか。
望月 まず、システムの拡張が容易ではないという点があるでしょう。既存のデータウエアハウス(DWH)やBI(ビジネスインテリジェンス)ツールだけでは増え続ける一方のビッグデータに対応することは難しい。そこで、NoSQLデータベースや新しいBIツールなどを整備するわけですが、この場合、既存システムとは異なるシステムとして構築することになります。現在のシステムを維持しながら、新しい投資を始めなければなりません。
他にも「最適なパフォーマンスをどう維持するか」「IoT(Internet of Things)のようにリアルタイム性が強く求められる分析にどう対応するか」「既存システムと新システムをどう連携するか」といった課題もあります。
谷川 「速く柔軟に分析したい」というニーズに対して、IBMではどう対応しているのでしょうか?
望月 まず、IBMではデータを価値に結び付けるためには「SoR(Systems of Record)」「SoE(Systems of Engagement)」*だけでなく「SoI(Systems of Insight)」――洞察するためのシステムが重要だと考えています。
インサイトを価値につなげるために、IBMでは「データ収集」―「整形」―「分析」―「判断」―「アクション」の全てのプロセスを支援するプラットフォームを提供しています。クラウド/オンプレミスを問わず、いずれにもフルラインアップの製品をそろえており、かつ両者はハイブリッドクラウドとして統合されています。システムがクラウドであれ、オンプレミスであれ、標準かつオープンを指向しており、利用者に使いやすいポートフォリオを整えていることがIBMの強みです。
* SoR(System of Record)、SoE(System of Engagement)については、ジェフリー・ムーア(Geoffrey Moore)著『Systems of Engagement and the Future of Enterprise IT: A Sea Change in Enterprise IT』(2011、AIIM White Paper)を参照。
「Cloudant」でオンプレミス側のカウンタープロダクトを提供した意図
谷川 アナリティクスプラットフォームについてもう少し詳しく教えていただけますか。IBMはデータ分析の製品として、DWHアプライアンス製品「PureData System for Analytics(旧Netezza)」、データベース製品「DB2」、Hadoop/Spark製品「BigInsights」、BI製品「Cognos」「SPSS」などを展開していました。また、クラウドについてはIaaS(Infrastructure as a Service)では「SoftLayer」、PaaS(Platform as a Service)では「Bluemix」があります。そして、新たにDBaaS(Database as a Service)として「Cloudant」「dashDB」を発表しました。これらは、SoIを形作るポートフォリオの中でどう位置付けられるのでしょう?
望月 これらの製品は全てインサイトエコノミーを支えるプラットフォームとして位置付けており、リアルタイム分析、構造化/非構造化データ管理、DWH、データガバナンス、BI/レポーティング、予測分析などの分野にそれぞれマッピングしています。つまり、インサイトを企業価値につなげるための「データ収集」―「整形」―「分析」―「判断」―「アクション」というプロセス全てに対応するマッピングです。さらに、ポートフォリオの中で、同じ製品をオンプレミス/クラウドの両方で提供できることが大きな特長です。
ビッグデータを活用するには「どのようなデータを扱うことができるか」も重要です。ですから、オンプレミスではもちろん、クラウドで提供するデータサービスについても、あらゆるデータタイプ、処理形態をサボートできるようにしています。例えば、Cloudantは非構造化データを対象にしたトランザクションに対応しますし、dashDBは構造化データを対象にした分析で利用できるDBaaSです。
谷川 Cloudantについて面白いと思ったのは、「Cloudant Local(IBM Cloudant Data Layer Local Edition)」を発表したことです。もともとクラウドサービスであったCloudantにおいて、オンプレミスで稼働するエディションをあえてリリースしました。エンタープライズシステムが扱うデータは全てクラウドにあればいいというわけではなく、要件によってはオンプレミスにも必要。さらに、両者は柔軟な交通ができなくてはならない――それを製品体系の中で自ら示して見せ、IBMが目指すシステムを体現する象徴的な発表だったと考えています。
望月 「クラウドにデータを出せない」というお客さまだけでなく、「クラウドに持っていけない製品は検討すらするな」というお客さまもいらっしゃいます。われわれは、そうしたお客さまでも安心できる環境を提供しなければなりません。クラウドとオンプレミスの両方で、インサイトエコノミーのために必要なプロセスをサポートする機能を提供できることは、IBMの大きな優位点となっています。
エンタープライズSLAも併せて購入できる完全なるマネージドサービスが持つ「速度」
谷川 IBMが提供するSoIのポートフォリオは、オープンソースソフトウエア(OSS)や標準技術への対応などに見られるように、オープン性が高く、ロックインされにくい点も特長の一つだと考えます。Cloudantについて見ても、高い可用性を持つOSSのNoSQLデータベース「CouchDB」をベースにしており、Web標準にのっとってJSON形式のデータをHTTP/RESTを介して提供しています*。OSSであれば、OSSとIaaSの組み合わせでの利用も考えられますが、それらとIBMが提供することの違い・優位性はどこにあるのでしょうか?
* Cloudantの詳細は、「NoSQLデータベースの選択が成否を分ける、目的別NoSQL検討ポイント」(TechTergetジャパン)を参照。
望月 クラウドで提供するサービスについて言えば「完全なマネージドクラウドサービス」として、パフォーマンスとアップタイムをわれわれが保証している点が全く異なります。ハードウエアのサイジングや物理設計、ソフトウエアのチューニング作業や管理、バックアップ作業も不要です。データサービスの拠点が日本を含めた世界中に存在し、離れた地域でデータを同期したり、クラタスを構成したりできます。ユーザーはNoSQLというテクノロジの導入だけでなく、エンタープライズで通用するSLA(サービス品質保証制度)も併せて「サービスとして購入」でき、すぐさま実践に取り掛かれるわけです。
機能面での特長としては、モバイルデバイスからの使いやすさや、ネットワークに接続できない場合にローカルストレージを利用する機能、地理情報(GISデータ)へのアクセスAPIの提供なども特長です。データ分析関数だけでなく、GISデータが簡単に扱えるため、物流や営業支援などの新たなアプリケーション開発も容易でしょう。加えて、dashDBと連携できることも大きなポイントです。
2つのデータベース技術を昇華した分析基盤「dashDB」
谷川 そのもう一つのサービスdashDBでは、インメモリのカラムナーデータベースと、インDBのアナリティクスツールで構成されていますね*。
* dashDBの詳細は「ビッグデータ活用基盤をクラウドでData Warehouse-as-a-Serviceとは」(TechTargetジャパン)を参照。
望月 インメモリカラムナーの部分はDB2 V10.5で発表したカラムデータ分析処理を高速化するための「DB2 BLUアクセラレーション」の技術を、インDBアナリティクスの部分は「Netezza(現・PureData System for Analytics)」に実装される高度な分析技術を応用しています。
谷川 DB2、NetezzaというIBMがもともと持っていた技術を拡張させたという点では、あるべき発展の姿であろうかと思います。
望月 その通りです。IBMでなければ実装できないデータベース高速化・最適化の技術が盛り込まれています。
dashDBもCloudantと同様に完全なフルマネージドサービスとして提供されています。データをロードすればチューニング作業などを実施することなく、すぐに分析を開始できる「ロード&ゴー」を実現しています。
機能的には、各種BIツール、表計算ソフト、R言語、地図アプリケーション、Netezzaに由来する分析関数などに対応していて、業務データの単純な分析から、リポート作成の業務効率化、高度な分析、分析ロジックの検証などを行うことができます。
最大の特長は、Cloudantとシームレスに連携して、クラウド上で収集したデータをそのまま透過的に分析できること。NoSQLのJSONデータをRDBのスキーマに自動変換して取り込み、継続的に同期することもできます。これにより、データのフォーマットを選ばず、データの存在場所を選ばずに、高度な分析ができるようになるのです。クラウドとオンプレミスの両方に製品を展開しているCloudantと、ハイブリッドクラウドDWHとして姉妹関係にあるdashDB/PureData System for Analyticsが「どこでも動く分析用DBエンジン」として理解されれば、利用価値が出てくると思います。
データをためる。そこから先は?インサイトを得るために成すべきこと
谷川 「データをためる」という点では、多くの企業で「なんとかなっていた」といえるでしょう。しかし、ためたはいいものの「どう使うか」については、はっきりと分かっていないケースが少なくないようです。つい2〜3年前までは「漠然とデータをためるためにお金を使うばかりになっていた」という企業は多いと思います。
望月 実際、ある製造業のお客さまで、工場の製造ラインなどから得られるセンサーデータをためっぱなしにしており、これからそれをどう分析しようかと検討している事例があります。本来であれば、それらのデータを基にPDCA(Plan-Do-Check-Action)サイクルを回して改善につなげたり、新しいインサイトを得られたりするはずです。
谷川 データをためられるようになると、次には「データを分析基盤に上げるか、それとも捨てるか」という、手前の処理が重要になってきますよね。
望月 「ためたビッグデータを分析するのであれば、NoSQLでデータアクセスすれば良い」と考えがちなところですが、実際には同じセンサーデータでも、メーカーによって出力されるデータの粒度(時間軸や数量単位)や形式が異なります。これらをただ集めても、データ操作の工数や分析項目数が多くなるだけで、データ分析によってどのくらいのROI(投資対効果)が出るのかが分からなくなりがちです。
このようなケースでも「取りあえずクラウドに入れて特定のデータに限って分析してみる」というトライができます。分析の結果を見て、アタリを付けながら、だんだんと分析の規模を大きくしていき、効果を見ながら、最終的に質の高い予測分析につなげていくという使い方です。
どのように使って良いか分からないデータであればあるほど、事前の投資を少なくしなければなりませんから、クラウドの選択肢を持つことは重要です。データ分析では、トライしながら精度を高めるプロセスが必要で、これによってその企業ならではの質の高いインサイトにつなげていくことができます。
むしろ、このような手続きを経なければ、いかにデータを集めようとも、インサイトエコノミーにはつながっていきません。お金ばかりがかかって、エコノミーがまわっていかない――利益につながる活動に結び付きにくい。CloudantとdashDBの組み合わせであれば、「試す」「精度を高める」という、インサイトを獲得する課程で必要なプロセスをサービスとして少ない投資*で利用できます。「どう使って良いか分からない」という状況から一歩踏み出し、「何がどう使えそうか」の手応えを得るためのハードルは下がると考えています。
* ビッグデータ活用基盤運用時の選択肢をTCOで比較した資料には、「DBaaSと自社構築型DBMS、3年間の運用でTCOにどれだけ差が出る?」(TechTargetジャパン)がある。
データを守り・つなぐ「DataWorks」によるデータガバナンスと既存データへの視点
谷川 「インサイトエコノミー」という視点でいうと、既存のデータと新たに獲得したセンサーデータなどから得られる知見を突き合わせていくことも必要になろうかと思います。
望月 CloudantとdashDBの組み合わせのみでも、クラウドデータサービス環境を素早く利用することができるようになりますが、分析の対象となるデータは多様であればあるほど、結果の精度が高まります。つまり、既存のデータについても効率的に連携していくことが重要です。その中心となるのが「DataWorks」というサービスです。多様な種類のデータに対して、適切なクレンジングやマッチングなどを行うサービスです。
谷川 既存のデータを連携する、といっても多様な手法があります。既存のデータ連携ツールと違いはありますか?
望月 例えば、個人情報や機密情報、その他法的に制約がある情報が含まれるデータの場合、そのままクラウドに持って行くべきではないものがあります。DataWorksでは、単なる連携だけでなく、連携する際に事前にカラム単位でデータをマスクするといった操作がGUIで直感的に行えます。「クラウドにデータを上げられない」あるいは「分析する際には秘匿したいデータがある」という制約がある場合でも、安全なフォーマットに変更し、クラウド分析基盤で利用する情報のみをうまく使えるようになります。これによりユーザーの利便性は大きく向上するはずです。
DataWorksには、IBMデータベース製品、他社データベース製品、他社クラウドサービスを問わず、広くデータを収集して、フォーマットを変換して連携する機能があります。当社の事例でも、「他社のクラウドサービスを利用し始めたものの、データ連携についてはスクラッチで開発する必要があることが分かった結果、IBMに乗り換えた」というお客さまが出てきています。
情報システムを担う技術者が、企業価値向上のために実践できる施策とは?
谷川 多様なデータを扱う場合は、データのガバナンスをどうするかが大きな課題ですね。データを効率よくためておく仕組みについて言えば、いくつかのベンダーは「データレイク(Data Lake)」という概念を示しています。これらに対してIBMの考えはどのようでしょうか?
望月 IBMではこれをガバナンスの視点から「データリザヴァー(Data Reservoir)」と呼んでいます。というのも、IBMでは、データを単にためればいいものとは考えていません。
何でも生データを放り込んでいては、いずれ"データの湖"の湖水はよどんでしまうでしょう。エンタープライズでのデータ活用では、「分析にとって有用なかたちにしてデータをためる」というデータガバナンスをきっちり効かせることが重要であり、そのために「品質の良いデータをカタログ化して管理する貯水池が必要」というのがIBMの考えです。DataWorksは、この考えを実現するための、重要なクラウドデータサービスです。
谷川 「カタログ化して管理する」とはどういうことでしょうか?
望月 CloudantもdashDBも既存の多様な環境と容易に連携できます。IBM製品はもちろん、他社のデータ分析環境とも密に連携が可能です。
しかし、いくら分析環境が整っていても、例えば、名寄せされていないデータに基づいて分析すると、本来上位にランクされるべきデータが分散し、下位のランクに沈んでしまうといった間違いが生じることがあります。こうした誤ったデータに基づいて分析を実施しても、誤ったインサイトが得られるだけです。誤ったインサイトに基づいて誤った行動を取るのでは何の意味もありません。
このようなデータ分散の不幸がないよう、データを適切に配置し、データを利用する側が迅速に操作できるようにする道具が必要です。DataWorksはそれらを適切に統合し、あたかもショッピングサイトで必要な商品を購入し組み合わせて使うように、データとデータを組み合わせていきます。
ですから、まずは「データをためる」から「データを適切に獲得する」「質の良いデータからインサイトを得る」という考えへの変換が必要なのです。セルフサービスBIなどのトレンドもありますが、それらを成功させるにはデータガバナンスの視点が不可欠です。そしてデータガバナンスを効かせた適切なデータを提供することこそが、情報システムを担う技術者が、企業価値向上のために実践できる施策だといえるでしょう。
「ビジネスの結果を出すインサイト」を獲得するプラットフォームは用意できた
谷川 冒頭の話に戻りますが、分析によるインサイトを価値につなげるという動きは新しい段階に入ったと思います。データをためるという観点からHadoopやNoSQLなどのテクノロジに注目が集まった時期を過ぎ、ためたデータからどうインサイトを得て、それを価値につなげるかという段階に入っています。
そんな中、IBMは、クラウドかオンプレミスか、構造化データか非構造化データかを問わず、データの収集からアクションまでを一貫してサポートするプラットフォームを提供している。なかでも、Cloudant、dashDB、DataWorksという三つのデータサービスは、「分析から価値を得たい」と望むユーザーに大きな力を与えてくれるものといえそうです。
望月 実際、弊社のクラウドデータサービスのビジネスは対前年比で非常に大きな伸びを示しています。予算や既存システムの制約にとらわれずに、分析のパワーを全ての人が活用する上で、IBMのクラウドデータサービスは最高の環境を提供するものだと自負しています。製品提供だけでなく、「ビジネスの結果」を出すところまで支援すべく、製品とサービスの拡張に努めていきます。
本稿では、「インサイトエコノミー時代」のデータ活用のあるべき姿を探ってきた。
本稿で取材した日本IBMが考える「インサイトエコノミー時代」のデータ活用では、インサイト獲得の全てのプロセスで「“データガバナンス”の視点に立ち、企業が蓄積するデータを“価値”に結び付ける」という共通の思想の下で展開されていることが理解できた。インサイトエコノミーを指向し、データ資源価値を高める際には、こうしたデータに対する思想の親和性も選択肢を考える上では重要な要素となるだろう。
おすすめホワイトペーパー
ビッグデータ活用基盤をクラウドで 「Data Warehouse-as-a-Service」とは?
IoT(モノのインターネット)の時代を迎え、企業が保有する膨大なデータの分析、活用基盤の整備が急務だ。データウェアハウス構築、運用にかかる課題を解決する、「Data Warehouse-as-a-Service」の導入優位性を紹介しよう。
TCO徹底比較:DBaaSと自社構築型DBMS、3年間の運用でTCOにどれだけ差が出る?
クラウド型データベースサービス(DBaaS)「IBM Cloudant」と自社構築型のドキュメント指向データベース「MongoDB」の総保有コスト(TCO)を徹底比較。3年間の運用でそのコスト差はどれだけ出るだろうか?
適切なNoSQLデータベースの選択が成否を分ける、目的別NoSQL検討ポイント
Webやモバイル、IoTなど、新たなアプリやシステムが膨大な種類のデータを生み出している。そこで再び注目されるのが「NoSQL」だ。「柔軟性」「拡張性」「可用性」など、自社のビジネスニーズに対応したNoSQLの導入ポイントを解説する。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:日本アイ・ビー・エム株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2015年10月27日