ビジネスアナリティクス、機械学習の進化とSASの新アーキテクチャ:ビジネスアナリティクス、ビッグデータの文脈(1)
統計解析、予測分析でリーダー的存在の米SASが、同社製品群の大部分を新アーキテクチャに移行すると、2016年4月に発表した。これを、ビジネスアナリティクスの世界全般における動向との関連で探る。
米SASは2016年4月中旬、マイクロサービスを特徴とするアーキテクチャ「SAS Viya」を発表し、自社製品を段階的に移行していくことを発表した。これは同社にとって大きな変革を意味する。また、金融機関、製薬会社から公的機関まで、同社製品のユーザーに与える影響は少なくないと考えられる。本記事では、これをビジネスアナリティクス、機械学習の世界における動きとの関連で紹介する。
「ビッグデータディスカバリ」への進化
IT調査会社ガートナーは、ビジネスアナリティクスが「ビッグデータディスカバリ」へと進化していくと説明している。
過去数年のビジネスアナリティクスにおける大きな波は、同社のいう「データディスカバリ」の進化だ(@ITでは、分かりやすさのために、これを「セルフサービスBI」という用語で表現してきた)。いわゆるデータサイエンティストや情報システム部門のデータレポート担当者に完全依存するのではなく、自ら能動的にデータから知見を得たいというビジネス部門のニーズが高まり、これに応えるためのツールが多数登場している。そしてQlik Technologies、Tableau Softwareといった一部のセルフサービスBIツールベンダーは、実行能力、ビジョンともに高く評価されている。
だが、ガートナーは「ビッグデータディスカバリ」という次の波が押し寄せようとしているという。ビッグデータディスカバリでは、いわゆるビッグデータへの対応が不可欠となる。効果的な分析を支援するような、適切なデータの加工ができることが必須となる。
また、統計解析、予測分析などのデータサイエンス的な取り組みがさらに活発化していく。データサイエンスに関しては、これを活用する層が広がるのが、「ビッグデータディスカバリ」時代の特徴だという。職業として分析を行うデータサイエンティストに加え、ビジネス部門などにおける一部の人々が「市民データサイエンティスト」と呼ばれる役割を担うようになる。データサイエンス系製品は、この利用層の広がりに対応していく必要があるという。
データエンジンとアーキテクチャはどう変わるか
データサイエンス系製品のリーダー的存在であるSASが4月中旬に発表した新アーキテクチャ「SAS Viya」は、同社が、ガートナーのいう「ビッグデータディスカバリ」時代への対応を進める取り組みだと表現できる。
SAS Viyaではまず、アナリティクスエンジンを一新し、「ビッグデータ対応」を強化する。
SASはこれまで、同社のインメモリデータエンジンをHadoopと連携させることで、ビッグデータを扱ってきた。同社のインメモリデータエンジンは物理メモリ搭載量を超えるデータを処理できないため、Hadoop側で適切なデータ加工を加えた後に、これをインメモリエンジンに読み込む形になっている。
SAS Viyaでは、インメモリエンジンとHDFSとの間で、データのステージング(オンデマンドでの読み込み)が実現し、物理メモリ搭載量を超えるデータを扱えるようになる。従来よりもはるかに大量のデータを対象とした分析が行えるようになり、SAS側でデータ加工を含む全プロセスを担うケースが増えてくるという。
次に、広義の「クラウド対応」がある。SAS Viyaでは、SASのアナリティクス製品群の多くを、Cloud Foundry上で動くマイクロサービスアーキテクチャへ、段階的に移行する。さらに新製品を同アーキテクチャ上で提供していく。
これによって迅速な導入、柔軟なスケーリング、従量課金的なサブスクリプション料金体系の導入、小規模利用の促進、製品間の連携のしやすさ、ソフトウェアアップデートのしやすさ、ユーザーインターフェースの統一などを図るとしている。
SASのアナリティクス製品は、製品によってWindowsアプリケーション、Javaアプリケーションなど、異なるプラットフォームで提供されてきた。これをPaaS上のアプリケーションコンポーネントに統一する。これで、複数の製品をニーズに応じて従来よりも柔軟に組み合わせられるようになり、製品ごとに個別のクライアントソフトウェアあるいはユーザーインターフェースを使い分けるのではなく、HTML5ベースの共通インターフェースを活用できるようになる。
SASがさらに強調するのは、SAS Viyaによって、同社の製品群が、PaaSの動くところであればどこであっても使えるようになるという点だ。オンプレミス、特定のクラウドサービスに縛られることなく、ニーズに応じて稼働場所を選択し、さらに複数の稼働場所を組み合わせることができる。
高度な分析機能の活用法が広がることへの対応
今後、ガートナーのいう「市民データサイエンティスト」が増えるとともに、高度な分析機能をアプリケーションに組み込む動きが活発化することが考えられる。SAS ViyaにおけるSAS言語以外のサポートおよびAPI連携機能の強化は、これに対応する動きだと考えられる。
SAS Viyaでは、Python、Lua、JavaによるSASの分析機能の操作ができるようになる。その他の言語への対応も検討しているという。SAS製品の分析機能を活用したいが、SAS言語を扱うスキルを持った人が少ないといったケースに対応し、積極的に利用層を広げることを考えているようだ。
新アーキテクチャでは、製品群を通じて、REST APIによるアクセスにも対応する。これにより、他のアプリケーションとの連携を促進する。
SASはさらに、同社としてパブリックAPIサービスを提供する予定だ。このサービスはマーケットプレイス的な機能を備え、SASの分析機能を活用する各種のアプリケーションが同社およびサードパーティから提供されることになる。
上記の取り組み全てを通じて、SAS製品とは縁遠いと考えてきた人々や組織にリーチし、さらに活用法を広げることを、SASは目指しているようだ。
クラウドの機械学習サービスと比べてどうなのか
最近、パブリッククラウドにおける機械学習サービスが増え、注目を集めている。SASのアナリティクス製品の用途は機械学習だけではないものの、あえて、これらのサービスとSAS Viyaにおける機械学習機能はどう比較できるのかを、米SASのクラウドおよびプラットフォーム技術担当主席プロダクトマネージャー、Robby Powell(ロビー・パウエル)氏に聞いてみた。
SASは以前より、機械学習では、解析手法の選択肢を豊富に提供し、予測モデルを構築してそのなかから最適なものを適用するというプロセスを、高い精度の実現という目的に基づいて自動化することが重要だと主張している。一般的なクラウドの機械学習サービスは使いやすいものの、利用できる解析手法が限られ、最適なモデルを選択する機能が弱いことから、高い精度を期待できないとしている。
その上で、Powell氏は次のように答えた。
「パブリッククラウドの機械学習サービスは、そのクラウド上でしか動かない。SAS Viyaでは、アプリケーションをどこでも走らせることができる。また、SAS Viyaでは機械学習に限定されることもなく、アナリティクスのライフサイクル全体をカバーできる。 データの統合・クリーニング・活用、リポートの作成と利用、モデルの構築・適用、データのスコアリング、モデルの管理、チャンピオンモデルの選択、といった一連のプロセスを、反復的に実行できる。ここに大きな違いがある」
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- セルフサービスBIの次に来る波、「ビッグデータディスカバリ」とは
TableauなどのセルフサービスBIツールが、BI 市場を席巻しているように見える。だが、IT調査会社のガートナーは、BIの世界が次の段階に進みつつあると指摘する。では、どう進展していくのか。