データ分析基盤をApache Sparkベースに置き換え、BluemixではSparkサービスも――米IBM:IBM Insight 2015
米IBMは、年次イベント「IBM Insight 2015」で、データアナリティクスに関する複数の発表を行った。ビッグデータ分析基盤はApache Sparkベースになり、PaaS「Bluemix」上でもApache Sparkサービスを提供する。CognosはセルフサービスBIを念頭にUXシナリオを再設計している。
米IBMは2015年10月26日、米国で開催中の年次イベント「IBM Insight 2015」で、データアナリティクス製品/サービスに関する複数の発表を行った。
まず、複数の既存データ分析基盤製品を「Apache Spark」をベースに再設計することを明らかにした。また新たに、データキャプチャーソリューション「IBM Datacap Insight Edition」や多様なデータソースを分析する「IBM Insight Cloud Services」を発表。さらに、BI(Business Intelligence)ソリューション「IBM Cognos Analytics」ではセルフサービスBIのトレンドを意識したUX(ユーザーエクスペリエンス)シナリオの再設計を行っているという。
既存のデータ分析基盤をApache Sparkベースに変更、新たにSparkサービスも発表
まず「IBM BigInsights」や「IBM Streams」「IBM SPSS」などのデータ分析基盤は、全てApache Sparkベースに置き換えて再設計することが発表された。これにより「既存データ分析ソフトウエアおよびPaaSで提供するサービス群の実装を簡素化する」としている。
さらに同社は、「IBM Bluemix」上で「Spark as a Service(IBM Analytics on Apache Spark)」を提供することも発表している。
IBMでは2015年6月にApache Sparkプロジェクトへの積極的な投資を表明しており、今回のApache Sparkに関わる発表のいくつかは既に予告されていたものだ。
データを自動分類する「Datacap Insight Edition」を発表
Datacap Insight Editionには、画像処理、自然言語処理、機械学習などによる、いわゆるコグニティブコンピューティング機能が組み込まれている。あらゆる文書や画像などを自動認識して分類できるという。
例えば、医療の分野であれば、診察カルテに含まれる画像情報や、手書きのメモなど、従来であれば意味情報を持たない画像ファイルなどとして扱われていたデータを、人間の代わりに認識して(内容を把握して)分類できる。
さらに、コンテンツを分析することで、キャプチャー時点においてどのコンテンツにアナリティクスを適用すべきかを特定する他、将来的なコンテンツの再利用や分類処理の迅速化を目的に、常に新しい文書タイプについて継続的に学習するようになっている。
この仕組みに、各組織でビジネスルールを適用することで「文書に対してどのようなアクションが必要であるか」を判断できるという。例えば、特定の文書を基幹業務システムに渡すべきか、それとも追加アクションを処理するためのユースケースとワークフローを開始すべきかを自動的に判定できるという。
多様なデータソースからノイズを排除して分析するInsight Cloud Servicesを発表
Insight Cloud Servicesは、データ活用の最大化に向けた取り組みといえる。オープンデータや気象情報、組織が保有するデータに加え、ソーシャルサービスなどから得られるリアルタイムで個人が発信する非構造化データを組み合わせた上で、自動的にノイズを取り除いて提供するサービスを提供する。
ソーシャルデータではツイッターと、気象情報はThe Weather Companyと提携して、データソースの一つとして利用できるようになっている。この他にも、現段階で150以上のオープンデータなどのデータソースへのアクセスが可能で、今後もデータソースは随時拡張する予定だという。サービスを利用する際のAPI呼び出しは、1日当たり150億件超に対応する。
既存のCognos AnalyticsはセルフサービスBI向けにUXのシナリオから再設計
Cognos Analyticsでは、ビジネスユーザーやIT担当者がリポートを作成して配信できるようUXシナリオを再設計しているという。新しいCognos Analyticsでは、「セルフサービスダッシュボード」から、各部門の利用者が自身でリポートを作成できるようになっているという。例えば、毎月の財務リポートや、週ごとのセールスパイプラインの傾向、日々の生産歩留まり、時間単位の在庫といった情報に、ユーザー自身が自由にアクセスして分析できるようになっているという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- いまさら聞けないDeep Learning超入門(1):ニューラルネットワーク、Deep Learning、Convolutional neural netの基礎知識と活用例、主なDeep Learningフレームワーク6選
最近注目を浴びることが多くなった「Deep Learning」と、それを用いた画像に関する施策周りの実装・事例について、リクルートグループにおける実際の開発経験を基に解説していく連載。初回は、ニューラルネットワーク、Deep Learning、Convolutional neural netの基礎知識と活用例、主なDeep Learningフレームワーク6選を紹介する。 - 料金は1VM1時間1セント(あるいはそれ以下):米グーグルがHadoop/Spark運用サービス「Cloud Dataproc」のベータ提供を開始
米グーグルは2015年9月23日(米国時間)、同社のクラウドサービス「Google Clooud Platform」で、Hadoop/Sparkクラスタ運用サービス、「Cloud Dataproc」のベータ提供を開始した。平均90秒というクラスタの迅速な展開と、1仮想インスタンス当たり1セント(あるいはそれ以下)という低料金が特徴。 - 米ヴイエムウェア プラットフォーム責任者が語る:Docker、OpenStack、DevOps、オープンソースと「VMware」のこれから
米ヴイエムウェアは、コンテナー関連の取り組みを強めている。一方で、OpenStackやHadoop関連の動きも活発化させている。これらは単なる防御的な動きなのか。同社のクラウドインフラ担当上席副社長であるラグー・ラグラム氏に単独インタビューした。 - Database Watch(2015年7月版):Apache Sparkに注力するIBM、目指すは「データ分析のOS」
北米トヨタ販売子会社での採用事例の発表などもあり、日本国内でも注目を集めつつある「Apache Spark」。具体的にはどんな特徴があって、何ができるのだろうか。Sparkへの大規模投資を発表したIBM(日本IBM)を取材した。 - モバイルアプリ開発SDKも:米IBM、約50のコードをオープンソース化するdeveloperWorks Openを開設
米IBMは2015年7月22日(米国時間)、Webサイト「developerWorks Open」を開設したと発表した。このWebサイト上で、IBMは今後約50種の自社開発ツールおよびアプリケーションを、オープンソースとして公開していくという。 - Hadoopの3倍以上の計算速度:ノーチラス、さくらインターネット向けにSparkベースの原価計算システムを導入
ノーチラス・テクノロジーズは7月8日、さくらインターネット向けに、自社フレームワークで開発した原価計算システムを導入したと発表した。分散処理基盤にApache Sparkを採用することで、ほぼリアルタイムでの原価の把握を可能にしたという。