マイクロソフト、Azure HDInsightの機能強化を発表Spark/Rの高速処理、アプリ統合、Data Catalog正式版も

米マイクロソフトはビッグデータ処理・分析を容易にする取り組みの一環として、最新ツールのプレビューや正式リリース、既存ツールの機能強化を発表した。

» 2016年04月01日 11時00分 公開
[@IT]

 米マイクロソフトは2016年3月29日(米国時間)、同社が力を入れているビッグデータ処理・分析環境強化の取り組みを公式ブログで発表した。具体的には、「Microsoft Azure HDInsight」(以下、HDInsight)への「R」「Apache Spark」の取り込み、ビッグデータアプリケーションデプロイ環境の強化、セルフサービスBI支援ツールの正式リリースの3つだ。

公式ブログ

「R Server for HDInsight」「Apache Spark for Azure HDInsight」最新版プレビュー

 HDInsightは、マイクロソフトがAzure上で提供する「Hadoop」サービス。R Server for HDInsightは、HDInsightで作成されたHadoopクラスタや「Spark」クラスタと統合されたオープンソース統計解析言語「R」の実行環境。2016年1月に発表されたR Serverは既にHadoopに対応していたが、HDInsightでも正式に利用できるようになった。

 R Server for HDInsightは、一般的なRアルゴリズムや既存のR関数に対しても処理を並列化する機能を持つ。

 Apache Spark for Azure HDInsightの最新版は、ほとんどの分析処理で「MapReduce」の7倍のパフォーマンスを発揮するという。ユーザーはR Server for HDInsightやSpark for HDInsightを利用することで、高度な分析や機械学習(ML)モデルを大規模データセットでも高速に実行できるようになるという。

ビッグデータアプリケーションと組み合わせたデプロイが容易に

 HDInsightでは、各種アプリケーション統合が発表された。HDInsightの環境上で、特別なコードやスクリプトなしでアプリケーション発見し、デプロイできるという。

 HDInsightに統合された有力アプリケーションとしては、データ間の連携やスキーマの定義などの準備なしでデータ分析が可能な「Datameer Cloud」や、Hadoopに対応したクラウドベースのBI環境「AtScale」などがある。

「Azure Data Catalog」が正式リリース

 パブリックプレビューが発表されていたAzure Data Catalogの正式版は2016年3月30日にリリースされた。Azure Data Catalogは企業向けのメタデータカタログで、データソースを発見するためのセルフサービスポータルとして利用できる。ユーザーは必要なデータの検索に費やす時間を短縮でき、多様なデータ分析を短時間で行えるという。

Azure Data Catalogの操作イメージ 検索機能などの他、Excelとも統合されている(出典:米マイクロソフト)

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。