マイクロソフト、Azure HDInsightの機能強化を発表:Spark/Rの高速処理、アプリ統合、Data Catalog正式版も
米マイクロソフトはビッグデータ処理・分析を容易にする取り組みの一環として、最新ツールのプレビューや正式リリース、既存ツールの機能強化を発表した。
米マイクロソフトは2016年3月29日(米国時間)、同社が力を入れているビッグデータ処理・分析環境強化の取り組みを公式ブログで発表した。具体的には、「Microsoft Azure HDInsight」(以下、HDInsight)への「R」「Apache Spark」の取り込み、ビッグデータアプリケーションデプロイ環境の強化、セルフサービスBI支援ツールの正式リリースの3つだ。
「R Server for HDInsight」「Apache Spark for Azure HDInsight」最新版プレビュー
HDInsightは、マイクロソフトがAzure上で提供する「Hadoop」サービス。R Server for HDInsightは、HDInsightで作成されたHadoopクラスタや「Spark」クラスタと統合されたオープンソース統計解析言語「R」の実行環境。2016年1月に発表されたR Serverは既にHadoopに対応していたが、HDInsightでも正式に利用できるようになった。
R Server for HDInsightは、一般的なRアルゴリズムや既存のR関数に対しても処理を並列化する機能を持つ。
Apache Spark for Azure HDInsightの最新版は、ほとんどの分析処理で「MapReduce」の7倍のパフォーマンスを発揮するという。ユーザーはR Server for HDInsightやSpark for HDInsightを利用することで、高度な分析や機械学習(ML)モデルを大規模データセットでも高速に実行できるようになるという。
ビッグデータアプリケーションと組み合わせたデプロイが容易に
HDInsightでは、各種アプリケーション統合が発表された。HDInsightの環境上で、特別なコードやスクリプトなしでアプリケーション発見し、デプロイできるという。
HDInsightに統合された有力アプリケーションとしては、データ間の連携やスキーマの定義などの準備なしでデータ分析が可能な「Datameer Cloud」や、Hadoopに対応したクラウドベースのBI環境「AtScale」などがある。
「Azure Data Catalog」が正式リリース
パブリックプレビューが発表されていたAzure Data Catalogの正式版は2016年3月30日にリリースされた。Azure Data Catalogは企業向けのメタデータカタログで、データソースを発見するためのセルフサービスポータルとして利用できる。ユーザーは必要なデータの検索に費やす時間を短縮でき、多様なデータ分析を短時間で行えるという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- GraphXよりも使いやすいグラフデータ処理ライブラリ「GraphFrames」
「Apache Spark」のグラフデータ処理ライブラリ「GraphFrames」がリリースされた。米Databricks、米カリフォルニア大学バークレー校、米マサチューセッツ工科大学がSparkの「DataFrame」をベースに共同で開発したもの。 - Windows AzureのHadoopサービス「HDInsight」が正式版に
米Microsoftは、クラウドベースのHadoopディストリビューション「Windows Azure HDInsight」を正式に提供開始すると発表した。 - 米HPE、Microsoft Azure上で機械学習APIを提供する「Haven OnDemand」発表
米ヒューレット・パッカード・エンタープライズ(HPE)は2016年3月10日(米国時間)、機械学習/ディープ・ラーニングのAPIをサービスとして提供する「HPE Haven OnDemand」を正式提供開始したと発表した。同サービスは全面的にマイクロソフトのMicrosoft Azure上で、全世界的に提供される。また、フリーミアムモデルを採用している。 - Databricksがクラウド版Apache Sparkサービスのβプログラム参加者を募集中
「Apache Spark」の開発を主導する米Databricksが自社のクラウドベースビッグデータプラットフォームの無料版をApache Spark学習者向けに提供する。招待制のβプログラムを近く開始し、2016年第2四半期に正式版をリリースする。