ニュース
Azure Cosmos DB用の「Sparkコネクター」が刷新 マルチモデルに対応:SparkからCosmos DB内の全データモデルを直接操作可能に
Microsoftは、Azure上で稼働する分散NoSQLデータベース「Azure Cosmos DB」用の「Spark」コネクターが真のマルチモデルになったと告知。SparkからCosmos DBの全てのデータモデルを操作できるようになる。
Microsoftは2017年6月7日(米国時間)、Microsoft Azure(以下、Azure)上で稼働する大規模分析向けの分散NoSQLデータベース「Azure Cosmos DB(以下、Cosmos DB)」用の「Apache Spark(以下、Spark)コネクター」をアップデートし、真のマルチモデルになったと告知。GitHubで公開した。
Sparkはオープンソースのビッグデータ処理基盤の1つ。アップデートされたSparkコネクターにより、SparkからCosmos DBに格納される全てのデータモデル(ドキュメント、テーブル、グラフ)を操作できるようになった。グローバル規模で分散されたCosmos DB内のデータを直接操作し、リアルタイムでのデータサイエンス、機械学習、高度なアナリティクスなどに活用できる。Microsoftはこれによって、顧客要望の変化が早い「データサイエンスの課題を迅速に解決する力を高められる」としている。
Cosmos DBとSparkとの組み合わせで有効とされるユースケースは以下の通り。
- データのETL(Extract/Transform/Load:抽出、変換、ロード)処理をストリーミングで実行
- データのリッチ化
- トリガーイベントの検出
- 複雑なセッション分析やパーソナライズ
- ビジュアルデータ探索や対話型アナリティクス
- モバイル環境でのデータ探索、情報共有、コラボレーション
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Sparkは“誰”に例えられる?──多様化と進化を続ける「Hadoop」、人気急上昇「Spark」
先日、日本Hadoopユーザー会主催のイベントが開催されました。データベースと関係性が深いデータ分散処理プラットフォームである「Hadoop」と「Spark」の最近事情に迫ります。 - 分散NoSQLデータベース「Cosmos DB」など マイクロソフト、Build 2017で開発者向け新機能/サービスを続々発表
マイクロソフトは、同社の年次開発者会議「Build 2017」で、開発者向けのクラウド新機能やサービスを多数発表。「Mac版Visual Studio 2017」や「MySQL on Azure」、大規模NoSQLデータベース「Cosmos DB」などがリリースされる。 - Azureの「SQLデータベース」とSQL Serverは何が違う?/Pivotal HD 2.0
Microsoft Azureで利用できるサービスの一つ「SQLデータベース」。Azure上でSQL Serverインスタンスを利用する場合と比較して、性能・料金体系はどう違う? SQL on Hadoopを実現するPivotal HDのHAWQとは? - Apache Sparkに注力するIBM、目指すは「データ分析のOS」
北米トヨタ販売子会社での採用事例の発表などもあり、日本国内でも注目を集めつつある「Apache Spark」。具体的にはどんな特徴があって、何ができるのだろうか。Sparkへの大規模投資を発表したIBM(日本IBM)を取材した。 - マイクロソフト、NoSQLデータベース「Azure DocumentDB」の機能を多数強化
マイクロソフトのクラウド型NoSQLデータベース「Azure DocumentDB」に、多くの新機能が追加/強化。クイックスタート、高可用性バックアップ、IP単位のアクセス制御などの機能が備わった。