Microsoft、「Apache Kafka for HDInsight」の正式版をリリース:ストリーミングパイプラインを構築、運用できるフルマネージドKafkaサービス
Microsoftは、ストリーミングビッグデータパイプラインの構築を支援する「Apache Kafka for HDInsight」の正式版を提供開始した。
Microsoftは2017年12月18日(米国時間)、「ストリーミングビッグデータパイプライン」の構築を支援するMicrosoft Azureサービス「Apache Kafka for HDInsight」の正式版を提供開始したと発表した。
Apache Kafka for HDInsightは、2016年にプレビュー版がリリースされた。これまでにトヨタ自動車、Adobe Systems、Bing Ads、General Electricなどが本番環境で利用し、コネクテッドカーや詐欺検知、クリックストリーム分析、ログ解析などのために毎秒100万件以上のイベント処理を行っている。
Apache Kafka(Kafka)はオープンソースの分散ストリーミングプラットフォーム。新サービスの基盤である「Microsoft Azure HDInsight」はKafkaの他、「Apache Hadoop」「Apache Spark」「Apache Hive」「LLAP(Live Long And Process)」「Apache Storm」「R」といったオープンソースフレームワークに対応したフルマネージド分析サービスだ。
Kafkaは大規模ストリーミングイベントを、スケーラビリティ、低レイテンシ、低コストで処理する技術として幅広く使われている。Microsoftは、「Kafkaを利用したいと考える企業は多いが、ストリーミングパイプラインの導入、管理、メンテナンスは難しい。しかも、Kafkaはオープンソースでサポートが薄いので、パイプラインで高レベルのアップタイムを確保するには、社内の人材がこうした技術に精通している必要がある」と説明する。
Microsoftはこうした認識から、HDInsightを基盤としたフルマネージドKafkaサービスとして、2016年にApache Kafka for HDInsightを発表した。HDInsightはマネージドプラットフォームであり、オープンソースワークロードで99.9%のSLA(サービス品質保証)を提供する。
「このサービスでは、企業はKafkaクラスタの管理に悩まずに済む。HDInsightが、Kafkaの大規模な運用で、企業が直面する問題を解決するからだ」(Microsoft)
さらにMicrosoftは、プレビュー段階からApache Kafka for HDInsightを使用してきた顧客からのフィードバックを踏まえ、新サービスの重要機能を開発、実装したという。
例えば、Apache Kafka for HDInsightは、「Azure Managed Disks」とネイティブに統合されている。これにより、トヨタやBing Adsが処理するような大規模ワークロードのスケールアウトが可能になり、コストも大幅に抑えられたという。また、Azure環境でKafkaに「ラックアウェアネス」を実装するツールを導入したことで、HDInsight上でのKafkaの可用性を最大限に高めることが可能だ。
Microsoftは、こうした機能を持つApache Kafka for HDInsightが正式リリースとなったことで、Azureプラットフォームでエンドツーエンドのストリーミングパイプラインを実現できるようになったとしている。
「企業は、フルマネージドのHDInsightプラットフォームでKafkaやApache Spark、Apache Stormを使用する高スケーラブル、フォールトトレラント(障害許容)で安全なリアルタイムアーキテクチャを、ワンクリックでデプロイできる」(Microsoft)
*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- ビッグデータ基盤の本番環境設計──本番環境におけるクラスタ構成を考察する
本連載は、「ビッグデータプロジェクトの“進め方”」を業務視点/ビジネス視点の両面から理解し、具体的に実践していくためのナレッジアーカイブです。今回は、ビッグデータ基盤の本番環境を設計するのに必要な項目を解説します。 - もし、あなたが「“ビッグデータプロジェクト”を任せる。何とかするように」と言われたら
「ビッグデータプロジェクトを始めることになった」ら、具体的に何をするのか。本連載は、「ビッグデータプロジェクトの“進め方”」を業務視点/ビジネス視点の両面から体系的に理解し、具体的に実践していく方のためのナレッジアーカイブです。第1回目は、「ビッグデータとは何か」の基礎と、「ビッグデータ基盤の概要とメリット」を解説します。 - マイクロソフト、Azure HDInsightの機能強化を発表
米マイクロソフトはビッグデータ処理・分析を容易にする取り組みの一環として、最新ツールのプレビューや正式リリース、既存ツールの機能強化を発表した。