Hadoop普及のキモは既存「言語」の取り込みにある:Database Expertイベントレポート(2/2 ページ)
Hadoopを使ったビッグデータ分析はエンタープライズ領域に本当に浸透する? Clouderaはエンタープライズ市場の開拓に向けて着実に開発を進めているようだ
CDH5のフィーチャーは?
Impalaは、既に単独で公開されているが、CDH5プラットフォームの中にも正式に組み込まれる予定だ。CDH5は「2013年の中ごろにはリリースする」(Awadallar氏)としている。
CDH5では、Impalaのほかに、応答速度や信頼性向上に向けたプロダクトの投入や機能改善が目立つ内容になりそうだ。
下の資料画像にあるように、CDH5のテーマは、(1)低レイテンシなクエリによる分析、(2)強固なリカバリ性、(3)複数ワークロードのリソース管理が中心だ。そのほか、メタデータ管理の拡張やアクセスコントロールの強化なども挙げられている。
Awadallar氏によると、CDH5のテーマに則して、2012年末にもいくつかのプロダクトのアナウンスを行う予定だ。
ビッグデータ分析は市場に浸透する?
技術的背景がどのようであれ多くの企業がビッグデータといっている中、Hadoopプロダクトによる本当の意味でのビッグデータ分析を実現する同社はどのようにマーケットに訴求していくだろうか。
「われわれが提供するのは、Scheme on Read。つまり、データを格納する際には何の制約も必要がない。読み出すときに初めてデータをどのように読むかを定義すればよいのであるから、非常に柔軟であることが分かるだろう。この点において、既存企業の中でもSchema on Writeについては競合ではない、と考えている。柔軟性が必要な領域についてはわれわれのような技術でなければ解決できない。一方で既存のテクノロジが得意とする領域については、それらと共存し、パートナーシップを強めていくべきと考えている。Clouderaとしては、多くの企業と広くパートナーシップを結んでいく戦略だ。われわれはソースコードへのアクセスが可能であること、ユーザのコミットメントが重要だと考えている」(Awadallar氏)
Scheme on Readはよいとして、それをエンタープライズ系技術者は使いこなせるのだろうか? 市場を創出するために何が必要と考えているのだろうか。この問いに対してAwadallar氏は3つの戦略を示した。
第1に、スキルのある技術者を増やすこと。これは同社が実施するトレーニングプログラムに相当する。第2に、エンタープライズの技術者に「なじみのある言語」を持つこと。これはImpalaがODBCやJDBCの接続インターフェイスを持つことともつながる。第3にグローバルでのエンタープライズSIとのパートナーシップ拡大。Clouderaは、既に日本国内だけでもNTTデータをはじめとする複数の企業とのパートナーシップを結んでいる。
数年前までは米国においても、いまの日本と同じように「何に使えるのかが分からない」という反応が主だったというが、米国では現在、具体的な企業での導入事例が出つつある。「日本の市場でもこれから徐々に、大量データを使うことの意味、意義が浸透していくと期待している」(Awadallar氏)
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- MapReduceの限界を独自開発で解決:Facebook、スケーラビリティを強化したスケジューリングツール「Corona」をオープンソース化
データが大きくなりすぎてMapReduceのジョブトラッカーが死亡? そんな課題に対応するため、Facebookはジョブスケジューリングツールをゼロから構築、公開した。 - 過去の負荷動向も検証可能:Hadoop/HBaseの内部動作を可視化するソフトウェア「halook」をOSSで公開
Hadoop内部の負荷状況などをグラフィカルに表示するOSSツールが登場。Javaプログラム解析ツールを流用し、HTML5などを駆使して内部の挙動を可視化する - パフォーマンスは最大で50倍に:Microsoft、次期SQL Serverにインメモリ技術「Hekaton」搭載へ
米Microsoftは11月7日、SQL Serverの次期メジャーリリースに、コードネーム「Hekaton」と呼ばれるインメモリ機能を組み込むと発表した。 - 知らないなんて言えないNoSQLまとめ(1):KVS系NoSQLのまとめ(Hibari、Dynamo、Voldemort、Riak編)
エンジニアとして「知らない」とは言えない空気が漂うNoSQL界隈……。いろいろあるけども何がどう違うのか、主要プロダクトの特徴をコッソリ自習しよう。第1回はKVS系NoSQLの中から、マスタ型、P2P型に分類されるものを紹介していく。 - 使い慣れたインターフェイスでビッグデータにアクセス:マイクロソフトがHadoopベースのビッグデータソリューションを公開
マイクロソフトがApache HadoopとAzure、Windows Serverの連携を推進。アプリケーション開発者向けSDKも公開した