Impalaは、既に単独で公開されているが、CDH5プラットフォームの中にも正式に組み込まれる予定だ。CDH5は「2013年の中ごろにはリリースする」(Awadallar氏)としている。
CDH5では、Impalaのほかに、応答速度や信頼性向上に向けたプロダクトの投入や機能改善が目立つ内容になりそうだ。
下の資料画像にあるように、CDH5のテーマは、(1)低レイテンシなクエリによる分析、(2)強固なリカバリ性、(3)複数ワークロードのリソース管理が中心だ。そのほか、メタデータ管理の拡張やアクセスコントロールの強化なども挙げられている。
Awadallar氏によると、CDH5のテーマに則して、2012年末にもいくつかのプロダクトのアナウンスを行う予定だ。
技術的背景がどのようであれ多くの企業がビッグデータといっている中、Hadoopプロダクトによる本当の意味でのビッグデータ分析を実現する同社はどのようにマーケットに訴求していくだろうか。
「われわれが提供するのは、Scheme on Read。つまり、データを格納する際には何の制約も必要がない。読み出すときに初めてデータをどのように読むかを定義すればよいのであるから、非常に柔軟であることが分かるだろう。この点において、既存企業の中でもSchema on Writeについては競合ではない、と考えている。柔軟性が必要な領域についてはわれわれのような技術でなければ解決できない。一方で既存のテクノロジが得意とする領域については、それらと共存し、パートナーシップを強めていくべきと考えている。Clouderaとしては、多くの企業と広くパートナーシップを結んでいく戦略だ。われわれはソースコードへのアクセスが可能であること、ユーザのコミットメントが重要だと考えている」(Awadallar氏)
Scheme on Readはよいとして、それをエンタープライズ系技術者は使いこなせるのだろうか? 市場を創出するために何が必要と考えているのだろうか。この問いに対してAwadallar氏は3つの戦略を示した。
第1に、スキルのある技術者を増やすこと。これは同社が実施するトレーニングプログラムに相当する。第2に、エンタープライズの技術者に「なじみのある言語」を持つこと。これはImpalaがODBCやJDBCの接続インターフェイスを持つことともつながる。第3にグローバルでのエンタープライズSIとのパートナーシップ拡大。Clouderaは、既に日本国内だけでもNTTデータをはじめとする複数の企業とのパートナーシップを結んでいる。
数年前までは米国においても、いまの日本と同じように「何に使えるのかが分からない」という反応が主だったというが、米国では現在、具体的な企業での導入事例が出つつある。「日本の市場でもこれから徐々に、大量データを使うことの意味、意義が浸透していくと期待している」(Awadallar氏)
Copyright © ITmedia, Inc. All Rights Reserved.