Hadoop用のリアルタイムクエリを高速に実現するプロダクトがApacheライセンスで登場。リアルタイムデータクエリとBI的な利用を両立させる手法に選択肢が広まる
Clouderaは2012年10月24日、ニューヨークで開催されたイベント「Strata+Hadoop World」において、Hadoop用リアルタイムクエリエンジン「Cloudera Impala」と、Impalaを管理・サポートする機能を持つ「Cloudera Enterprise RTQ」を発表した。
Cloudera Impala(以降、Impala)は「HDFS」および「HBase」で構成されるHadoop向けのクエリエンジン。Apacheライセンスを採用するオープンソースプロダクトとして提供される。Clouderaでは、このImpalaの開発プロジェクトに、HBaseプロジェクトのコミッタであるMichael Stack氏ら3人を参加させる。
Impalaは、MapReduceと同様の挙動を期待できる一方で、HiveのようなSQLライクなクエリも受け付ける。
プレスリリースによると、Hadoop向けのSQLインターフェイスであるHiveを使ったクエリ応答に数分かかっていたものが、Impalaでは、数秒で応答可能になっているという。これにより、データウェアハウス的なバッチ処理系と、リアルタイムクエリアプリケーションの両方を、同一のプラットフォーム上で実現可能になるとしている。
Clouderaでは、今後、Impalaエンジンを活用し、超並列SQLプラットフォームと同等の品質を目指すとしている。
Copyright © ITmedia, Inc. All Rights Reserved.