Hadoop用クエリエンジン「Impala」がついに一般公開にSQL on Hadoopが実用段階に

「Hiveの10倍速い」クエリエンジンが一般公開に。最新の列指向データフォーマットなどにも対応している。

» 2013年05月01日 16時02分 公開
[原田美穂,@IT]

 Apache Hadoopディストリビューションプロバイダである米Clouderaは、2013年5月1日、HDFS(Hadoop Distributed File System)、HBase向けのデータクエリエンジンである「Cloudela Impala 1.0」の一般公開版をリリースした(ダウンロードサイト)。Impala 1.0の公開と併せて、Impalaの自動管理や技術サポートを提供する「Cloudera Enterprise Real-Time Query(RTQ)」も間もなくリリースするとしている。

 Cloudera Impalaは、DremelおよびF1に触発されて開発されたとされるデータクエリエンジン。一般的なデータ形式のほとんどをカバーするほか、列指向のデータフォーマットである「Parquet」もサポートする。ParquetはClouderaとTwitterの開発者らが手掛けたファイルフォーマット。列指向データフォーマットにはこの他、Facebookのデータインフラストラクチャチームなどが開発したRCFileや、Hortonworksが手掛けたORCFileなどもある。

 Clouderaは2012年10月にImpalaのβ版を公開していた(β版の評価記事「Hadoop用リアルタイムクエリエンジン Impalaのポテンシャルをレビューした」参照)。Clouderaでは、同社既存ユーザ企業約40社とともにこのβ版の評価・機能拡張を進めてきたという。同社プレスリリースでは「業界初となる本番環境向けSQL-on-Hadoopソリューション」であると表明している。

図1 Clouderaが提供するApache Hadoopディストリビューション環境におけるImpalaの位置付け (出典:Cloudera)

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。