Amazon Elastic MapReduce(EMR)の一部として、オープンソースのHadoop用クエリツール「Impala」が使えるようになった。
米Amazon Web Services(AWS)は12月13日、Amazon Elastic MapReduce(EMR)の一部として、オープンソースのHadoop用クエリツール「Impala」が使えるようになったと発表した。
ImpalaはSQLライクなステートメントを使って分散インメモリクエリエンジンを起動し、効率的に大量のデータを高速処理できるHDFS(Hadoop Distributed File System)、HBase向けのデータクエリエンジン。各種フォーマットの非構造化データに対応でき、ユーザー定義の関数もサポート、主要なBusiness Inteligence(BI)ツールと互換性を持つ。
Amazon EMRではImparaがプリインストールされたクラスタの起動が可能になり、新しいデータをロードしたり、既存のデータにアクセスしてSQLライクな言語を使って高速クエリを実行したりできるようになった。Impalaを利用する場合、Hadoop 2.x(AMIバージョン3.0.2)を含んだAmazonのディストリビューションを起動する必要がある。
ImpalaはHadoopエコシステムの一部として、増え続けるデータに対応するためのスケーリングが容易という特徴がある。Amazon EMRではクラスタにノードを追加することによってスケールアウトが可能で、ノード当たりのメモリ追加が必要な場合、RAMを追加したインスタンスタイプを使った新しいクラスタが簡単に作成できるという。
Copyright © ITmedia, Inc. All Rights Reserved.