Amazon Elastic MapReduceで「Impala」が利用可能に:AWS情報アップデート
Amazon Elastic MapReduce(EMR)の一部として、オープンソースのHadoop用クエリツール「Impala」が使えるようになった。
米Amazon Web Services(AWS)は12月13日、Amazon Elastic MapReduce(EMR)の一部として、オープンソースのHadoop用クエリツール「Impala」が使えるようになったと発表した。
ImpalaはSQLライクなステートメントを使って分散インメモリクエリエンジンを起動し、効率的に大量のデータを高速処理できるHDFS(Hadoop Distributed File System)、HBase向けのデータクエリエンジン。各種フォーマットの非構造化データに対応でき、ユーザー定義の関数もサポート、主要なBusiness Inteligence(BI)ツールと互換性を持つ。
Amazon EMRではImparaがプリインストールされたクラスタの起動が可能になり、新しいデータをロードしたり、既存のデータにアクセスしてSQLライクな言語を使って高速クエリを実行したりできるようになった。Impalaを利用する場合、Hadoop 2.x(AMIバージョン3.0.2)を含んだAmazonのディストリビューションを起動する必要がある。
ImpalaはHadoopエコシステムの一部として、増え続けるデータに対応するためのスケーリングが容易という特徴がある。Amazon EMRではクラスタにノードを追加することによってスケールアウトが可能で、ノード当たりのメモリ追加が必要な場合、RAMを追加したインスタンスタイプを使った新しいクラスタが簡単に作成できるという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Hadoop用リアルタイムクエリエンジン Impalaのポテンシャルをレビューした
2012年10月24日に発表されたばかりのHadoop用リアルタイムクエリエンジンをいち早くレビュー。次期CDHに組み込まれる予定の新機能をどう使いこなす? - 一般企業だってイノベーションを起こしたい、AWS総責任者のジャシー氏
AWS総責任者のアンディ・ジャシー氏は11月13日(米国時間)、re:Invent 2013の基調講演で、「一般企業は、スタートアップ企業と同じようにイノベーションを起こしたいと考えている、しかしインフラがその邪魔をしている」、AWSを使えば制約を考えずに、事業アイデアを即座に形にすることができる、と語った - AWSがElastic BeanstalkやIAM、Redshiftの機能アップデートを発表
自動運用を助けるRolling Updatesや、Redshiftにおける柔軟なメモリやクラスタノードの利用が可能になる機能などが相次いで発表になった。間もなく各国リージョンで利用できるようになる。