Talend v5.3は、MapReduceのネイティブコードを生成できるようになった。これにより、Talendのジョブを並列分散処理に対応させることできる。
Talendの日本法人は2013年5月23日、ワールドワイドで5月7日に発表されたオープンソースのデータ統合・連携プラットフォーム最新版「Talend v5.3」に関する記者説明会を開催した。最新版では、Apache HadoopやNoSQLデータベースに対するサポートを強化している。
Talendとは、データ統合、データ品質、マスタデータ管理(MDM)、エンタープライズサービスバス(ESB)、ビッグデータ向け製品群からなるデータ統合・連携プラットフォーム。オープンソースの無償版と、管理機能などが加わった有償の商用サブスクリプション版がある。
Talend v5.3では、すでに対応済みのApache Hadoop、Cloudera CDH、MapR、GreenPlumの各Hadoopディストリビューションに加えて、新たにAmazon Elastic MapReduceをサポートする。また、ユーザーはMapReduceのネイティブコードを生成できるようになった。JavaコードかMapReduceコードかを選択可能で、Talendのジョブを並列分散処理に対応させることできる。
加えて、Pig言語によるビジュアルマッピング処理機能が加わった。HDFS内のHive/HCatalogテーブルやファイルのルックアップが可能で、データの抽出や変換といったデータフローをグラフィカルに構築できる。Pig Latin言語の開発者であれば、GUI環境を用いてデータ処理のためのジョブを短期間で開発・テストし、レビューを実施することができるという。
NoSQLデータベースのサポートも強化された。Cassandra、MongoDB、Hbase、Google BigQueryなどのNoSQLデータベースに加えて、Couchbase、CouchDB、Neo4Jに対応する。NoSQLデータベースと他のデータストアおよびシステム間でデータを移動し、同期を取ることができるようになる。クラウドDWHサービスのAmazon Redshiftにも対応する。
Eclipseベースのデータ変換ツールに特化するOakland Softwareのテクノロジを新たに組み込むことで、XMLデータやJava、EDIデータ、X12、COBOLデータの変換処理も可能になった。
Talend v5.3の無償版はすでに提供を開始しており、商用サブスクリプション版は2013年6月末から提供を開始する予定。
Copyright © ITmedia, Inc. All Rights Reserved.