Hadoop、NoSQLのサポートを強化した「Talend v5.3」:Amazon Redshiftにも対応
Talend v5.3は、MapReduceのネイティブコードを生成できるようになった。これにより、Talendのジョブを並列分散処理に対応させることできる。
Talendの日本法人は2013年5月23日、ワールドワイドで5月7日に発表されたオープンソースのデータ統合・連携プラットフォーム最新版「Talend v5.3」に関する記者説明会を開催した。最新版では、Apache HadoopやNoSQLデータベースに対するサポートを強化している。
Talendとは、データ統合、データ品質、マスタデータ管理(MDM)、エンタープライズサービスバス(ESB)、ビッグデータ向け製品群からなるデータ統合・連携プラットフォーム。オープンソースの無償版と、管理機能などが加わった有償の商用サブスクリプション版がある。
Talend v5.3では、すでに対応済みのApache Hadoop、Cloudera CDH、MapR、GreenPlumの各Hadoopディストリビューションに加えて、新たにAmazon Elastic MapReduceをサポートする。また、ユーザーはMapReduceのネイティブコードを生成できるようになった。JavaコードかMapReduceコードかを選択可能で、Talendのジョブを並列分散処理に対応させることできる。
加えて、Pig言語によるビジュアルマッピング処理機能が加わった。HDFS内のHive/HCatalogテーブルやファイルのルックアップが可能で、データの抽出や変換といったデータフローをグラフィカルに構築できる。Pig Latin言語の開発者であれば、GUI環境を用いてデータ処理のためのジョブを短期間で開発・テストし、レビューを実施することができるという。
NoSQLデータベースのサポートも強化された。Cassandra、MongoDB、Hbase、Google BigQueryなどのNoSQLデータベースに加えて、Couchbase、CouchDB、Neo4Jに対応する。NoSQLデータベースと他のデータストアおよびシステム間でデータを移動し、同期を取ることができるようになる。クラウドDWHサービスのAmazon Redshiftにも対応する。
Eclipseベースのデータ変換ツールに特化するOakland Softwareのテクノロジを新たに組み込むことで、XMLデータやJava、EDIデータ、X12、COBOLデータの変換処理も可能になった。
Talend v5.3の無償版はすでに提供を開始しており、商用サブスクリプション版は2013年6月末から提供を開始する予定。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 課題はデータ管理コスト、DBaaS市場が盛り上がる?
アイ・ティ・アールによる市場調査では、DWH、DBMSアプライアンス市場の拡大が明確に表れた。今後はDBaaS市場も活性化するという分析も。 - ITエンジニアのためのBusiness Analytics入門(1):10分で理解するBusiness Analytics、その全体像
Business Analyticsってよく聞くけれどどんな知識が必要なもの? 数学のプロじゃないと踏み込めないの? ビッグデータブームとどう関係するの? というあたりをゼロから整理。業務のスキマ時間でチェックしてみよう。 - OSSベースのETLツール「Talend」商用版を富士通SSLが提供へ
企業内に散在するデータを統合するOSSのETLツール「Talend」。保守サポートが付く商用版の販売を、富士通SSLが手掛けることになった。 - 真・Dr. K's SQL Serverチューニング研修(1):パフォーマンスを語るために歴史を語ろう
日本におけるSQL Serverコンサルタントの第一人者、熊澤幸生氏によるSQL Server詳説シリーズが帰ってきました。2008 R2に至るまでの歴史を振り返り、その先の世代に向けた展望までも語ります(編集部)