ETLエンジンにYARNを採用「Talend 5.4」データ統合インフラ製品情報

OSSのデータ統合プラットフォームであるTalend 5.4がリリースに。Apache Hadoopの関連プロダクトとして注目を集めているYARNをネイティブでサポートする。

» 2013年12月17日 11時35分 公開
[原田美穂,@IT]

 Talendは2013年12月17日、データ統合基盤ソフトウェアTalend 5.4を発表した。2013年末の出荷開始を予定している。販売価格は190万円から(保守を含む年間サブスクリプションライセンス)。Talendはオープンソースで公開されているデータ統合基盤ソフトウェアで、これを基にしたサポートなどが付く有償版を同社および同社パートナー企業が提供している。

 最新版のTalendではApache Hadoopの関連プロダクトとして注目を集めているYARNをネイティブでサポートする。YARNは2013年10月に正式リリースされたばかりの新しいフレームワークだ。

 「YARNエンジンを利用することで、1日掛かっていたバッチとデータ統合が秒単位で実現する。Talendによるデータ統合はビジネスプロセスを変えられるだけのインパクトがある」(Talend コンサルティングマネージャー 正金秀規氏)

 また、Eclipseプラグインとして提供されるGUI開発ツールである「Talend Studio」の機能も追加、MapReduceのジョブ実行パフォーマンスの最適化をGUIで計測・調整可能になった。また、各ノードの認証でKerberosも使えるようになっている。この他、データ統合を行う際に必要となるデータクレンジングの作業をHadoop環境上で実現する機能も持つ。

 同社マーケティングディレクターである寺沢慎祐氏によると、既存BIツールでもデータ統合的な機能を提供しているが、マスターデータ統合を目指す場合には、やはり専用ツールで細かなチューニングができなければ不十分なケースが少なくなく、本格的なデータ統合の要件ではTalendが採用されることが多いという。

 「理想形としては、各部門のマスターデータはそのままに、新たなビッグデータ活用を見据えた『マスターデータハブ』を用意する際にTalendのような製品が必要になる。この場合、純粋にデータを集めて変換するシンプルな仕掛けと、多様なリソースから情報を吸い上げられるインターフェースがあることが重要。Talendの場合、OSSプロダクトであることから、検証が容易であることも評価されている」(寺沢氏)

「Talend Studio」によるデータマッピング操作の例

 グローバルサプライチェーンや、小売POSデータでの需給調整など、秒単位で利益に影響がある分野での引き合いが多いというが、今後は、公共データなどの分野での採用も視野に入れた販売活動を行っていくという。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。