ETLエンジンにYARNを採用「Talend 5.4」:データ統合インフラ製品情報
OSSのデータ統合プラットフォームであるTalend 5.4がリリースに。Apache Hadoopの関連プロダクトとして注目を集めているYARNをネイティブでサポートする。
Talendは2013年12月17日、データ統合基盤ソフトウェアTalend 5.4を発表した。2013年末の出荷開始を予定している。販売価格は190万円から(保守を含む年間サブスクリプションライセンス)。Talendはオープンソースで公開されているデータ統合基盤ソフトウェアで、これを基にしたサポートなどが付く有償版を同社および同社パートナー企業が提供している。
最新版のTalendではApache Hadoopの関連プロダクトとして注目を集めているYARNをネイティブでサポートする。YARNは2013年10月に正式リリースされたばかりの新しいフレームワークだ。
「YARNエンジンを利用することで、1日掛かっていたバッチとデータ統合が秒単位で実現する。Talendによるデータ統合はビジネスプロセスを変えられるだけのインパクトがある」(Talend コンサルティングマネージャー 正金秀規氏)
また、Eclipseプラグインとして提供されるGUI開発ツールである「Talend Studio」の機能も追加、MapReduceのジョブ実行パフォーマンスの最適化をGUIで計測・調整可能になった。また、各ノードの認証でKerberosも使えるようになっている。この他、データ統合を行う際に必要となるデータクレンジングの作業をHadoop環境上で実現する機能も持つ。
同社マーケティングディレクターである寺沢慎祐氏によると、既存BIツールでもデータ統合的な機能を提供しているが、マスターデータ統合を目指す場合には、やはり専用ツールで細かなチューニングができなければ不十分なケースが少なくなく、本格的なデータ統合の要件ではTalendが採用されることが多いという。
「理想形としては、各部門のマスターデータはそのままに、新たなビッグデータ活用を見据えた『マスターデータハブ』を用意する際にTalendのような製品が必要になる。この場合、純粋にデータを集めて変換するシンプルな仕掛けと、多様なリソースから情報を吸い上げられるインターフェースがあることが重要。Talendの場合、OSSプロダクトであることから、検証が容易であることも評価されている」(寺沢氏)
グローバルサプライチェーンや、小売POSデータでの需給調整など、秒単位で利益に影響がある分野での引き合いが多いというが、今後は、公共データなどの分野での採用も視野に入れた販売活動を行っていくという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Amazon Redshiftにも対応:Hadoop、NoSQLのサポートを強化した「Talend v5.3」
Talend v5.3は、MapReduceのネイティブコードを生成できるようになった。これにより、Talendのジョブを並列分散処理に対応させることできる。 - Amazon Redshiftが正式公開に
AWSのクラウド型データウェアハウスサービス「Amazon Redshift」がいよいよ正式公開となる。今後数カ月以内に各リージョンでの利用が可能になるという。 - 10分で理解するBusiness Analytics、その全体像
Business Analyticsってよく聞くけれどどんな知識が必要なもの? 数学のプロじゃないと踏み込めないの? ビッグデータブームとどう関係するの? というあたりをゼロから整理。業務のスキマ時間でチェックしてみよう。 - OSSベースのETLツール「Talend」商用版を富士通SSLが提供へ
企業内に散在するデータを統合するOSSのETLツール「Talend」。保守サポートが付く商用版の販売を、富士通SSLが手掛けることになった。