Hadoop環境用のアプリケーション開発やデータ操作を容易にする開発キットをClouderaが公開。「いまどき」のアプリケーション開発者に扱いやすい環境を整備する。
米Clouderaは、2013年5月7日、Hadoop用アプリケーション開発キット「Cloudera Development kit(CDK)」をGitHub上で公開した(リンク)。現在のバージョンは0.2.0。ライセンスはApache License V2を採用している。
CDKには、Clouderaの提供するHadoopディストリビューション用のアプリケーション開発を容易にするライブラリ群、ツール類、サンプルコード、ドキュメントが含まれる。
現リリースにはHDFSやローカルのファイルシステムに含まれるデータセットに対して「徹底的にシンプルに動作する」APIセットである「CDK Data module」が含まれる。
OSSで公開されているデータシリアライゼーションシステム「Avro」同様にJava POJOのシリアライズ/デシリアライズや、圧縮、ファイルおよびディレクトリレイアウトの管理、構成可能な機能群をベースとした自動パーティショニングなどの機能をAPI群として提供する。
Clouderaでは、今後も多様なCDKモジュールを随時提供していくとしており、今後は月次でのリリースサイクルを計画、早期にバージョン1.0のリリースを目指すとしている。
Copyright © ITmedia, Inc. All Rights Reserved.