巨大データとのそれぞれの付き合い方――Pivotal、SAP HANA:Database Watch(2013年7月版)(2/4 ページ)
国内での法人設立も間近と噂されるPivotal。一足先に今後の製品展開をウォッチした。SAP HANAやOracle Database 12cなども。
Pivotalが提供するソフトウェアを整理する
Pivotalが保有するソフトウェアはデータベースだけに限らないものの、ここではPivotalに関わるデータベース製品をピックアップして見ていきましょう。
PostgreSQLに源流を持つDWHソフトウェア:Greenplum
Greenplumは、データウェアハウスなど分析用途として発展してきた経緯があります(関連記事1、関連記事2)。
PostgreSQLをベースに、並列分散処理などの機能拡張を実装しています。汎用のハードウェアでも動作し、柔軟にスケールアウトできてシステム投資を最適化できること、並列処理やカラムストアなどによる高速化、アプライアンスからサービスまで、実装環境の選択肢が広いなどが挙げられます。
高速化の技術で鍵となるのが並列処理です。
一般的にデータベースシステムではディスクI/OがネックとなりCPUを使い切れないことがありますが、GreenplumではCPUを使い切るようにできています。
データのロードも並列処理できるため、ロード性能でもリニアにスケールします。ほかにもカラムストア、圧縮、パーティション、ワークロード管理など細かに高速化の技術を持ち備えています。
GemFire、SQLfire
次にGemFireとSQLFireが挙げられます。GreenplumがRDBMSなら、GemFireはNoSQLに分類できます。もともと複数のドメインやクラウドの間でデータの連携や共有を行い、ハイブリッド・クラウドを実現するための製品だったようです。
昨今のデータ管理の課題を解決すべくスケールアウトやデータグリッドなどの技術が盛り込まれています。
NoSQL型データベースは、実装の種類によってドキュメント指向型やキーバリュー型などに分類できますが、GemFireはキーバリュー型といえます。GemFireに近い実装として、RiakやRedisが挙げられるでしょう(関連連載)。
GemFireは、インメモリデータストアであり、データ連携(配信)のためのメッセージング機能を持っています。電子取引システムや米軍における資産の位置情報把握システムなどでの採用実績があります。
*関連リンク http://basho.co.jp/(Riakの開発元)、http://redis.io/
このGemFireのNoSQL型の特性を引き継ぎつつ、SQLクエリでアクセスできるようにしたのがSQLFireです。Apache Derby*とGemFireを組み合わせたものと考えていいでしょう。RDBMSとしてのデータアクセス方法に、NoSQL的な仕組みを掛け合わせ、信頼性のあるデータ分散を実現しています。
* Apache Derby 元はCloudscapeが提供していたソフトウェア。Informixに買収され、さらにIBMがInfomixを買収した際にApache Foundationにソースコードが寄贈された。JavaベースのRDBMS。
こうした製品を組み合わせ、ビッグデータも扱えるような高速なデータ処理基盤(プラットフォーム)を提供していくのがPivotalおよびEMCグループのねらいです。
この先、HadoopディストリビューションのPivotal HD、Hadoop環境でSQLクエリを実現するHAWQ、BIレポーティングのための製品など、ほかのラインアップとの連携も予定されています。動向は随時レポートしていく予定です。
Copyright © ITmedia, Inc. All Rights Reserved.