ハードウェアはこれからのデータベースの在り方をどう変えるか――ストーンブレーカー氏に聞いた「The Next Platform」で読むグローバルITトレンド(15)

データベースの世界において、次々に革新を生み出してきたマイケル・ストーンブレーカー氏には、最近のハードウェアの進化がどう見えているのだろうか。SSDや3D Xpointなどの新ハードウェアがデータベースに与える影響について、同氏へ行ったインタビューの前編をお届けする。

» 2017年11月14日 05時00分 公開
[Timothy Prickett Morgan, The Next Platform]

英国のIT専門媒体、「The Register」とも提携し、エンタープライズITのグローバルトレンドを先取りしている「The Next Platform」から、@IT編集部が独自の視点で“読むべき記事”をピックアップ。プラットフォーム3へのシフトが急速に進む今、IT担当者は何を見据え、何を考えるべきか、バリエーション豊かな記事を通じて、目指すべきゴールを考えるための指標を提供していきます。

 米カリフォルニア大学バークレー校では、1970〜80年代に革新的なソフトウェア技術が続々と生み出された。その理由の1つが、マイケル・ストーンブレーカー氏の存在だった。同氏はリレーショナルデータベース技術のパイオニアの1人であり、業界最大の、そして最も発信力の高い実力者の1人であり、ベンチャー企業を次々と立ち上げる“シリアル起業家”の中でも、最も多くの起業を行った1人だ。

 データベースの他のパイオニアと同様に、ストーンブレーカー氏はIBM社員だったエドガー・コッド氏のリレーショナルデータモデルに関する初期の論文を読み、1973年にデータベース「Ingres」を開発する取り組みを開始した。そのころ、IBMではデータベース「System R」(後に「DB2」となった)のプロジェクトが始まり、Oracleの社名の由来となったデータベースも数年後にリリースされた。

 こうしたリレーショナルデータベースの草創期以降の数十年間に、ストーンブレーカー氏は、まず、Ingresの後継となる「Postgres」の開発に参加した。現在、Postgresは広く使われているオープンソースデータベース「PostgreSQL」へと発展した。また同氏は、リレーショナルデータベースベンダーのInformixでCTO(最高技術責任者)を務めた。Informixは2001年にIBMに買収され、IBMは2017年4月、インドのHCLがInformix製品ファミリーの開発とサポートを引き継ぎ、IBMが製品戦略、マーケティング、販売を継続することを発表している。

 さらに重要なこととして、ストーンブレーカー氏がデータウェアハウジング向けのシェアードナッシング型列指向データベース「C-Store」の研究に携わった1人であることが挙げられる。C-Storeは後に「Vertica」として商品化された。数年後、ストーンブレーカー氏と友人たちは分散型インメモリOLTPシステム「H-Store」のプロジェクトを立ち上げ、H-Storeは「VoltDB」として商品化されるに至った。決して1つの場所に落ち着かないストーンブレーカー氏は、配列型データベース「SciDB」を開発する取り組みも主導した。SciDBは、技術アプリケーションのニーズに合わせて明確にチューニングされており、データをテーブルで表すリレーショナルモデルとは異なり、データを配列で表す。

 ストーンブレーカー氏のこれまでの歩みを無理やり簡略化してまとめると、以上のようになる。同氏は2001年からマサチューセッツ工科大学(MIT)でコンピュータ科学の非常勤教授を務め、データベースの世界を構築し続けている。

 今日では、多くの新しいコンピュート、ストレージ、ネットワーク技術が登場し、多種多様なデータベースやデータストア技術が利用できるようになっている。そこでわれわれは、これらが将来のデータベースにどのような影響を与えるかを考えるヒントとなる洞察を得るために、ストーンブレーカー氏から話を聞いた。

「1TBのメインメモリは、もはやそれほど膨大な容量ではない」

――データとストレージに関しては、あなたは全てを見てきたといえるような存在だ。そこで、市場に登場しつつある新しいコンピュートおよびストレージハードウェア(特に永続メモリ)が短期的および長期的に、データベースの在り方にどのような影響を与えるかについて、あなたの見解をお聞きしたい。
 DRAMやフラッシュが、現在の価格動向とは違って再び値下がりし、「3D XPoint」のような技術がSSDとDIMMの両方のフォームファクターで市場に提供されるようになると想定する。すると、メインメモリはより大容量かつ安価になり、フラッシュは、どのようにまとめて配置するにしても、ディスクドライブよりもコンピュートに近いデータがより多く保存されるようになる。われわれは「パフォーマンスを高めるために、何でもメインメモリに詰め込む」という考え方を見直さなければならないのだろうか? 新しい技術はさまざまな可能性を広げている。

ストーンブレーカー氏:問題は、ストレージ階層の変化と、そのデータベースとの関係だ。まず、オンライントランザクション処理(OLTP)について見てみよう。私の意見では、これは現在、メインメモリシステムとなっている。この市場向けにNewSQLデータベースを提供する新興企業がたくさんある。サイズが1TBのOLTPデータベースは非常に大規模だが、1TBのメインメモリはもはやそれほど膨大な容量ではない。そのため、パフォーマンスを気にするユーザー向けのOLTPは、全データがメインメモリに置かれるようになると思う。ユーザーがパフォーマンスを気にしない場合は、データベースは腕時計型デバイスでも、どこでも実行できるだろう。

 データウェアハウジング分野では、トランザクションは全てハイエンドであり、人々はペタスケールのデータウェアハウスを運用している。そのため、これはいつまでもディスクベースの市場だろう。ビジネスアナリストやデータサイエンティストは、より多くのデータを相関させたいと考えるのが常だ。彼らが望むデータ量はとどまるところを知らない。その結果、データウェアハウスはディスクドライブの価格低下を上回るペースで大規模化していく。

 もちろん、こうした予測の反例となるFacebookのような企業もある。十分に大規模な組織では、通常とは違うやり方をするかもしれない。Facebookは、ストレージにおける階層の1つとして、SSDに膨大な投資を行っている。これはアクティブデータ用だ。だが、コールドデータは永久に、あるいは何か別の格安ストレージ技術が出てくるまではディスクに置かれるだろう。

 1TBのデータウェアハウスを持っているとしても、例えば無料の「Vertica Community Edition」を利用できるデータ量の上限に収まる。ローエンドのシステムソフトウェアも基本的に無料で使えるだろう。パフォーマンスが重要であればデータをメインメモリに置くことができ、パフォーマンスを気にしないならディスクに置けばよい。データウェアハウスベンダーが複数レベルのストレージ階層に積極的に投資するかどうかは興味深い。

――3D XPointや「ReRAM」のような永続メモリ技術が本格的に登場してくるとどうなるのか?

ストーンブレーカー氏:それらの技術は破壊的な変革をもたらさないだろう。いずれもメインメモリに取って代わるほど高速ではなく、ディスクに取って代わるほど安くもなく、フラッシュに取って代わるほど安くもない。ただし現時点では、3D XPointがどれだけ高速になるか、どれだけ安くなるかはまだ分からない。

 私は、データベースは2つか3つのデータ階層で動作するようになると予想している。だが、4つの階層のストアが管理できるようになるかどうかは疑わしい。複雑過ぎてソフトウェアが対応できないからだ。ストレージ階層が存在することに変わりはないが、具体的にどのようなシステムがどのストレージ階層で実行されるかはまだ決まっていない。メインメモリが最上位層で、ディスクが最下位層となることは分かっている。その間に汎用(はんよう)システムが入ることになる。OLTPシステムは、データがメインメモリに置かれるようになるのは間違いない。VoltDBやMemSQLのような企業が、素晴らしく高速なメインメモリSQLエンジンを手掛けている。

出典:How Hardware Drives The Shape Of Databases To Come(The Next Platform)

筆者  Timothy Prickett Morgan

IT industry analyst, editor, journalist


Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。