Google App Engine担当者に聞いた

クラウド環境ではデータベースは「非正規化」して使う?

2009/06/09

 2009年4月7日、グーグルは利用者が作成したアプリケーションをスケーラブルなホスティング環境で稼働させられるクラウド系サービス「Google App Engine」で、新たにJavaをサポート言語に加えた。Java言語のサポートによって、業務アプリケーションのクラウド移行は起こるのか? Google App Engine担当者に話を聞いた。

gae01.jpg 米グーグル デベロッパー・アドボケートのフレッド・ソーサー(Fred Saucer)氏。もともとJavaによる業務アプリケーション開発のコンサルタントだったが、最近グーグルに入社したという

――コンシューマ市場ではクラウドサービスの受容が進む一方、企業ユーザーはクラウド移行に消極的にも見えます。

ソーサー氏 確かにコンシューマのほうが新しいものを試して、利用するようになるのが速い傾向はあります。でも、そうしたコンシューマ向けサービスですら10年前には想像するのも難しかったことを思い出してください。クラウドがたとえ企業ユーザーにとってもメリットがあるとしても、その普及には時間がかかるのです。

――企業ユーザーにとってGoogle App Engineのようなアプリケーションホスティングサービスのメリットは?

ソーサー氏 3つあります。始めるのが簡単で、スケールが簡単、管理が簡単ということです。

――物理サーバが不要であるというクラウドのメリットは理解されていると思います。しかし、企業内で業務アプリケーションを作るようなケースでは、スケーラビリティよりも、互換性や、既存ソフトウェア環境に対するスキルセットのほうが重要ではありませんか。例えば、RDBを使ったアプリケーション作成に慣れた開発者にとっては、クラウドのデータベースモデルは違いが大きいのでは?

ソーサー氏 確かに多くの開発者がRDBとともに成長してきました。スキルを磨き、ツールにも親しんでいます。例えばアプリケーションの実行中にJOIN文を使って動的にデータベース中の表を結合するような使い方に慣れています。柔軟なクエリが作れます。

――App Engine(のDatabase API)ではJOINのような機能をサポートしていませんよね。

ソーサー氏 ええ、分散環境ではスケールしないからです。分散コンピューティングの環境では誰かの特定のクエリだけを受け付けて、それを処理するということはできないのです。App Engineではデータは複数のサーバ上にあって、並列化により高速な読み書きが可能です。実は読み出し速度を見ると、特定のサーバからの読み出し時間だけ遅いなど小さなピークがありますが、それでもそれは小さなものです。

 こうした並列化のメリットは、クエリ対象となるエンティティ数がいくら増えても、遅くならないということです。

――業務アプリケーションだと、そこまでのスケーラビリティは不要では?

ソーサー氏 企業内で使われる業務アプリケーションはユーザー数が10人程度ということもあるでしょう。でもデータ量が膨大になることはあり得ますし、マーケティングキャンペーンなどで数百万行のデータを扱う必要が出てくるかもしれません。企業同士が統合でユーザー規模が成長するということもあるでしょう。

――スケーラブルなアプリケーションは、App Engineのようなインフラ上のほうが構築が容易?

ソーサー氏 従来の単一サーバの環境と、クラウドは別物なので、私自身も使い始めてから簡単な面と難しい面の両方を感じています。これまでRDBでさんざんたたき込まれてきた「正規化」とは逆に、クラウド環境では「データを非正規化する」ように考え方を改める必要があります。といってもデータ保存には低レベルのAPIと、JDO(Java Data Objects)/JPA(Java Persistence API)という高レベルのものの2種類があって、後者を使えば既存のデータベースアプリケーションの移植は比較的容易です。

 一方、スケーラブルなアプリケーションを構築するのはApp Engineのほうが簡単です。ユーザーのセッション情報はmemcachedとBigTable上のData Storeで管理していて、JVMインスタンスはどこのサーバにあっても構わないですし、負荷に応じてJVMインスタンスを増減できるのです。

――JVMにオープンソースのJettyを使っているそうですね。

ソーサー氏 小さく、必要な機能があって適しているからという理由でJettyベースのものを使っていますが、将来的に変わるかもしれません。

――App EngineのJVMには、ローカルファイルにアクセスできない、スレッド生成ができないなど、いくつか制限があるようですが。

ソーサー氏 ファイルアクセスの制限はスケーラビリティ確保のためです。スレッドについては、Java言語が必ずしもスレッドのような並行プログラミングを扱うのに適したプログラミング言語とは言えないということもあります。それにスレッドを使うよりも、クラウドで分散するほうがずっと簡単です。

――将来的にはJVM上で使えるScalaとかClojureのような言語を通して高度な分散処理をサポートする?

ソーサー氏 具体的なことは分かりませんが、あるかもしれません。ちなみに、ScalaではActorがスレッドで実装されているので、今のところそのままでは動きません。



関連リンク

(@IT 西村賢)

情報をお寄せください:

Java Agile フォーラム 新着記事

キャリアアップ

- PR -

注目のテーマ

- PR -
ソリューションFLASH

「ITmedia マーケティング」新着記事

変わり続ける顧客、変わり続けるマーケティング 2024年に最も読まれた記事ランキング
マーケ×ITの最新潮流を伝えるITmedia マーケティング。2024年、読者はどんな記事に注目...

勘違いマーケター戦慄 消費者の約半数は「広告主に無視されている」と感じている件
「データに基づく顧客理解」「ハイパーパーソナライゼーション」などマーケティングかい...

AI・ARで「探索」 人より商品とつながるSNSの行く末――2025年のSNS大予測(Pinterest編)
ビジュアル探索プラットフォームとしての独自の道を進み続けるPinterestはもはやSNSでは...