ドットコム崩壊をものともしないGoogle、そのシステムに迫る

2001/5/2
(04/27/01, 7:09 p.m. ET) By Mitch Wagner, InternetWeek

 Googleには“ドットコム・ブームは終わった”という電子メールは届かなかったようだ。企業がeビジネス投資を削減する中、同社はインフラへの投資を積極的に行っている。この10カ月の間もベンダーからサーバを購入し、保有台数は2倍規模の8000台となった。

 理由は至極簡単で、Googleはこの“鉄でできたハコ”を必要としているからだ。同社サイトへのアクセスは急増し、世界で最もよく参照されるサイトTop25にランクインした。2000年3月には320万人だったユニークビジター数は、1年後の2001年3月には1090万人に達している(Jupiter Media Metrix調べ)。このようなトラフィックの急増にもかかわらず、同社のサイトは相変わらず速く動く。Googleのビジターは目的のページに平均0.64秒でアクセスできるという(Keynote Systems調べ)。

IAサーバ上でLinuxを

 Googleはスケーラビリティという課題に対し、ポピュラーな“サーバ・ファーム・アプローチ”をとっている。IA(インテル・アーキテクチャ)サーバの価格とサイズが小さくなるにつれ、企業は安く、低消費電力サーバを用いて拡張する。

 Googleは他の多くの企業と同様、動作環境にLinuxを使っている。「小規模システムでもロード量を確保しておけば、64ウェイの巨大なシステムは必要ない」とD.H. Brown AssociatesのアナリストRich Partridge氏は言う。「Googleは他社がやっているトレンドに従い、さらにそれを徹底的に追求しているのだ」。

 インフラの拡張のため、Googleではシステムを統合中だ。同社ではサン・フランシスコとワシントンD.C.の2カ所にあったデータセンターを、ワシントンD.C.にある新しい設備へ移転させ、統合過程にある。作業が完了すれば同社のデータセンター数はこれまでの5から4になる。しかも、過去1年間に3つのデータセンターを追加した後でのことだ。

ディスク・ストレージシステム

 Googleは、ペタバイト級のストレージ1台にWebページ13億分のインデックスを持つ。「インデックスがペタバイトを必要としているからではない。1インデックスにつき数百のコピーを持つからだ」とGoogleのマネージャMarc Felton氏は語る。「ほとんどのサーバがインデックスをセーブするために使用されている」(Feltontions氏)。インデックスはセグメント毎に分割され、クエリは、答えに近いセグメントに基づき最適なサーバへと送られる。

 大規模なWebサイトが、データ保存のストレージシステムとしてRAIDシステムやSANを用いているが、Googleでは典型的なディスク型のストレージシステムを用いている。その理由を「その方が速いから」とFelton氏は言う。

 Googleのストレージデバイスの多くはMaxtorの80GBハードディスク・ドライブだ。Maxtorの製品は、ハードディスクドライブ1台につきコントローラを1台、PC1台につきハードディスクドライブ2台を持つ。場合によっては、同社は2倍規模のPCを使用する。コントローラは4台、ハードディスクドライブは4台、プロセッサ2基、RAMは2倍となる。

 「4台のハードディスクドライブにCPUとRAMを増やした方が、2台のハードディスクドライブを使用するより効率が良い」とFelton氏。ほとんどのPCの場合、ハードディスクドライブ2台でIDEコントローラを共有することになる。だが、Googleでは個々のハードディスクドライブにそれぞれコントローラを割り当て、スループット向上を図っているという。

 GoogleはRackable SystemsのIA(インテル・アーキテクチャ)サーバを使用している。データセンターではスペースは高価だ。そのため、同社ではできるだけ多くのPCを詰め込んだ。だが、今度はオーバーヒートを招いてしまう危険がある。

 「宅配ピザのハコのようなサーバをタテ・ヨコぎっしりと積む。ピザのハコどころか、ピザを焼くオーブンの状態になる」とPartridge氏。

 「PCを駄目にするのは熱だ。シンプルだが熱は最大の敵だ」とFelton氏は言う。「熱はPC内に入るだけではない。ほとんどのPCはそれを意識して設計されているが…。コンピュータはスタンドアロンと思われているが、Rackableは違う。それ以上の工夫をしている。熱を中央の“煙突”に追いやり、そこでパワフルなファンが熱を散らす仕組みだ」

LinuxはRed Hatを使用

 サーバを動かすOSはRed Hat Linuxだ。

 Googleの成功は、“Linuxは大きなビジネスを稼働することができる”という実証例にもなった。「アプリケーションのベースとしてのOSに投資を考えている企業にとって、Googleは“確認”の役割を持つ」とGiga Information Groupのアナリスト、Stacey Quandt氏は言う。

 さらに「Googleが特別なシステムではなく日用品レベルのOSやハードウェアを組み合わせて使用していることは、同社にとっては競争力となっている。投資をリソース開発やカスタム・アプリケーションのサポートに回すことができるから」(同氏)

 そこまで聞くと多くのIT管理者は、「もしLinuxがGoogleのアプリケーションを動作できるのなら、わが社のアプリケーションだって…」と思うことだろう。だが、残念ながらQuandt氏によれば「難しい」とのことだ。Googleのアプリケーションはユニークで、他の企業アプリケーションよりも多くのロードバランシング、演算処理、インプット/アウトプットの帯域幅を必要とするのだという。

 GoogleはRed Hatを無料でダウンロードし、Red Hatのオープンソース・ディストリビューションを最大限に活用した。そしてLinuxのオープンソースという特性を利用して、拡張的な変更を加え、OSをそのニーズ(リモート管理、セキュリティなど)にマッチさせてパフォーマンスを支えた。

 Felton氏は自身を「決してLinuxエバンジェリストではない」としながら、こう続けた。「だが、Red Hatのパフォーマンス、安定性、パッケージ方法、インストール方法は気に入っている」。また、Red Hatは人気のあるLinuxバージョンであるため、同製品の機能に慣れたITスタッフは比較的見つけやすいともいう。

 こういった同社のシステムについて、「LinuxをOSに選ぶことにより、Googleは単一のベンダーやハードウェア、OSに依存することがない」とQuandt氏は指摘している。

[英文記事]
Google Defies Dot-com Downturn

[関連リンク]
Google
Maxtor
Rackable
Red Hat

[関連記事]
27歳のGoogle創立者、「口コミが最大の広告」 (@ITNews)
急成長中のGoogleが日本語版サービス開始 (TechWeb/@ITNews)
GoogleとYahoo! JAPANが提携 (@ITNews)

Copyright(c) 2001 CMP Media LLC. All rights reserved

情報をお寄せください:



@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)