冬季オリンピック公式サイト、可用率99.9%への道のり(2)

2002/3/26
Monday, March 15, 2001 InternetWeek, By Richard Karpinski

データ
企業名MSNBC.com

業界:マスコミ

e-ビジネスのゴール
:冬季オリンピックのWebサイト運営に備えてサイトのアップタイムと可用性を向上させること。

ソリューション:Web環境アーキテクチャの見直しにより、ハードウェアの性能を40%引き上げ、iDCを追加して負荷バランシングとコンテンツキャッシングサーバを実装する。その結果、オリンピック開催期間中は99.9%の可用性を実現した。

――Olympics.com Webサイトの公式ホストであるMSNBC.comのITチームは、Webインフラを構築し直し、今後数年間のトラフィックの暴騰にも備えながら、オリンピック開催期間中に99.9%というアップタイムを実現した。 重要な調査結果として、トラフィックの問題には、ただ単にハードウェアを投入するだけでは解決にならないということがわかった。アーキテクチャを熟考し、ロードバランサやキャッシングサーバなどの有効な手段を導入することである。また、これらはトラフィックを均等にしてくれるという効果も期待できる(Richard Karpinski)――


経験から学ぶ

 Corrigan氏のチームはこの9月11日の経験を生かして、オリンピックサイトの最終的なアーキテクチャを組み立てた。バックエンドにあるサーバの台数を約4割増加させ、合計で約50台のサーバを設置した。さらに、2カ所体制のiDC計画を正式に決定し、ホストプロバイダである米マイクロソフトの支援を得て2番目のサイトを追加開設した。

 次に、両サイトでのサーバ間のローカル・ロードバランシング機能に加え、2カ所のiDC間におけるロードバランシング機能をグローバルレベルでも実装した。そして、これらのロードバランサのベンダには、米F5ネットワークスに白羽の矢がたった。

 「F5の製品は、常に積極的な管理を行い、どのサーバに関しても可用性を知らせてくれる。また、メンテナンスの目的でサーバをダイナミックに組み入れたり、切り離したりできるなど、多くの操作が可能だった」(Corrigan氏)

 そして最後に、Corrigan氏と同氏のチームは米キャッシュフローのキャッシングサーバを設置した。これらは、殺到が予想されるユーザーを処理するためにあらかじめ接続を確立し、大半がスタティックになっている同社のWebページを管理してくれる。

 (驚いたことに)新しい点数や試合結果を絶えずサイトに表示する必要があるにもかかわらず、同社のWebページはほぼすべてがスタティックASPコンテンツとして提供されていた。そのため、「このサイトにはキャッシングが大きく貢献すると感じた。かなり大量のTCP/IPコネクションを処理できるようになり、これらのコネクションをサーバから切り離せるようになって、それと同時に比較的スタティックな大量のコンテンツを相当高速に配信できるようになるからだ」とCorrigan氏は明かす。

 MSNBCは米キャッシュフローと協力し、このキャッシュサーバと、古くなってしまったページを訪問者に表示することなく、できる限り多くのページをキャッシュするアルゴリズムを1カ月半かけてチューニングしたという。

 Corrigan氏はさらに、すでに導入していた米アカマイ・テクノロジーズの製品からも、この新アーキテクチャに役立つものを見つけ出した。アカマイの分散インフラを、MSNBCのサイトのイメージをキャッシュするために使うだけでなく、オーバーフロー/障害復旧用のハブとしても使うことにしたのだ。

 このような対策はすべて、ただ単にハードウェアを追加するのではなく、トラフィックをよりインテリジェントに管理することが狙いだった、とCorrigan氏はいう。

 「平均負荷の9〜10倍という、高いが短時間しか持続しないピークを予想していた。そして、これには経済的な方法で対応する必要があった。サーバを2〜3倍に増やして何も処理させないでおくようなことは絶対にできなかった」(Corrigan氏)

 このような対策が功を奏し、MSNBCのオリンピック向け新アーキテクチャは、重い負荷によく耐えた。同サイトは1週あたり900万人のユーザーを処理し、2月単月で7億1600万ページビューの配信を行った。また、ピーク時には、26万人以上の同時ユーザーを処理することができた。Corrigan氏によると、Michelle Kwanが登場した女子フィギュアスケート決勝などのピーク時でさえも、平均レスポンスタイムは2秒以下だったという。同サイトの可用性は最も混雑した時間でさえ99.5%(以上)となった。

 Corrigan氏のチームは現在、今回のオリンピックに使用した一部ハードウェアの削減を進めているが、今回構築した新しいサイトアーキテクチャと新しいツール(ロードバランサやキャッシングのハード)は今後も継続して使用する。

 「われわれが検討・収集してきたものは、サイトの規模見直しのために利用する。われわれは今回の経験を通して、ニュースの瞬間的な過負荷に対して何を用意すればよいのかを学んだ。そして、それに対し最も経済的な環境で対処できる」(Corrigan氏)

 「Webユーザーの要求とは最高の使い勝手」とCorrigan氏は語る。「Webサイトに対する期待という意味では、市場は成熟しつつある。実際にも99.9%レベルの可用性が期待されている。遅延の減少と高速なページ表示など、ユーザーはさらに多くを期待している」(Corrigan氏)

*この記事は2回に分けて連載しています。前回の記事を読む

[英文記事]
An Olympian Web Effort

[関連リンク]
MSNBC.com

[関連記事]
いまだ復旧できない金融機関にニューヨーク市民は怒っている (@ITNews)
ドットコム崩壊をものともしないGoogle、そのシステムに迫る (@ITNews)
米テロ事件がIT業界に与えた課題 (NewsInsight)
次に重要なのはWebサイトのアクティビティ (@ITNews)
自社のWebサイトの性能を知るために(1) (@ITNews)
テストとモニタリングで安全なシステム運用とリスク削減を実現 (@ITNews)
企業はもっとWebサイトの測定基準に注目せよ (@ITNews)

Copyright(c) 2001 CMP Media LLC. All rights reserved

情報をお寄せください:



@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)