AWSの大規模障害から得たレジリエンスに関する教訓(前編)Gartner Insights Pickup(252)

われわれは、Amazon Web Services(AWS)の大規模障害からいくつかの教訓を得た。前編と後編の2回に分けてお届けする。

» 2022年04月08日 05時00分 公開
[Lydia Leong, Gartner]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

ガートナーの米国本社発のオフィシャルサイト「Smarter with Gartner」と、ガートナー アナリストらのブログサイト「Gartner Blog Network」から、@IT編集部が独自の視点で“読むべき記事”をピックアップして翻訳。グローバルのITトレンドを先取りし「今、何が起きているのか、起きようとしているのか」を展望する。

※本稿は2022年2月に公開されたものです。

 2021年12月7日(現地時間)、Amazon Web Services(AWS)の米国東部(バージニア北部、US-EAST-1)リージョンで大規模障害が発生した。これを受けて私は、パニックになった多くの顧客からの問い合わせに対応した。「クラウドプロバイダーはどこも信頼できないのではないか」「アベイラビリティーゾーンモデルは実際に機能するのか」「われわれの現在のアーキテクチャは、ニーズを満たす適切なレジリエンス(強靭《きょうじん》性、回復力)を提供するのか」といった疑問が相次いで寄せられた。

 また、ジャーナリストの取材にも少なからず応えた。彼らは「AWSの顧客がこの障害の影響で、大挙して逃げ出したり、マルチクラウド化を進めたりしている」というストーリーを前面に押し出そうとしていた。私が読んだこのテーマに関する記事は全て、事実と異なることを暗示しようと躍起になっていた。

 確かに、多くの企業は複数のクラウドプロバイダーを利用している。だが、それはレジリエンスを求めてではなく、組織内の好みの違いから、複数のプロバイダーを採用することになったからだ。

 いずれにせよ、あの障害から数カ月たった今も、私はあの障害について顧客と話をしている(私の同僚もそうだ)。このことは、あの障害が、顧客にいかに大きな不安を与えたかということを示している。その中には、他のクラウドプロバイダーの顧客も含まれる。

 実際、あの障害は、その影響を免れた多くのAWS顧客にも大きな不安を与えている。彼らが影響を免れられたのは、US-East-1を利用していない、あるいは他のリージョンへのフェイルオーバーが計画通りに行われたからだった。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。