AWSの大規模障害から得たレジリエンスに関する教訓(後編)Gartner Insights Pickup(253)

われわれは、Amazon Web Services(AWS)の大規模障害からいくつかの教訓を得た。今回は、後編をお届けする。

» 2022年04月15日 05時00分 公開
[Lydia Leong, Gartner]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

ガートナーの米国本社発のオフィシャルサイト「Smarter with Gartner」と、ガートナー アナリストらのブログサイト「Gartner Blog Network」から、@IT編集部が独自の視点で“読むべき記事”をピックアップして翻訳。グローバルのITトレンドを先取りし「今、何が起きているのか、起きようとしているのか」を展望する。

※本稿は2022年2月に公開されたものです。>>〔前編〕はこちら

 空は落ちてこなかったし、落ちようともしていない。

 クラウドは、突然魅力的でなくなったわけでも、リスクが著しく高くなったわけでもない。毎度のことながら、アベイラビリティーゾーン(AZ)アーキテクチャは機能するが、もともとマルチAZとして設計されているリージョンサービスの問題は、極めて重要なアプリケーションには、マルチAZが不十分かもしれないということだ。

 リージョンをまたがったフェイルオーバーは、適切に設計されていれば機能する。ただし、高速でシームレスなフェイルオーバーとフェイルバックが重要だ。一般的に、これまでのクラウドの大きな障害は数時間続いたが、数日間は続かなかった。とはいえ、フェイルオーバーやフェイルバックが簡単にできない場合、障害が短時間で終わることを祈りながら待つことになりがちだ。

 確かに、米国東部(バージニア北部、US-EAST-1)では、多くの顧客にとって重大な問題が発生した。「Amazon API Gateway」(簡単にAPIの作成、公開、保守、モニタリング、保護できるフルマネージドサービス)が実質的にダウンしたが、多くの人が「AWS Lambda」(サーバレスのイベント駆動型コンピューティングサービス)を呼び出すためにAPI Gatewayに依存しており、かなりの顧客がミッションクリティカルな用途でLambdaを使用している。「Amazon Connect」(クラウド型コンタクトセンターサービス)もAPI Gatewayに依存しており、このサービスも影響を受けた。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。