Uptime.com、2020年上半期のWebサーバダウンタイムレポートを発表:金融、ヘルスケア、ソーシャルおよびITなど5業種別
Uptime.comは、2020年上半期に世界6000以上の主要Webサイトで発生した障害やダウンタイムの状況などを業種別にまとめたレポートを発表した。
Webサイトのアップタイムやパフォーマンスを向上させるソリューションを提供するUptime.comは2020年7月8日(米国時間)、2020年上半期に世界6000以上の主要Webサイトで発生した障害やダウンタイムの状況などを業種別にまとめた初の半期レポート「Semiannual Report of Unplanned Server Downtime | 2020 Q2」を発表した。
Uptime.comは、世界のさまざまな地域でホストされているWebサイトをモニタリングしており、これらのサイトのメインランディングまたはログインページに3分ごとに接続し、サーバのパフォーマンス指標とダウンタイムインシデント(計画されたものと予定外のものの両方)を記録している。同レポートはその結果を、各種ビジネス、電子商取引、金融、ヘルスケア、ソーシャルおよびITという業種別に要約して報告している。
業種別の総ダウンタイム(出典:◆Uptime.com◇https://uptime.com/blog/semiannual-report-of-unplanned-server-downtime-2020-q1-q2◆)
予定外のサーバダウンタイム:各種ビジネス
主要サイト - 各種ビジネス(2020年1月1日〜6月15日)
アップタイム:99.92%
障害件数:765
総ダウンタイム:6日1時間
平均レスポンスタイム:1.21秒
証明書の失効問題と防止できる障害
Uptime.comは、証明書が失効する可能性や、外部システムで障害が発生する可能性があることが分かっているにもかかわらず、必要な対策を取っていない企業が多いと警告している。
さらに、BitfieldConsulting.comのコンサルタントで、インフラの信頼性の専門家であるジョン・アランデル氏の次のような見解を紹介している。
「多くのエンジニアは障害について考えることに慣れていない。エンジニアは作り手であり、当然のことながら、作ったものがずっと機能し続けると考える。だが、行き過ぎた楽観は禁物だ。大きな橋やトンネルは、設備が綿密に作り込まれ、定期的に負荷や損耗がモニタリングされ、機動的に保守が行われ、トラブルの兆候がわずかでもあれば、エンジニアにアラートが送られる。オンラインインフラについても、同様の姿勢で取り組むべきだ。実のところ、橋のバックアップはなかなか造れないことを考えれば、オンラインインフラの方が、レジリエンス(回復力)を組み込みやすい」(アランデル氏)
予定外のサーバダウンタイム:電子商取引
主要サイト - 電子商取引(2020年1月1日〜6月15日)
アップタイム:99.96%
障害件数:198
総ダウンタイム:2日23時間
平均レスポンスタイム:1.74秒
ユーザーの信頼とアップタイム
電子商取引では、信頼とタイミングが肝心だ。ユーザーの信頼を築き、適切なタイミングで商品やサービスを提供するための基盤となるのが、インフラの信頼性だ。電子商取引業界の上半期のダウンタイムとアップタイムは、新型コロナウイルス感染症(COVID-19)の世界的流行を考慮すると、目覚ましい数字だ。
電子商取引では、資産の稼働、取引の完了、ユーザーの登録、マーケティングなど、バランスを取るべき項目がたくさんある。現状では、安定性に関する実績が強力なので、レスポンスタイムを改善するために何ができるかが検討に値する。1.74秒も立派な数字だが、事業を拡大する過程では、常に現状改善の余地がある。
予定外のサーバダウンタイム:金融
主要サイト - 金融(2020年1月1日〜6月15日)
アップタイム:99.83%
障害件数:766
総ダウンタイム:7日23時間
平均レスポンスタイム:1.52秒
金融サービス会社は、ダウンタイムに影響する「サービスの相互接続化」「サイバー攻撃の増大」というトレンドに備えるべきだ。2020年に入って、これらのトレンドに連なるインシデントが相次いだ。
例えば、外貨両替大手のTravelexがマルウェアの被害に遭い、一部のサービスを一時停止したことで、消費者に加え、金融機関や旅行、宿泊といった業界の企業が影響を被った。株取引アプリを手掛けるRobinhoodも、システム障害でサービスの一時停止を余儀なくされた。
金融会社は、こうしたインシデントを警告として深刻に受け止めるべきだ。現在は大手企業の障害が広く報じられているが、Uptime.comが蓄積してきたサイトモニタリングデータは、こうした障害の問題が金融業界に広がっている可能性を示唆している。
予定外のサーバダウンタイム:ヘルスケア
主要サイト - ヘルスケア(2020年1月1日〜6月15日)
アップタイム:99.34%
障害件数:120
総ダウンタイム:28日17時間
平均レスポンスタイム:637ミリ秒
懸念されるランサムウェア攻撃
患者記録のメンテナンスとヘルスケアサービスの向上は、世界的な課題となっている。こうした課題への対応にはインターネット接続が必要となるが、インターネットでは、サイバー犯罪者が獲物を狙って手ぐすね引いている。
ヘルスケア業界では、障害件数が比較的少ないのに対し、ダウンタイムが長い。このことは、ヘルスケア業界のDevOpsでは障害復旧時間が、見過ごされている大きな要素であることを示している。これは、高負荷の下でサービスを支えられるインフラがないか、あるいは障害復旧時間を短縮する効果的な施策が取られていないということだ。
ランサムウェア攻撃は全世界で、インターネットに接続している企業に200億ドルの損害をもたらすと予想されている。ヘルスケア業界におけるダウンタイムの長さは、この業界がこうした攻撃に弱いことを示していると、Uptime.comはみている。
予定外のサーバダウンタイム:ソーシャルとIT
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 2020年2月に発生した大手Webサイトの大規模障害について解説、Uptime.com
Uptime.comは、企業Webサイトなどで2020年2月に発生した大規模なサービス停止事例をまとめたレポート「February 2020 Downtime Report」を発表した。「Microsoft Teams」「GitHub」「Google Nest」などの事例を扱っている。 - Cloudflare、毎秒7億5400万パケットのDDoS攻撃に自動処理で対応
Cloudflareは2020年6月に起きた大規模DDoS攻撃に対して自動処理だけで対応できたと発表した。4日間にわたる攻撃では毎秒4〜6億パケットを頻繁に超え、最大毎秒7億5400万パケットに達していた。 - 障害対応の属人化を防ぐ――freeeのSREが実践する情報共有術
サービスで発生する障害をゼロにすることは難しい。では、障害をゼロに近づけるために誰が何をしていくか。freeeのSREが大規模障害で学んだことや、障害を減らすための取り組みを紹介した。