Datadog、無料で30以上のSaaS、13のAWSサービスの障害をリアルタイムで確認できる「Updog.ai」を公開:「公式発表を待たずに障害状況を把握できる」 その仕組みとは?
Datadogは、OpenAI、Zoom、GitHub、Slack、Stripeといった30以上の主要SaaSと13のAWSサービスの健全性を確認できるWebサイト「Updog.ai」を無料公開した。
Datadogは2025年10月21日(米国時間)、主要SaaSプロバイダーやAmazon Web Services(AWS)サービスの健全性ステータスをリアルタイムで表示する無料のWebサイト「Updog.ai」を公開した。
Updog.aiは、OpenAI、Zoom、GitHub、Slack、Stripeといった30以上の主要SaaSと「Amazon Simple Storage Service」(Amazon S3)や「AWS Lambda」など13のAWSサービスの健全性を単一のダッシュボードで提供する。
「公式発表を待たずに、障害の実態を把握できる」 その仕組みとは?
Updog.aiの最大の特徴は、SaaSプロバイダーが管理、更新しているステータスページの情報に依存していない点だ。
Datadogが持つ数千の組織から集約、匿名化された膨大なAPM(アプリケーションパフォーマンスモニタリング)テレメトリーデータと、異常なエラー発生を推定するベイジアンモデルを活用して、健全性を判定する。
これにより、ITエンジニアは障害発生時、問題が自社システム固有のものなのか、広範囲で発生しているインシデントの影響を受けているのかを迅速に確認できるという。Datadogによると、「Amazon DynamoDB」で最近起きたパフォーマンス低下を、AWSが自身のステータスページを更新する32分前に検知した事例もあるという。
またUpdog.aiはサービスの健全性について過去90日間のデータを提供する。特定のサービスで繰り返し発生している不具合などを特定し、アーキテクチャ設計やSaaS選定時の情報として活用できる。今後、GPUリソースの可用性、スポットインスタンスの中断予測、サイバー攻撃や攻撃ベクトル(経路)に関する情報公開にも取り組む計画だとしている。
パブリッククラウドやSaaSへの依存度が高まるにつれ、外部サービスのパフォーマンス低下やインシデントが自社のビジネスに与える影響は無視できない状況となっている。
障害発生時に迅速な原因の切り分けが求められる中、客観的な観測データに基づく情報は、インシデント対応の初動を判断する上で重要だ。サービスプロバイダーに依存しない情報源は、自社の監視体制を補完し、状況判断の精度を高める上で有効な手段の一つといえるだろう。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
ランサムウェア攻撃が相次ぐ今、100兆件超の兆候を分析したMicrosoftが10のセキュリティ対策を提言
Microsoftはサイバーセキュリティ動向に関する年次レポート「Microsoft Digital Defense Report 2025」を公開した。サイバー攻撃の現状、主要な標的、国家が関与する攻撃の脅威、AI活用の動向に焦点を当て、組織に求められる10の取り組みを紹介したものだ。
高まる特定クラウド依存のリスク 企業が取るべき5つの対策とは
SaaS、PaaS、IaaSのいずれをとっても、企業の間で特定のクラウドに依存する傾向が顕著になっている。これにより、事業の継続性に大きな打撃を与えるリスクが高まっている。ではどういう対策が打てるのだろうか。段階的に進められる5つの対策を解説する。
ダウンディテクター
ダウンディテクターは、通信プロバイダーや自分がよく使うWebサービスなどがダウンしているかどうかをリアルタイムで監視してくれるサービスだ。
