「月間1万アラート地獄」から脱却、NTTドコモが5年で実現した“運用の進化”とは:外部監視センターへのアウトソースも不要に
PagerDutyはNTTドコモによるインシデント管理ツール導入事例を発表した。同社は5年間の継続的な改善によって、アラート削減や初動対応時間の短縮などの成果を創出してきた。
インシデント管理ツールを提供するPagerDutyは2026年3月31日、NTTドコモが5年にわたりPagerDutyを活用してきた事例を発表した。NTTドコモは2020年に導入して以来、複数のサービスとシステムにまたがる運用体制へとPagerDutyの活用範囲を広げ、DevOps体制の高度化に取り組んできたという。
外部監視センター依存を脱したNTTドコモの運用改革
PagerDutyを活用するNTTドコモの情報システム部門は、移動中の車内でLTE(Long Term Evolution)通信ができるサービス「docomo in Car Connect」や、留守番電話サービスの新機能「みえる留守電」など、さまざまサービスを支えるシステムの開発・運用を担っている。
月間1万件のアラートを大幅削減
PagerDuty導入前は複数の監視ツールから組織全体で月間1万件のアラートが発報されており、ノイズの削減が課題となっていた。属人的な連携や深夜の呼び出しも多く、運用効率化と対応負荷の軽減が求められていた。
PagerDuty導入後は、AIやルールエンジンの活用により不要なアラートを月間1万件から1000件へ削減し、「見るべき情報」を明確化した。適切な担当者を自動で呼び出す仕組みを整備したことで、初動時間を数時間から3分へと短縮した。非クリティカルな業務への対応時間は月間40時間削減され、外部の監視センターへの監視業務のアウトソースが不要になったとしている。
導入から5年が経過し、当初は2つだった監視対象のサービスは、6つのサービスへと拡大しているという。
5年間の継続改善から生まれた3つの成果
導入後5年間の継続改善を通じ、NTTドコモは以下の3点を実現した。
- 可視性の向上と部門間連携
- 単一画面で複数サービスの状況を横串で俯瞰(ふかん)できる体制を構築。IT部門だけでなくビジネス部門にも通知を送ることで、迅速な情報共有を実現
- プロセスの標準化と知見集約
- 「異常検知、確認(ACK)、ノート記載」の流れをルール化した。PagerDuty上に過去の類似事例や対応方針をナレッジとして蓄積し、属人化を排除
- 「プロアクティブ運用」の徹底
- 通知を「アラート(緊急)」と「ワーニング(警告)」に厳密に仕分け、ワーニングの段階で当日中に処置することで、顧客影響の顕在化を未然に防ぐ仕組みを確立
NTTドコモは「今後は、AIが過去の対応履歴を学習し、状況のまとめや原因分析、最適な対応方針の提案まで自動で行うことを目指す」としている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
仮想CTOが怒号、疑似SNSで炎上 インシデント対応を「eSports」に? 企業対抗でバトル
想像するだけで胃が痛くなるインシデント対応を、あえてeSportsのように競技化した企業対抗バトルが開催された。なぜインシデント対応を“エンタメ”に昇華したのか。仮想CTOの怒号が飛び、疑似SNSが炎上したコンテストの模様と、企画の裏側に迫った。
IPAが無料提供する「1000万円相当」のPSIRT構築・運用、支援先募集
IPAは、中小規模の製品開発者を対象に「PSIRT体制構築・運用支援」を無償提供すると発表した。通常1000万円以上かかる専門家のサポートを提供し、組織的なセキュリティ対応体制の整備を支援するという。
GitHub侵害で銀行連携停止 マネーフォワード事案が突き付ける開発リスク
マネーフォワードは認証情報漏えいによるGitHubへの不正アクセスを受け、ソースコードや一部個人情報が流出したと公表した。銀行連携機能まで一時停止に追い込まれた今回の事案は、開発現場に潜む見落とされがちなリスクを浮き彫りにしている。
「90日間ログ保持」はもう古い VPNの脆弱性やActive Directoryを悪用するランサムウェアの実態と対策
Mandiantは年次レポート「M-Trends 2026」を発表した。2025年に実施した50万時間以上のインシデント調査では、サイバー犯罪の分業化と連携の進展により、初期アクセスから攻撃実行グループへの引き継ぎ時間が2022年の8時間超から2025年には22秒に短縮されたことが明らかになった。