インシデント対応の自動化と日常業務への応用:Gartner Insights Pickup(273)
インシデント対応の自動化ワークフローは、解決プロセスが人間の介在なしに進むことに価値がある。それには、人間の信頼が必要だ。
ガートナーの米国本社発のオフィシャルサイト「Smarter with Gartner」と、ガートナー アナリストらのブログサイト「Gartner Blog Network」から、@IT編集部が独自の視点で“読むべき記事”をピックアップして翻訳。グローバルのITトレンドを先取りし「今、何が起きているのか、起きようとしているのか」を展望する。
私は以前自動化アーキテクトとして働いていたころ、あるアイデアに強い興味を持った。
そのアイデアは、私たちがインシデント対応の最初の自動化ワークフローを構築したことで実現された。そのワークフローは、あまり洗練されていなかった。ファイルシステムの容量が少なくなるとトリアージを実行し、その情報を盛り込んだチケットを送信し、アクションにつなげるというものだ。ITサービスマネジメント(ITSM)プラットフォームで作成されるインシデントがトリガーになっていた点がユニークだった。
このアイデアの真価は、何ができるかを組織が理解するための一般的なフレームワークを示したことにある。そして、このワークフローでできることは、イベントドリブンの自動化だった。
私たちはその後すぐに、問題の修正を自動化するステップを追加し、このワークフローを改善した。これにより、同じワークフローで突然、数百のチケットを処理できるようになり、人間が対処措置を講じることはまれになった。非常に優秀な人材チームがその実現に奮闘し、成功を収めた。
このワークフローはどんな価値をもたらしたのか。インシデントの発生後に、解決プロセスが人間の作業を待つことなく、自動的に高速実行されるようになったことに価値がある。
人間がチケットを見なくても、自動的に解決が進む
これは、自動インシデント対応にとってどんな意味を持つのか。この機能の構築自体は簡単だが、以下ではこのトピックから、一筋縄ではいかない2つのテーマを取り上げたい。
- インシデント対応には人間からの信頼が必要であり、その点に注意しなければならない
- インシデントはITの概念だが、さまざまな(ビジネスの)文脈に当てはまる
インシデント対応には人間からの信頼が必要であることに要注意
IT業界で長く働いてきた経験から、インシデント対応とはパターン化のことであり、個別の事象に対応することではないと理解している。
インシデント対応は、よく理解されている分野だ。
- 監視によって(場合によっては人間が)異常やエラーを検出する
- インシデントが発生する
- インシデントが修正エージェントに送られる
- 対処が行われる
- インシデントが解決され、クローズする
- 次の業務に取り掛かる
これがインシデント対応のパターンだ。だが、このプロセスには学習が欠けている。
私たちはインシデントからどのように学べるのか。本来なら、次の点について学ぶことができる。「インシデント解決に何が効果的だったか」「このインシデントは過去にどんな頻度で発生していたか」「インシデントが停止する前に発せられるシグナルはあるか」「このインシデントはどの程度破壊的か」
だが、私たちはインシデントに対応しても、これらから学び、それを蓄積することをしない。私は、私たちがインシデント対応で大局を見誤るのは、インシデント対応プロセスが人間の行動に根ざしているからだと確信している。
このプロセスを自動化し、人間をこのプロセスから排除するには、自動化自体が人間から信頼される必要がある。自動化システムの信頼性に責任を負うのは、人間だからだ。
そこで、信頼が極めて重要な要素になる。人間が自動処理を信頼し、実際の自動処理結果をオープンに、透明性が高く、協調的に扱うようにすれば信頼が構築される。一方、何か問題が発生した場合は、人間がオープンに、透明性が高く、説明責任を果たし、迅速に、問題を当事者として認めるだけでなく対応する必要がある。
インシデントはITの概念だが、異なる(ビジネスの)文脈に当てはまる
詰まるところ、インシデントとはルールが適用されたイベントだ。適用されるルールは、イベントがどこで発生したかによって異なるが、インシデント対応のパターンは同じだ。では、なぜこのことに注目するのか。インフラとオペレーションの担当チームにチャンスがあると思うからだ。それは、IT関連のインシデントについて知っていることや得意なことを、ビジネスイベントにも応用するチャンスだ。
私たち人間が行う全ての事務管理業務と、「やるべきことが電子メールに埋もれてしまった」という話を聞いた回数を考えてみよう。それらは、送信ルールしか適用されていないイベントといえる。それは適切な人間に送られ、その人間が、頭の中にあるワークフローを実行することで処理する。
こうしたイベントにルールを適用して、ユーザーに行動を起こさせることができたらどうなるだろうか。例えば、承認プロセスのように、ある文書を特定の順番で複数の人に回覧してもらい、それぞれから署名を得る必要があるとする。1つの方法は、それぞれの人に個別にメールで依頼しておき、全員の署名が終わるのを待つというものだ。
代わりに、自動化されたワークフローで承認チェーンを定義することで、チェーンの最初のユーザーに署名を求めるだけでなく、署名が得られたら、すぐに次のユーザーに署名を求められるとしたらどうなるだろうか。もちろん、プロセスは依然として人間に依存するが、ボトルネックがどこにあるか(どの人か)を知ることができるだけでなく、トレンドデータも入手できる。
これは荒唐無稽な想定ではない。われわれの日常業務は、すぐに自動化できる繰り返し作業が多い。それらを自動化すれば、貴重な時間を有効活用できる。繰り返し作業に時間を取られずに、やるべきことに集中できるようになる。
自動化のチャンス
インフラとオペレーションの担当チームには、こうした自動化のチャンスを生かしてもらいたい。インシデント対応の自動化を成功させる知識やノウハウは、イベント対応の自動化にもすぐに転用できる。イベント対応の自動化の知識やノウハウを広く応用すれば、チームは社内外の顧客にとって、より価値のある存在になる。そうすることが可視化、改善、信頼をもたらすからだ。それは顧客が抱える問題の解決につながり、価値を生み出す。
出典:Automated Incident Response is just the beginning.(Gartner Blog Network)
筆者 Chris Saunderson
Sr Director Analyst
Copyright © ITmedia, Inc. All Rights Reserved.