「AIOps」で人手作業、属人化を解消する方法生成AIの進化でIT運用業務はどう変わる?

ITシステム運用は従来のように安定性と信頼性を維持するだけでなく、ビジネスニーズに素早く応える必要がある。2023年10月に@ITが主催したセミナーに登壇したNTTデータ先端技術の大上貴充氏は、急激に進化する「生成AI」をどうIT運用業務に適用できるのか、運用効率化、自動化の具体的なアプローチを交えて紹介した。

» 2023年11月13日 10時00分 公開
[PR/@IT]
PR

 ITシステム運用の世界が大きく変わりつつある。背景にあるのは、デジタルトランスフォーメーション(DX)の推進による経営環境の変化だ。クラウドサービスの活用や働き方の多様化、セキュリティ事故やシステムトラブルへの対応など、ITシステム運用は従来のように安定性と信頼性を維持するだけでなく、ビジネスニーズに素早く応える必要がある。

 @ITが2023年10月24日に開催したセミナー「ついに解決、積年の課題にさようなら――統合運用管理 本当のキモとITSMのポイント(特別編集版)」で「DXの推進はシステム運用から! AIドリブン運用による運用効率化の実現」と題して講演したNTTデータ先端技術の大上貴充氏(ソフトウェアソリューション事業本部 デジタルソリューション事業部 サービスマネジメント担当 担当部長)の講演内容をお届けする。

生成AIの登場で新たなステージに入ったAIOps

 大上氏は、ITシステム運用を取り巻く課題はIT運用現場と企業の問題の両面にあると指摘し、こう話す。

NTTデータ先端技術 大上貴充氏

 「ITシステム運用の現場はまだまだ属人的な要素が多く残っています。24時間輪番など人手に頼る労働集約型業務が多く、運用管理ツールやMicrosoft Excel、RPA(ロボティックプロセスオートメーション)など複数のツールを組み合わせた運用となっています。プロセス、ナレッジも属人化し、有能な社員への依存も強く、世代交代も進まない状況です。一方、企業の問題として、オンプレミスとクラウド環境の混在に伴うITシステム管理の複雑化や、情報漏えい/不正アクセス対策などのセキュリティ要件の高まりが生じています。ITサービスの提供はビジネスに直結するため、安定運用への要求はさらに高まっています。加えて、リモート勤務による働き方改革への対応も求められています。DXを推進するためには、IT運用の自動化、効率化は必須です」

 そうした中で、新たな運用手法として提案されるようになったのが「xOps」だ。xOpsとは、開発と運用の融合を目指すDevOpsや、セキュリティ担保を目指すSecOps、クラウド利用の最適化を目指すCloudOps、運用へのAI(人工知能)活用を目指すAIOps、運用の完全な自動化を目指すNoOpsなどを総称したものだ。

 「システム運用の品質向上や効率化のために、さまざまな運用手法が提案されています。注目したいのはAIOpsです。AIOpsでは、システム運用の業務にデータサイエンスのアルゴリズムやAIの技術を適用することで、さらなる自動化や効率化を図ります。AIチャットbotによる自動応答や、ルールエンジンを用いたイベント集約やイベントの自動分類、異常検知技術を使った故障の予兆検知や故障の根本原因分析などです。生成AIの進化により、AIのシステム運用への活用は新たなステージに入っています」

 AIOpsを現場に適用するためには課題もあった。学習に大量のデータが必要なことや、AIを活用できる人材の育成、期待した成果につながらないなどだ。しかし、生成AIが進化し、事前学習済みのモデルを活用できるようになったことで、学習コストや人材、導入の難易度といった課題は解消されつつあるという。

AIドリブン運用がもたらす品質向上、アジリティ向上、コスト低減

 もっとも、運用現場でAIを活用する際には注意点もある。大上氏は「AI活用を目的化しないようにすること」を挙げた。何を実現するためにAIを活用するのかという視点を常に持っておくことが求められるという。

 「NTTデータ先端技術でもAI活用を目的化せず、何を実現するためにAIを活用するのかという視点から、製品やソリューション開発を進めています。『INTELLILINK統合運用ソリューション』では、システムの可用性、性能/拡張性、セキュリティを保ち、運用のデジタル化、自動化の実現を目指しています。構成としては、運用ログの収集と管理、見える化、自動化などのシステム管理を担う『Hinemos』と、構成管理/インシデント管理、運用のデジタルワークフローを担うITSM/ITOM(ITサービスマネジメント/IT運用マネジメント)サービスを持つ『ServiceNow』という2つの製品が軸になっています。このソリューションで注力しているものの1つとして、AIOpsを提供しています」

 INTELLILINK統合運用ソリューションは、AIOpsだけではなく、設計、開発、セキュリティを含めたDevSecOpsや、APM(アプリケーションパフォーマンス管理)を含めたDevPerfOps、業務自動化や構築自動化によるNoOpsなどの機能を提供している。AIOpsを含めてこれらの機能で実現していく運用の将来像の一つが「AIドリブン運用」だ。

 「AIドリブン運用とは、人手作業で実施していたものをAIベースにすることで、飛躍的に運用を効率化し、生産性の向上を実現するものです。AIドリブン運用で得られる効果は大きく分けて3つあります。システム運用品質の向上、故障対応や運用改善のアジリティ向上、システム運用コストの低減です」

AIドリブン運用による、監視、故障対応の効率化

 ここでカギになるのが生成AIだ。運用現場が直面している課題として、障害対処の現場では「過去ナレッジは蓄積しているが、探し出せず記憶と経験に基づいて判断する」ケースがよく見られる。監視設計の現場では「要件とシステム構成から機械的に作成できるはずなのに、毎回人手による設計作業が発生する」、クラウド運用の現場では「使用しているクラウドの支出が適正か分からない」といった課題がある。

 「生成AIを活用すると、障害発生時に過去ナレッジから対処法をアドバイスしたり、要件とシステム構成に合わせた監視設計を自動生成したりすることができます。クラウドの性能、課金情報からコスト削減をアドバイスすることも可能です。この他にもさまざまな活用が考えられます」

メッセージフィルタを用いてインテリジェントなアラートと自動化を実現

 こうしたAIドリブン運用を実現するソリューションの中核となるのが、NTTデータ先端技術が開発する統合運用管理ソフトウェアHinemosだ。

 「Hinemosの強みは、システムのあらゆる情報を収集、蓄積、見える化し、見える化した結果のイベントを元に自動化につなげる機能をワンパッケージで提供することです。Hinemosは多彩な機能、サービスを提供しています。ログの収集では、ITのありとあらゆるデータを収集、蓄積し、蓄積データの管理と監視、自動化への活用を実現します。システムの見える化では、リアルタイムなシステム運用状況の監視、視覚化と、将来予測や変化量による異常を検知します。また、Hinemosによる自動化では、ジョブ、ワークフロー、仮想環境/クラウドのリソース制御、パッケージ構成の最新化、RPAのさまざまな自動化を集約管理します。この他にも、クラウドの特徴に応じた運用を実現するクラウド管理機能、クラウドを含めて可用性を担保するためのミッションクリティカル機能、セキュリティを担保するためのサービスなどを提供します」

統合運用管理ソフトウェアHinemos

 Hinemosを使うことで、イベントの中から真に意味のあるイベントに絞り込み、自動対応を実現できる。これにより、属人性を排し、即応性とレジリエンス性を高められるという。コアコンポーネントとなるのが、Hinemosメッセージフィルタだ

 「さまざまな事象検知のために大量のメッセージが発生し、本質的なイベントを発見することが困難になることもあります。Hinemosメッセージフィルタは、ルールエンジンを活用し、複数あるイベントの中から真に意味のあるイベントに絞り込み、そのイベントを契機としたアクションを実行できる機能です。具体的には、インテリジェントなアラートと自動化があります」

 インテリジェントなアラートとは、不要なメッセージの抑制と関連メッセージの集約により、本質的なイベントの対処に注力できるようにするものだ。例えば、複数のサーバに対するネットワーク疎通が不能になったことに起因したアラートが発生した場合、サーバに関するアラートではなく、障害の原因となった特定のスイッチの故障に関するアラートだけを届けるといったことができる。

 インテリジェントな自動化とは、本質的なメッセージから直ちに通報、インシデント連携、ジョブフロー、ワークフロー起動、監視制御といった運用業務に連動できる機能だ。人が判断しなくても、ルールに応じた自動対応が可能だ。

ルールベース+生成AIで説明可能性とメンテナンス性を両立

 Hinemosメッセージフィルタは、ルールベースのAIに基づいている。ルールベースというと、時代遅れなイメージも持たれがちだが、大上氏はルールベースを採用している理由を、こう話す。

 「発生したイベントに対して自動的にアクションを実行する場合、自動化の判断ロジックが説明可能かどうかが重要です。ロジックが明確でないと、意図しない処理が実行された場合、なぜそのアクションが実行されたのか分析が難しくなるためです。ルールベースなら、ルールを見れば何を基にどう判断したかが明確に分かります。本来実行したい処理に変更する場合も、ルール変更により確実に判断ロジックを修正できます」

 AIの中には、判断ロジックが明確でないものもあり、その場合、どうしてその判断になったか明確に説明できない。そのため、判断を状況によって変えるといったチューニングも的確にできないケースもある。

 「ルールベースにも課題があるのは確かです。ルール自体を作成すること、膨大なルールのメンテナンスが大変になります。何かしらのイベント集約、それに応じた自動実行ごとに新たなルールを定義する必要があります。作成、メンテナンスが増え、コストも増えていきます。こうした課題に対するアプローチとして有効なのが生成AIです。ルールベースで説明可能性を担保し、生成AIでルールを自動生成して効率化を実現します」

 生成AIによるルール生成は、例えば「ネットワーク機器1でメッセージにlinkdownが含まるイベントは通知しない」というように自然言語で指示すれば、ルールが自動で出力される形になるという。生成したルールは意図したものかどうかを確認する必要があるため、ルールのシミュレーションや試験が必要だ。そこで、メッセージフィルタ開発キットを使ってルールのシミュレーションと試験も実施できる。ルールを適用した後は、ルールの追加や変更の要件に応じて新たなルールを作ったり、変更したりする。

 「生成するイベントを定義し、そのイベントに対するアクションをルールとして定義することで、ルールを追加するたびに、手作業でやっていた作業を1つずつ自動化していくことができます」

生成AIによるルール作成

 大上氏は「生成AIの進化によりシステム運用業務へのAI適用は進みます。AIドリブン運用により、人手作業では成し得なかった飛躍的な生産性の向上が見込めます。Hinemosの機能を活用し、即応性とレジリエンス性を向上できる『イベント駆動による運用自動化』を実現してください」と述べ、講演を締めくくった。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:NTTデータ先端技術株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2023年11月30日

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。