どうやってベテランエンジニア並みのスキルを手に入れる? 「AIドリブンな運用」が導く解決策とは生成AIを介してノウハウを継承

適材適所でクラウドサービスを使い分けることが一般的になり、運用管理に求められる要件はますます複雑化している。こうした課題の解決に向けて、生成AIを運用管理製品に組み込む動きがある。ベテランエンジニアでないと迅速な判断が難しい運用業務を、生成AIはどのように解決に導くのか。

» 2024年11月18日 10時00分 公開
[PR/@IT]
PR

 AI(人工知能)技術の進化によって、IT運用の現場は大きく変貌しつつある。そんな中「AIドリブン運用によるハイブリッドクラウド運用の自動化」をテーマにしたセミナー「Hinemos World 2024」が、2024年11月8日に開催された。NTTデータ先端技術が提供しているITシステムの監視やジョブ管理、運用自動化で定評のある統合運用管理ソフトウェア「Hinemos」は、AI技術をさまざまな機能に取り込み、これまでにない価値を提供し始めている。セミナーの注目セッションを中心に、Hinemosの目指す世界観や機能の特徴、期待できるメリットなどをダイジェストで紹介しよう。

AIアシスタントの支援を受けた運用管理、何が劇的に変わるのか?

 システムが複雑化する中で運用管理の重要性はますます高まり、運用担当者の負荷は増大している。運用効率化を追求しながら、いままで以上にビジネスに貢献するにはどうすればいいのか。

内山氏 内山勇作氏

 NTTデータ先端技術はそうした悩みに向き合い、AIドリブンなハイブリッドクラウド運用の自動化を推進している。Hinemosは生成AIを用いてインシデント対応や分析から属人性を排除し、システム運用を自動化、効率化する「システム運用AIアシスタント」の実証実験中だ。NTTデータ先端技術の内山勇作氏はこう説明する。

 「運用管理ではエンジニアのスキルに基づく広範囲な分析が求められるので、属人性の課題があります。Hinemosのシステム運用AIアシスタントが目指すのは、システムが持つ固有の情報と、NTTデータ先端技術が持つナレッジなどのさまざまな情報を組み合わせて統合的に処理し、運用を高度化することです」(内山氏)

 2005年にOSS(オープンソースソフトウェア)として誕生したHinemosは、19年の歴史の中で幅広い企業に採用されてきた。累計ダウンロード数は90万を超え、1000を超えるシステムが稼働している。その間、世の中のニーズや技術動向に合わせてさまざまな機能を提供してきた。

 内山氏によると、Hinemosの特徴は大きく分けて5つにまとめられる。

  1. 全機能をワンパッケージで提供し、ライセンス費用、機能間連携、エンジニア育成といった課題を解決できる
  2. 日本語表示と日本語サポートを標準としている
  3. 作り込みは必要なく、GUI(グラフィカルユーザーインタフェース)で直感的な操作が可能で、オペレーターの使い勝手を追求している
  4. ミッションクリティカル領域に強みを持ち、仮想化環境やクラウドサービスの運用管理も可能
  5. 生成AIを運用管理に取り込む「AIドリブン運用」の推進
図1 Hinemosの特徴(出典:NTTデータ先端技術の提供資料)《クリックで拡大》

 「機能面では特に『情報収集と蓄積』『監視、視覚化、異常検知』『自動化の集約管理』に強みを持ちます。近年のトピックとしては『Nutanix Cloud Platform』を含めた統合管理が可能になったこと、生成AIを用いてルール生成をサポートするHinemosメッセージフィルタの機能強化、マルチクラウド対応を強化した新バージョン(Hinemos ver.7.1)のリリースなど、機能拡充を続けています」(内山氏)

 内山氏は「AIドリブン運用を実現するHinemosは、運用管理のスピードと生産性を飛躍的に向上させるでしょう」と強調する。

生成AIで「ベテランしか判断できないこと」を補う

 NTTデータ先端技術の荒居優太氏は、生成AIによって複雑化する運用業務を効率化させ、本質的なシステム運用管理を実現するユースケースについて解説した。

 組織内外のさまざまなITデバイスから収集するビッグデータを基に、AI技術を用いて運用の自動化と高度化を図る「AIOps」の取り組みが広がりつつある。この流れに生成AIを組み込めば、標準化や自動化は加速し、AIドリブン運用の理想形に近づく。

荒居様 荒居優太氏

 荒居氏は、AIドリブン運用によって期待できる効果は3つある、と説明する。

  1. システム運用品質の向上
  2. 故障対応や運用改善のアジリティ(俊敏性)向上
  3. システム運用コストの低減

 これを体現するのが、Hinemosのシステム運用AIアシスタントだ。障害発生時に過去のナレッジから対処法のアドバイスを受けたり、システム要件と構成に合わせた監視の設計を自動生成したり、クラウドサービスの性能や課金情報からコスト削減のアドバイスを受けられたりするようになる。生成AIを用いた運用自動化のルール自動生成は、Hinemosメッセージフィルタの機能強化という形でリリース済みだ。

 「Hinemosメッセージフィルタはルールエンジンを活用し、監視やジョブ実行結果といったさまざまなイベントから自動化アクションを行います。自動化アクションを行うためには、運用者が実行判断ルールのロジックをスクリプトで実装する必要があります。Hinemosメッセージフィルタの新バージョン(ver.1.1.3)では、専門知識が必要だった実行判断ルールを自然言語で指示することで、ルールの生成や解説、権利情報の参照有無の確認も可能です。メンテナンスの負荷をさらに軽減し、運用自動化のサイクルを加速するでしょう」(荒居氏)

図2 Hinemosのシステム運用AIアシスタント構想(出典:NTTデータ先端技術の提供資料)《クリックで拡大》

 他にも荒居氏は、AI基盤を含めた統合運用管理がHinemosで可能だという点に言及。生成AI基盤として「Azure OpenAI Service」などを利用するシーンが増えつつある。Azureとの連携を自前で維持管理するのは大変だが、HinemosにはAI基盤に特有の課題や管理項目を踏まえた機能があり、システム全体の一元管理が可能になっている。

エラー対処の自動判断を目指し、生成AIとRAGを活用

 生成AIを用いた過去インシデント情報の管理と活用についても、同社は製品化に向けて取り組んでいる。荒居氏の講演の中で、一部の機能を紹介するデモンストレーションがあった。

 インシデント管理は、ITサービスの運用において発生するインシデントを迅速に特定、記録、解決するプロセスだが、適切に実施する上ではさまざまな課題がある。インシデント管理の課題は3つに大別できる、と荒居氏は説明する。

 1つ目は、効果的なインシデントの蓄積と検索の難しさだ。「検索語の選出は難しいため、活用できる状態でインシデントの情報が蓄積されないのです」と同氏は語る。

 2つ目は、次につなげるアクションの提示が難しいことだ。過去のインシデントを検索できても、参考にするだけではアクションに結び付けにくく、有識者でないと判断できない状況が生まれてしまう。

 3つ目は、仕様書や設計書類を含めた検索にまつわる課題だ。「ドキュメントの横断検索が必要ですが、実現は難しい。未知のインシデントの調査は特に有識者への依存度が高くなりがちです。分かりやすい表現で簡易検索する機能が求められます」(荒居氏)

 これまで、検索語の選出や情報の蓄積は有識者の手作業に依存していた。複数のユーザーが協力して情報を分類、登録する過程では大きな手間がかかる。情報を蓄積しても、検索結果からの判断に知識や経験が必要だと属人化の問題は排除しきれない。次につながるアクションが提示されないと、有識者以外では判断できず、初動対応の遅延につながる。ドキュメント検索が難しく情報を使いこなせない状態では、ベテランのナレッジが継承されないことも問題だ。

 これらの課題を解決できれば、早急な対処(原因の特定、影響範囲の見極め、復旧)が可能になり、ビジネス継続に大きく貢献できるはずだ。「生成AIがあれば、名寄せやログフォーマットを加味した検索文の生成が可能です。蓄積されたインシデント情報の内容をチェックしたり、手順書からインシデントデータを補完したりすることも可能です。生成AIの支援によって平易な表現で次のアクションを提示できれば、オペレーターの初動を早められ、解決までのスピードは加速するでしょう」(荒居氏)

 こうした課題解決を目指して、Hinemosは生成AIとRAG(検索拡張生成)を活用したエラー対処の自動判断システムを構築しようとしている。「生成AIが検索語を考え、さまざまな情報から原因や対応策を考え、次のアクションまで含めた状態でインシデント起票を行います。これにより迅速な初動対応をアシストできます。例えば、運用担当者は、検索で抽出された過去インシデントの内容を簡単に確認でき、考えられる原因や原因ごとの切り分け方法や対処を得られるようになります」と荒居氏は説明する。

クラウド専用機能やクラスタ構成を提供、クラウドのメリットを最大化

中島氏 中島洋祐氏

 ハイブリッドクラウドやマルチクラウドのシステム基盤が普及する昨今、運用の複雑性の問題は常につきまとう。効率化を求めて運用管理製品を導入したにもかかわらず、利用したいクラウドサービスに対応する機能が不足していたために、かえって運用が非効率になったり、コスト高になったりするケースは残念ながら存在する。

 既存の運用管理製品が抱えるクラウド運用管理の代表的な課題について、NTTデータ先端技術の中島洋祐氏が挙げるのは次の4つだ。

  1. 使いたいクラウドに対して、運用管理製品が動作サポートしていない
  2. 使いたいクラウドで、運用管理製品がクラスタ構成を組めない
  3. 運用管理製品のライセンス体系が複雑でクラウド環境において高額になりがち
  4. オンプレミスシステムとは違う、クラウドサービスの特徴に対応した運用が必要

 「クラウドインフラが普及するほど、クラウドならではの運用管理が必要になってきます。Hinemosはこれらの課題に応えられる運用管理製品です」と中島氏は強調する。

 Hinemosは動作環境としてさまざまなクラウドをサポートしていて、クラウド専用機能の対象プラットフォームも「Amazon Web Service」(AWS)、「Microsoft Azure」「Google Cloud」「Oracle Cloud Infrastructure」(OCI)、Nutanix Cloud Platformと幅広い。「クラウドの特徴を踏まえ、リソース自動抽出や専用リソース監視、リソース制御、双方向通知、ログ監視など、クラウド運用を効率化するクラウド専用機能を提供しています」(中島氏)。ライセンス体系もCPUコア数や管理対象数に依存しないシンプルなものになっているため、運用管理製品のコストを意識せずに、クラウドならではの価値を引き出せるという。

図3 Hinemosでクラウドの特徴を引き出す(出典:NTTデータ先端技術の提供資料)《クリックで拡大》

 ハイブリッドクラウドやマルチクラウドの管理にHinemosを活用した事例は多数あるという。AWSでコンテナを活用したシステムの一元管理(サービス業)、オンプレミスとMicrosoft Azureによるハイブリッド環境の統合管理(金融業)、監視とジョブ管理のマネージドサービス利用(公共)など、業種業態も幅広い。

 Hinemos World 2024は、オンデマンド配信で視聴可能だ。運用管理の重要性が高まるいま、AIドリブン運用によるシステム変革を目指すヒントをつかんでほしい。

イベントバナー

Copyright © ITmedia, Inc. All Rights Reserved.


提供:NTTデータ先端技術株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2024年12月17日