「AIの活用」で変わるITインフラ監視は、IT担当者を救う最善手となるかインフラ全体を一気通貫でモニタリング

ビジネスのあらゆるシーンでITが活用されるいま、複雑化するITインフラの運用や監視はますます重要で、負荷の高い作業になっている。そこで期待されているのが「AI」を活用したITインフラ監視ツールだ。AIを活用した最新のITインフラ監視ツールとはどのようなものなのか。IT担当者をどうやって支援するのだろうか。

» 2021年10月26日 10時00分 公開
[PR/@IT]
PR

複雑化するITインフラでは「監視におけるAI活用」が重要に

 ビジネスのあらゆるシーンでITが利用されるようになる中、ITインフラの複雑性は増加している。特に近年は、IoT(モノのインターネット)やAI(人工知能)などの技術を活用し、ビジネスの仕組みそのものを変革するDX(デジタルトランスフォーメーション)の取り組みが活発化したことで、ITインフラの複雑化が加速している。一方、ITインフラ担当者は、ビジネスを支える多数の機器とサービスを少ないリソースで効率的に監視、管理してビジネスを支えていくことが強く求められている。

ALT デル・テクノロジーズ
データセンターソリューションズ事業統括
製品本部 シニアプロダクトマネージャー
岡野 家和 氏

 例えば、エンドユーザー向け業務アプリケーションの運用管理を見ても、ITインフラ担当者がカバーしなければならない領域は多岐にわたる。その代表例が、フロントエンドのアプリケーションの監視だ。常に障害が発生していないかどうかをモニタリングし、障害が発生した場合には直ちに対処しなければ、ビジネスがストップしてしまう恐れがある。対処に当たっては、バックエンドを構成するサーバやネットワーク、ストレージなどの監視やデータの分析も必要だ。また、物理的な機器だけでなく、仮想環境で動作する仮想マシンやコンテナ、セキュリティ、パフォーマンスも監視しなければならない。さらに、アプリケーションと連携する基幹システムやクラウドサービスの管理も求められる。

 実際、「ITインフラ環境の複雑化はビジネスリスクに直結するようになってきています」と話すのは、デル・テクノロジーズの岡野家和氏(データセンターソリューションズ事業統括 製品本部 シニアプロダクトマネージャー)だ。

 「ITインフラ環境とそのオペレーションが複雑化したことで、システム障害やセキュリティインシデントへの対応も複雑化しています。分析しなければならないシステムやデータが増え、素早く適切な対処が難しくなっています。機器やシステムの設定漏れや設定ミス、ポリシーの適用漏れがビジネスリスクにつながりやすくなっています」(岡野氏)

 一方、ビジネスリスクを回避するだけでなく、ビジネスを拡大していく上でも、ITインフラの管理には新しいアプローチが必要になってきているという。デル・テクノロジーズの相場宏二氏(カスタマーソリューションセンター センター長)は「データ分析やAIを活用した運用管理のアプローチが重要になってきています」と指摘し、次のように話す。

 「膨大なデータを機械学習や深層学習などのAI技術で分析し、将来的に何が起こりそうかを予測し、自動的にそれらに対処するというアプローチが重要になってきました。複雑化するITインフラの監視やデータ分析をAIで自動化し、環境変化に素早く柔軟に対処できるようにするのです。膨大な社内インフラの運用ではAIを活用して作業の優先度を明確にして、優先度の高い課題から解決することが重要になります」(相場氏)

 そうした中、デル・テクノロジーズでは、「データ分析やAIを活用した管理の自動化」に向けた新しいツールの提供を行っている。

「CloudIQ」がサーバとネットワーク機器にも対応 AI活用による予測分析機能も提供予定

ALT デル・テクノロジーズ
カスタマーソリューションセンター
センター長
相場 宏二 氏

 「Dell EMC CloudIQ」(以下、CloudIQ)は、システムが生成するさまざまなログやイベントデータをAI技術で分析し、ITリソースの性能予測や容量予測、障害予測をする運用管理ツール。クラウドベースのAIOpsアプリケーションとも言うべきSaaS(Software as a Service)であり、世界中のさまざまな拠点で生成されるテレメトリーデータをグローバルレベルで集約し、システム全体の稼働状況を把握するダッシュボードとして利用できる。

 「CloudIQはDell EMCのストレージ製品のためのツールとしてスタートしました。『システムの安定稼働のための知見と解析能力をビジネス成果につなげる』ことを製品コンセプトに掲げ、既に多くのユーザーがクラウドとAIの成果を享受しています。例えば、CloudIQを利用すると『現状のシステムをこのまま使い続けると、○カ月後にはディスク容量が不足する』といったことをグラフィカルにアラートしてくれます。そのアラートを見ながらプロアクティブに対処することで、システムを安定稼働させ、トラブルにもスピーディーに対処できるようになります。既に多くの稼働実績があり、CloudIQに接続されているデバイスは世界で6万台、収集されるテレメトリーデータは1日当たり400億件に達しています」(岡野氏)

 CloudIQはこれまでDell EMCのストレージ製品で広範囲に利用できたが、2021年8月に新たに「PowerEdge」サーバが、10月にはネットワークインフラである「PowerSwitch」が、相次ぎ対応製品に追加された。これにより、ハイパーコンバージド/コンバージドインフラ、サーバ、ストレージ、ネットワークからデータ保護インフラまでを、データ分析とAI技術の活用による一貫した監視の仕組みで統合できるようになる。

 「PowerEdgeサーバ向けには今後、段階的に機能をリリースしていく予定です。第1段リリースでは、将来強化を見据えたベース機能が提供されました。具体的には、『ポータル機能(オーバービューダッシュボード)』『監視&ハードウェアインベントリ』『システムのヘルス監視』『パフォーマンス監視』の4つです。これにより、単一のダッシュボードでさまざまな場所のシステム状況を監視し、リスクの低減や早期プランニングにつなげることが可能になります」(相場氏)

「OpenManage Enterprise」プラグインとして無償利用、グローバルレベルの監視を実現

 PowerEdgeサーバ向けのCloudIQは、システム運用管理ソフトウェア「OpenManage Enterprise」に無料の「CloudIQプラグイン」をインストールすることで利用可能になる。

 CloudIQを利用すると、例えば、東京、大阪、海外などの複数データセンターに設置されたPowerEdgeサーバ群を統合管理しつつ、今後実装予定のAIによる予測機能を用いて、将来的に必要になる性能やストレージ容量を事前に把握できるようになる。

 具体的な使い方は、WebブラウザでCloudIQのポータルにログインすると、それぞれの拠点に設置されたPowerEdgeサーバ1台1台がアイコン付きで表示され、ハードウェアの状態、ファームウェアの状態、ライセンス、ワランティ情報などを確認できる。重要な監視項目は点数化された上で、「緑」「黄」「赤」などのグラフィカル表示で状態を把握できる。

ALT CloudIQのポータルでは、PowerEdgeサーバの状態を分かりやすいグラフィカルな画面で確認できる(提供:デル・テクノロジーズ)《クリックで拡大》

 登録済みのPowerEdgeサーバをクリックすると、システムのヘルス状態などの詳細が表示される。「赤」にグルーピングされたデバイスの一覧から、問題が発生しそうな箇所を確認し、システムに悪影響を及ぼす前に対処していくことが可能になる。物理サーバの状態だけでなく、どのような仮想マシンが稼働しているか、それぞれの仮想マシンでCPUやメモリなどのリソースがどのように消費されているかの把握も可能だ。CloudIQのこうした情報を基に、ビジネスへの影響を計測したり、システム停止を予測して事前にリスクを回避したりしていくわけだ。

ALT CloudIQで確認できるPowerEdgeサーバの詳細から、ビジネスへの影響を計測したり、リスクを回避したりしていくことが可能になる(提供:デル・テクノロジーズ)《クリックで拡大》

 「第1段リリースでは、『ヘルス状態』『インベントリ』『キャパシティー』『パフォーマンス』『レポート』『ライフサイクル』などのカテゴリータブが追加されました。それぞれのタブをクリックしていくことで、簡単にシステム状態の詳細を把握できます。データをドリルダウンして分析したり、監視期間をドラッグで調整したりできるなど、高い操作性を実現しています」(相場氏)

ストレージからサーバ、ネットワークまでを一気通貫でモニタリングできる“意義”は

 CloudIQは、これまでOpenManage Enterpriseが提供してきた高度な管理機能をさらに拡張するものになる。

 それぞれの位置付けとしては、OpenManage Enterpriseがサーバの導入、更新、メンテナンスといった「サーバのライフサイクル管理」の役割を中心的に担い、CloudIQは「プロアクティブな監視と分析機能をクラウドから提供する」ものとなる。

ALT CloudIQとOpenManage Enterpriseの位置付け(提供:デル・テクノロジーズ)《クリックで拡大》

 また、OpenManage Enterpriseがローカルの管理ネットワーク内のシステムを監視するツールであるのに対し、CloudIQは、CloudIQサイトとの接続が確立された全てのシステムが対象となるといった違いもある。

 CloudIQとOpenManage Enterpriseを組み合わせて利用することで、グローバルレベルで、サーバ1台1台について、APIによる管理やポリシーベースの自動運用が可能になる。

 もっとも、CloudIQは、単なる「サーバ管理向けクラウドツール」ではない。CloudIQを活用する最大の意義は、ストレージやサーバ、ネットワークも含めて、単一のダッシュボードで全てのシステムの状態を詳細に把握できることにある。

 「お客さまからは『ストレージ分野で定評のあったCloudIQがいよいよPowerEdgeサーバでも利用できるようになる』と期待されています。Dell EMCのストレージを使い慣れたお客さまは、同じインタフェース、操作性でサーバ監視も可能になります。また、PowerEdgeサーバを使い慣れたお客さまは、Dell ECMストレージが提供してきた機能をサーバでも活用できるようになります。ストレージからサーバ、ネットワークまで、システムを一気通貫にモニタリングし、自動化を実現していくことで、設定ミスやポリシー適用漏れを防ぎ、少ないリソースで高度な運用が可能になると考えています」(岡野氏)

 例えば、米国の企業では、CloudIQによる自動化によって、パフォーマンスチューニングに費やしていた週当たり16時間の工数を削減したケースや、トラブルの原因調査にかかっていた週当たり24時間の工数を削減したケースがあるという。また、CloudIQは今後WebhookとREST APIにも対応し、ユーザー企業がCloudIQの発信情報を「ServiceNow」や「Slack」「VMware vRealize」「Microsoft Teams」などへ統合させることも可能になるという。

 IDCの調査「2021年第2四半期のx86サーバ国内売上額および出荷台数」でシェアNo.1を誇る(※1)デル・テクノロジーズは、同時期の外付けストレージ分野でもトップシェアを獲得している(※2)。ストレージで実績のあるCloudIQが、PowerEdgeサーバでも利用できることは、サーバのDellとストレージのEMCの統合効果を象徴するものともいえるかもしれない。CloudIQには今後、ロールベース管理やセキュリティ管理機能が追加されていく予定だ。データ分析とAIを活用した新たなITインフラ監視にさらなる期待が集まる。

※1:出典「IDC Worldwide Quarterly Server Tracker, 2021Q2. Share by Company. Product Category=x86」

※2:出典「IDC Worldwide Quarterly Enterprise Storage Systems Tracker 2021Q2, Share by Company, Product Category Group: External OEM」



 「ストレージシェアNo.1の弊社で実績のあるCloudIQを、ぜひサーバ管理にも活用いただければと考えています。弊社の新本社(東京、大手町)に設置された『Executive Briefing & Solution Center(EBSC)』では、CloudIQのデモや検証ができる環境をご用意しました。興味がある方はぜひお問い合わせをいただければと思います」(岡野氏)

ALT 「Executive Briefing & Solution Center(EBSC)」ではCloudIQのデモや検証ができる(提供:デル・テクノロジーズ)

関連記事――サーバの運用工数削減に向けたヒントがここに!

Copyright © ITmedia, Inc. All Rights Reserved.


提供:デル・テクノロジーズ株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2021年11月14日

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。