「ビジネス視点のシステム管理は、もはやスローガンであってはならない」、米HPE:クラウド/IoT時代、運用管理に不可欠な要件とは
社内外問わず、各種ITサービスが業務の生命線を握っている今、システム運用とビジネスの稼働状況を常にひも付けて管理することが不可欠となっている。その具体的手段は、すでにここまで実現している。
システムのパフォーマンスがビジネスのパフォーマンスを左右する現在、システム運用管理には、仮想化、クラウドの利点を生かした動的な運用管理アプローチが求められている。こうした中、運用管理ツールにも「動的なインフラの安定運用」や「ビジネスへの影響度を測りながらITサービスを監視できる」機能などの必要性が高まっており、国内でもそうした機能を持つ複数の製品がリリースされつつある。
米HPEが提供するITイベント管理/自動監視ソフトウエア「HP Operations Bridge」もそうした製品の一つだ。HP Operations Bridgeは、同社が「ビジネスサービス管理」(Business Service Management/以下、BSM)と呼ぶ運用管理製品群の中核となる製品で、国内では2015年2月にリリース。「ビジネスの状況とひも付けて動的なインフラを安定運用する」ための数々の機能を搭載し、大企業を中心に導入が進んでいるという。これを受けて、2015年9月には中堅・中小企業(以下、SMB)向けのエディションを追加した。
“ビジネスの変化に即応できるインフラ”は企業規模を問わず必要なもの。日本ヒューレット・パッカード BSMビジネス推進担当部長の鉾木敦司氏と、米HPE BSM担当Product ManagerのBattina Hellinga氏に、今、運用管理に必要なツール要件を聞いた。
全ての「ITサービス」を監視し、問題があれば自動的に復旧
「2015年2月の提供開始以来、Operations Bridgeは国内の金融、製造、通信・放送などの大手企業で着実に採用が進んでいます。これを受けて、2015年9月に一部機能と価格を抑えたSMB向けエディションを追加しました。これにより、比較的規模の小さい環境でも、Operations Bridgeのコア機能を利用可能となったことが今回の目玉です」(鉾木氏)
HP Operations Bridgeとは、自社の全ITサービスの稼働状況を把握し、迅速に適切な判断をするための“Bridge(艦橋)”となる製品群。統合管理コンソール「HP Operations Manager i」(以下、HP OMi)を核に、各種監視ツールと連携。複数の監視ツールから吸い上げた情報をシングルビューで把握可能とすることで、「ビジネスとそれを支えるシステム全体を見渡す」ことができる。
特徴は大きく三つ。一つは、マルチベンダー環境、かつオープンソースソフトウエアを活用している例が一般的であることを受けて、サーバー、ストレージ、ネットワークなどを監視するHP製品はもちろん、他ベンダー製品やオープンソースソフトウエアも含めた多様な監視製品をつなげられるコネクター「BSM Connector」を用意していること。
また、インフラが変化しても、最新のシステム構成情報を自動的に収集・可視化する「Monitoring Automation」、監視結果を分析する「Correlation」、分析結果を可視化し、問題があれば詳細データまでドリルダウンできる「ダッシュボード」などで構成。これにより、「最新のシステム構成を自動的に発見(Automatic Discovery)→自動的に監視(Automatic Monitoring)→問題があれば自動的に原因を分析」できる他、さらにランブックオートメーション機能を持つ「HP Operations Orchestration」などの運用自動化ツールと連携させれば、自動的に復旧(Automate remediation)」することもできる。このように、人手中心では管理が難しい動的なインフラを、確実・効率的に安定運用できることがポイントだ。
そして三つ目の特徴が、イベント同士の相関関係を分析するHPEの独自技術。具体的には、各種イベントと「トポロジ情報」「ストリーム情報」「時間」との相関を分析するTBEC(Topology Based Event Correlation)、SBEC(Stream Based Event Correlation)、TBEA(Time Based Event Automation)という3つのエンジンを搭載。これらによって「重複しているイベント」「対応の必要がないイベント」「機械的に対応できるイベント」を自動的にイベントから削除。「人手による対応が必要なイベントだけ」を管理画面に表示する。
「TBECは、システム上にどのようなアプリケーションが稼働しており、互いにどのような相関関係があるかを把握して、問題が発生した際、どこが根本原因かをピンポイントで把握できる仕組み。SBECは、A、B、Cといった事象の組み合わせや発生順から『システムで何が起こっているか』を正確に把握する仕組みです。例えば、『通常とは異なるイベントが起こった』場合は人間でも検知できますが、『定期的に起こるはずのものが起こらなかった』といった人間が最も不得意とするパターンの発見にも適しています」(鉾木氏)
こうした分析機能は、前述のように同社製品に限らず、NagiosやZabbixといったOSS、サードパーティ製の監視製品、AWSやKVM、VMware vSphereといったクラウド/仮想環境から出力されるログに対しても適用できる。
「マルチベンダー環境が一般的であり、パブリッククラウドを使っている例も多いなど、現在は環境が複雑化しています。こうした中で、Operations BridgeはITサービス全体をリアルタイムで監視可能とし、業務に影響が及ぶ障害の予兆を迅速に検知して、影響が広がる前に対処とするといった具合に、まさしくビジネスを支える“艦橋”の役割を果たすというわけです」(鉾木氏)
ITとビジネスをつなげるダッシュボード
なお、今回のリリースにより、従来製品は「Operations Bridge Premium Edition」と改称し、新たに加わったSMB向けエディションが「Operations Bridge Express Edition」として2本立ての製品構成となった。
前述したコア機能は、両エディションとも利用可能。違いは対応するノード数やインスタンス数、リアルタイムパフォーマンス監視機能の有無などにとどまる。Express Editionの価格は、5ノードからの最小構成の場合で25万4000円(税込み)から。Express Editionから始めて、システム規模の拡張に合わせて、Premium Editionに移行するといった、スモールスタートも可能だという。
「SMBでも、ITサービスやインフラ監視に対するニーズは大企業と同じです。そこでExpress Editionは、大企業向けの Premium Editionとほぼ同じバリューを、より簡単に使えるように仕上げています。アウトオブボックスで利用でき、メンテナンスが楽で、スタートが容易であることが特徴です」(Hellinga氏)
では、すでに多数の企業に導入されているという海外では、どのような活用事例があるのだろうか。Hellinga氏は「例えばVodafone Group、United Airlinesなど大企業に採用されていますが、単なる『ITサービスの監視』というより、サービスデリバリの品質改善や、ビジネス機会拡大のためにOperations Bridgeを利用するケースが目立ちます」と話す。
「ニーズとしては、大きく二つあると思います。一つは、サービスの可用性を上げたいということ。具体的には、障害を未然に防ぎながら、万一、障害が発生した場合も復旧時間をできるだけ短くしようというニーズです。もう一つは、サービス提供・監視の自動化によって運用管理の確実化と負荷低減を図りたいというニーズ。周知の通り、運用コスト削減は利益を押し上げます。分かりやすい例としてはEコマースが挙げられますが、こうした場において、サービスの可用性担保と運用効率化がうまくできていなければ、それはビジネスのロスに直結します。エンドユーザーとなる顧客に影響が出る前に、いかに予兆を検知してスピーディかつ効率的に対処できるか。これが収益の向上・安定化のカギを握っていると言えるでしょう」(Hellinga氏)
「ITのパフォーマンスをビジネスのパフォーマンスにつなげる」という意味では、現在パブリックベータとして提供している「Business Value Dashboard」も興味深い存在だ。Business Value Dashboardは、Operations Bridgeが各種監視ツールから集めるデータを使って、「ITシステムがビジネスにどのような影響をもたらしているか」を視覚的かつリアルタイムに把握できるダッシュボードだ。
Business Value Dashboardのイメージ画面。地域の売上データや株価など、ビジネスの状況を示すデータを任意に選んで、業務を支えるITシステムの稼働状況と併せて監視することができる。ITに詳しくないビジネス部門の人にも、システム運用の在り方を自然な形で考えさせることにつながる《クリックで拡大》
具体的には、売上動向やそれを支えるITサービスの稼働状況などを、一画面の中でグラフなどを使ってビジュアルに表示する。地域別の売上を見るためにエリアをドリルダウンしたり、店舗の空調やエレベーターの稼働状況などを、ITサービスの稼働状況と併せて見たりすることもできる。これにより、例えば金融機関なら「店舗ATMの稼働状況や店舗の混み具合などを見て、より無駄なくスムーズな対応ができるようITサービスを改善する」といったことが狙える。
「つまり、ITサービスの稼働状況と、それがリアルのビジネスの場に及ぼしている影響をひも付けて、さまざまな角度から把握できるわけです。ポイントは、ビジネス部門のエンドユーザーなどが、簡単なマウス操作でこのダッシュボードを作成できること。見たい情報を選んでビジネスとITの状況をひも付けて把握できることで、ITのメトリクスとビジネスバリューを結び付けられるわけです。Business Value Dashboardの正式公開後はOperations Bridgeと共に利用できるようになる予定。クラウドサービスとして提供する計画もあります」(Hellinga氏)
“静的な運用管理アプローチ”の限界
ITサービスが重要な顧客接点となっている昨今、IoTのトレンドも背景に、「ニーズを受けてITサービスを開発・リリースし、市場の反応を受けて継続的に改善する」といったサイクルを、スピーディかつ着実に運用することが重視されている。言うまでもなく、この取り組みで重要なのは「ただ速く作ってリリースすること」ではない。“ビジネスへの影響度”を図りながら、改善点を“確実に”実装していくことにある。ビジネスゴールにつながらないサービスを早くリリースしても意味がない他、サービスの品質が悪ければ、むしろそのスピードで逆効果を招いてしまうためだ。
鉾木氏は、「こうした改善サイクルを回していく上でも、アプリケーションの稼働状況を監視し、各種イベントの相関を分析する、真の問題原因を突き止める、ビジネスへの影響度を測るといった取り組みをスピーディに行うことが欠かせません。Operations Bridgeにはこうした意味でも多くの企業に注目されています」と話す。
「例えば、モノに対するモニタリングや障害原因の特定は、IoTのサイクルを回していく上で重要な要素になるのではないでしょうか。また、インターネットにつなげられたデバイスが爆発的に増えると、IoTをバックエンドで支えるクラウドの管理も一層重要になるでしょう。そうした中では、問題原因を自動的に発見する仕組み、自動的に復旧する仕組みが一層不可欠となるはずです」(Hellinga氏)
Webサービス系企業に限らず、ビジネスとシステムの距離が限りなく縮小している今、ビジネス視点でのサービス監視の重要性は一段と高まっている。統合運用管理製品は複数のベンダーが提供しているが、こうしたツールの導入が進みつつあることや、「サービスの品質を担保する」という先の海外事例での活用目的からも、変化が速い今のビジネス環境において、“静的な管理アプローチ”ではもはや対応が難しくなりつつあることが、あらためてうかがえるのではないだろうか。
Copyright © ITmedia, Inc. All Rights Reserved.