仮想化、クラウドでシステムが複雑化し、運用管理も煩雑になっている近年、多くの企業が運用管理の効率化に頭を悩ませている。だが多数の企業に対し、運用保守をサービスとして提供しているSIerの視点で見れば、「複雑・大規模なインフラを効率的に運用する」ことはビジネスの大前提。そうしたプロの視点で見ると、多くの企業でありがちな、コスト、リソース、スキルという運用管理の三大課題を解決する上では何がポイントになるのだろうか? 約100社のインフラ運用を担うオリゾンシステムズに話を聞いた。
IoT、X-Techなど、テクノロジーの力で価値を生み出すデジタルトランスフォーメーションのトレンドが国内でも進展している。これに伴い、「ITは攻めの手段」という認識も広がり、「IT投資の7割を占める」といわれてきた運用管理コストを、いかに収益に寄与する領域にシフトできるかが、多くの企業にとって課題となっている。
だが現実は、コスト削減やビジネス展開のスピードアップを狙って仮想化、クラウドを導入したものの、システムが複雑化し、「かえって運用管理の手間とコストが増えた」「障害時の原因特定に時間がかかる」といった課題に多くの企業が頭を悩ませている。
@IT編集部が2016年12月16日〜2017年1月12日、767社を対象に実施した読者調査でも、「現在最も重視しているアクションは何ですか?」という設問に対し「コスト削減」が26.5%でトップ。これに「事業部門への企画提案や利益貢献度」「運用プロセスの標準化」が続き、運用管理効率向上が大きな課題となっていることが分かった。
一方、「サーバ仮想化導入後の課題」としては、「障害時の問題切り分けや特定」が28.9%でトップ。この背景には、本読者調査で毎回、課題として多く挙げられる「IT担当者のスキル・リソース不足」が横たわっているといえるだろう。
こうした中、システム開発からインフラ構築、運用保守まで、一貫したサービスを提供しているオリゾンシステムズでも、運用保守サービスに対するニーズは年々高まっているという。同社の運用部門を率いる工藤皓平氏は次のように話す。
「2017年2月現在、顧客企業は約100社あります。製造、通信、流通、金融、SIerなど多様な業種にわたり、運用保守の対象となるシステム規模もサーバ1台から数百台までとさまざまです。もちろんそれぞれ別々の会社ですから、OSの種類、OSのバージョン、パッチ当ての状況、ミドルウェア、アプリケーション、運用ポリシーなど全てが異なります。こうした中、弊社としては各社各様の要望に最適なマネージドサービスを安定的に提供することで、着実に顧客企業数を伸ばしてきた経緯があります」(工藤氏)
だが、システムの種類から規模、構成要素、運用ポリシーまで、全てが異なる100社分ものインフラを、一体どのようにして安定運用しているのだろうか?
というのも、オリゾンシステムズの全従業員数は150名(2017年1月現在)。無論、運用保守サービスの担当スタッフはごく一部であり、人的リソースに制約があるのは同社も同じだ。ましてや同社の場合、運用保守を事業として展開している。コスト削減額がそのまま収益に直結する以上、徹底的に効率化を極めなければ事業そのものが立ちゆかない。種類も規模も、さらには中身もバラバラの100社分ものシステム運用保守業務を、“収益源”にまでできる秘訣とは一体何なのだろうか?
「それはマルチベンダーの多種多様な装置をシンプルに管理できること、運用保守プロセスの標準化によってノウハウの属人化を防ぐこと――この2つを実現する“仕組み”を持っていることが大きなポイントです」
オリゾンシステムズの後藤鉄也氏はこのように語る。
「しかし弊社にしても、一朝一夕にこうした“仕組み”を築けたわけではありません。今の体制に至るまでには、サービス開始直後からのさまざまな課題を乗り越える必要があったのです」
オリゾンシステムズが運用保守サービスを提供開始したのは2008年。当時はサーバ仮想化やクラウドサービスが普及し始めた時期であり、システムの複雑化を受けて、顧客企業の間でもさまざまな課題が浮上していた。そうした顧客からの要望を受ける形でサービスをスタートしたのだという。
だがサービスを開始してみると、多数の問題に直面することになった。まず各顧客企業のシステム環境を正確に把握しなければならない。だが前述のように、OSの種類やバージョン、ミドルウェア、その上で稼働しているアプリケーションの数や動作まで、当然ながらバラバラだ。その把握には多大な時間と手間が掛かり、人的リソースを大幅に奪われることが分かった。
運用保守ではスキルの属人化という問題が立ちはだかった。システム環境が1社1社異なるため、そもそも共通の運用管理プロセスを作れず標準化ができない。顧客ごとに異なるプロセスを作れば、運用保守に当たる人数もその分増やさなければならない。そうなればコストがかさむ上、業務も自ずと属人化しやすくなってしまう。
作業手順のドキュメントや情報伝達も課題になった。ドキュメント作成の粒度は顧客ごとに異なる。簡単な操作マニュアルで問題ないケースもあれば、細かい粒度まで落とし込んだドキュメントもある。運用保守は24時間、3交代シフト制で行っていたが、ドキュメントの表記/粒度が統一されていないため、何らかのアラートが上がった際、顧客企業に迅速・正確に情報を伝えられない、運用保守スタッフの間ですら情報が正しく伝わらない、といったリスクを抱えることになってしまった。
「しかし最大の問題は、運用保守事業のスケールのしにくさでした。システムの構成把握にしても、プロセス標準化の問題にしても、全ては人にしわ寄せが来ます。しかし人手だけに頼った運用では、収益が運用保守スタッフの数に縛られてしまいます。たとえサービスへのニーズが増加しても、対応するにはそれだけ多くの人的コストが必要となり、収支が合わなくなってしまうのです。そこで人手だけに頼らない“仕組み”が必要と考えました」(後藤氏)
では同社が出した“答え”とは何だったのか? それが複数の選択肢の中から選び抜き、現在も利用している統合ネットワーク監視・サーバー監視ツール「ManageEngine OpManager」(以下、OpManager)だった。導入当初はバージョン6.4だったが、現在はバージョン11を利用。最新のバージョン12.2も評価中だという。
OpManagerはネットワーク管理、サーバ監視、アプリケーション監視、障害監視など、包括的な機能を装備した、まさしく統合運用管理ツールだ。ただ工藤氏は、機能の豊富さではなく「多様なシステムを一元的に可視化・管理できること、操作・設定がシンプル・容易であることが何より大きなメリットです」と評価する。
例えば、「環境が1社1社異なるため、共通の運用管理プロセスを作ることができない」という課題については、OpManagerの「装置テンプレート」という機能が解消した。これはサーバ、ルーター、スイッチなど各種装置の監視設定をシンプル化する機能だ。具体的には、マルチベンダーの各種装置に対応した監視項目・監視間隔をあらかじめ定義したテンプレートであり、OpManager はこれを1100種類用意。多様なベンダー製品の多くをカバーしているため、製品知識がなくても、どんな製品でも、同じ操作でシンプルに監視設定できる。設定の一括変更や、監視項目・監視間隔のカスタマイズも可能だ。
エージェントレスで監視できることもポイントだった。監視対象サーバにエージェントソフトをインストールせずに済むため、既存環境を止めたり、影響を与えたりすることなくスピーディに監視を開始できる。
「既存環境に手を入れたくない、運用保守のために業務を止められたくないというお客さまは少なくありません。その点、エージェントレスで監視を始められるOpManagerは、弊社の運用保守サービス導入時のお客さまの抵抗感をなくすことに大いに役立っています」(後藤氏)
障害管理機能では、ネットワーク上で発生した全アラートから不要なアラートをフィルタリングして、重要なアラートだけを管理者に通知できる。装置やサービスの応答時間などに一定の閾値を設け、閾値を超えたらアラートを通知することも可能だ。アラートは管理画面上で重要度順に色分けして表示されるため、優先的に対応すべき障害を瞬時に把握できる。
アラートについて各関係者にメール通知したり、パッチ適用など既定プログラムを自動実行させたりする「通知プロファイル」機能も装備する。これにより、「顧客企業との間、運用保守スタッフの間で、アラートなどの情報伝達がうまくいかない」といった課題も解消した。
仮想環境やクラウド環境の監視に標準対応していることも大きな特長だった。仮想環境については物理サーバから仮想マシンまで、一貫した可視化・監視が可能。以下のマップのように、稼働状況を直感的に把握できる。「障害原因の特定に時間がかかる」こともないという。
さらに、CPU使用率、メモリ使用率など、サーバとネットワークの可用性をグラフで可視化し、直観的に現状を把握できるダッシュボードも備える。
これらの機能が、まさしく冒頭で紹介した「マルチベンダーの多種多様な装置をシンプルに管理できること、運用保守プロセスの標準化・統一化によってノウハウの属人化を防ぐこと」を実現するものであることが、理解できるのではないだろうか。
つまりオリゾンシステムズは、100社分のシステムを、OpManager を通して管理することで、各社固有の管理プロセス・監視設定を担保しながら、管理プロセス・ノウハウを標準化し、ダッシュボードで一元管理しているわけだ。
これに加えて、運用保守事業の効率アップと付加価値向上、共に寄与しているのが、1つのOpManagerを複数の顧客企業に適用することで、各社のシステムを1つのOpManagerで監視できる「マルチテナント構成」にも対応している点だ。以下の画面イメージのように、ドラッグ&ドロップでシステム構成図を簡単に作図できる上、顧客単位で作成したその構成図に限定したアラート設定や閲覧権限を付与できる。
オリゾンシステムズは3シフト間で情報共有を行い全ての顧客の状況を把握する体制としているが、これによって顧客ごとに異なるシステム構成を迅速・容易に可視化するとともに、各社の要望に応じた監視体制も迅速に設定。適切な閲覧権限の下でセキュアに監視しているというわけだ。
さらに、OpManager自体が仮想化/クラウド環境に対応していることも収益化のポイントだという。というのも、管理対象システムの規模が決まっている場合、運用管理ツールを稼働させるサーバのサイジングを見積もりやすいが、オリゾンシステムズのように顧客企業数が変動し、管理対象の数も規模も変わる場合、運用管理ツールを支えるリソースもそれに対応できなければならない。
そこで同社では、各社のシステムと自社のデータセンターをVPNで接続しデータを収集。それをAWS上で冗長化したOpManagerで統合監視するという構成を採っている。これにより、「顧客企業が増えても監視体制を容易にスケールできる」ようにしているのだ。
ただ昨今は、コスト削減の観点からオープンソースソフトウェアの運用監視ツールに対する関心も高まっている。事実、Zabbix、Nagiosなどは広く使われているし、同社でも導入を検討したことはあるという。だが結局はOpManagerに軍配が上がった。最も大きな要因は「コスト」だった。
「OSSは柔軟に設定できる点は魅力ですが、設定に時間と手間が掛かる他、専門知識も必要です。スキルを持った経験者が継続的に運用保守に当たることができればいいのですが、現実的ではありません。使いこなせる体制にないことは、運用保守をサービスとして顧客に提供している点で不安が残ります。担当者の学習コストも無視できません」(後藤氏)
その点、OpManagerはユーザーのスキルレベルを問わず操作でき、運用管理を確実化できる。さらに「通知プロファイル」のように、サービスの付加価値を高められる機能も豊富に用意されている。
「例えば顧客にメールアラートを送る場合も、OSSの場合、メール文面などを十分にカスタマイズできないことがあります。お客さまはITやシステムに詳しい方だけではありませんから、お客さまが理解しやすい言葉で、どう対応すればいいかを的確に伝える必要があります。その点、OpManagerは文面をカスタマイズしたり、一括修正できたりと、かゆいところに手が届く機能がそろっているのです」(工藤氏)
今後は最新バージョン、OpManager 12.2への移行を進めながら、運用自動化にも取り組んでいきたいという。
「例えば、OpManagerにはユーザーが独自に作成したPowerShellやLinuxシェルスクリプトを設定できる機能があります。このスクリプト監視を使って『しきい値を超えた際、SMSにアラートをプッシュ通知する』、また『サーバ再起動と連動してネットワークを自動構成する』などを実現し、さらに効率化を追求していく考えです」(後藤氏)
予算、リソース、スキルに制約がある中で、運用管理をいかに効率化するかは、運用保守サービスを事業として展開するオリゾンシステムズにとって大きな経営課題だ。同社は課題の本質を見抜き、OpManagerを適用することで安定したサービス提供を少人数で実現している。
だが予算、リソース、スキルという制約があるのは、SIerに限ったことではない。その点、OpManagerはビジネスとして運用保守を提供する事業者が、シビアな視点で選択し、太鼓判を押したツールだ。システム運用にもビジネスへの寄与が求められ、運用コストを問題視する傾向も強まりつつある今、自社システムの運用効率化を阻んでいる“本質的課題”を見据えてみてはいかがだろう。特に本稿の「お客さま」「顧客企業」を「事業部門」と置き換えて読んでみると、効率化につながるあらゆる発見があるのではないだろうか。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:ゾーホージャパン株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2017年3月31日