いま、ITインフラの運用管理作業の効率化と高品質化に“クラウドの力”を活用する動きが出てきている。そうした中、マイクロソフトは、クラウド対応の運用管理スイート「System Center」に加え、新たなクラウド型IT管理サービス「Microsoft Operations Management Suite」の提供を開始した。
サーバー、ストレージ、ネットワークといったITインフラの能力をフル活用するには、適切な運用管理を継続的に実施する必要がある。多くのIT管理者が認識していることだが、残念なことに、実践できている企業はそれほど多くはないのが実情だ。
「IT基盤だけでなく、アプリケーション層までをきちんと管理・監視できている企業は、それほど多くありません」
こう語るのは、日本マイクロソフトの岡本剛和氏(サーバープラットフォームビジネス本部 エグゼクティブプロダクトマネージャー)だ。同社の調査によると、多くの企業で行われている運用管理はハードウエアまたはOSに対する死活監視レベルにとどまっているというのである。
しかし、このような管理・監視では、システム障害やセキュリティインシデントが発生したときの対処が難しくなる。例えば、業務システムのレスポンス遅延やパフォーマンス低下が発生した場合、サーバーとOSの稼働状況だけを調べても「どのコンポーネントに問題があるのか」「いつから発生しているのか」といったことまでは分からない。調査すべき対象は、サーバーやOSのレイヤーではなく、ミドルウエアやアプリケーション層の場合もあるのだ。
また、セキュリティ管理やアクセス管理のカナメとなるActive Directoryについても、サーバーとOSの管理・監視だけで安全を保てるわけではない。Active Directoryが正常稼働していたとしても、悪意ある第三者からのクラッキングによって内容が改ざんされたり、情報が漏えいしたりといったセキュリティインシデントが発生している可能性はあるからだ。
そこで必要になるのが、クラウド/オンプレミスが混在するハイブリッドクラウド環境に対応した、多様なニーズに応えられる運用管理ツールだ。
マイクロソフトでは、ITインフラの統合的な運用管理を実現するツールとして「System Center」を提供している。最新の「System Center 2012 R2」はオンプレミスのデータセンターからハイブリッドクラウド、クライアントデバイスまで、運用管理対象となるITインフラの幅も広く、その各インフラについてアプリケーションからハードウエアまでの全ての層を管理・監視できる。また、ユーザー管理とセキュリティ管理機能も備えているので、安全安心を確保するためのツールとしても心強い。
2015年7月、マイクロソフトはクラウド時代に対応する新たな管理ソリューションとして、「Microsoft Operations Management Suite(OMS)」の提供を開始した。OMSは、System Centerが提供する機能を補完すると同時に、ハイブリッドクラウド環境での管理に必要となる新しい管理シナリオを提供する“クラウド型ITマネジメントサービス(IT Management as a Service:ITMaaS)”になる。
OMSの最大の特徴は、ハイブリッドかつオープンな運用管理ソリューションであること。Microsoft AzureやWindows Serverだけでなく、Amazon Web Services(AWS)、Linux、VMware、OpenStackといった各プラットフォームの管理と監視が行える(図1)。もちろん、既存のSystem Centerとの連携にも対応しているので、オンプレミスとクラウドが混在する“ハイブリッドクラウド”も含めて、柔軟できめ細かい運用管理環境を実現できる。
OMSでの実際の管理作業は、専用の管理ポータルから行う。管理ポータルには管理対象のプラットフォームの状況が分かりやすく整理された状態で表示されるので、業務の特性に応じて社内サーバールーム、商用データセンター、メガサイトとITインフラを使い分けている企業でも一元的な管理を簡単に実践できる(図2)。
「OMSの管理ポータルでは、管理対象オブジェクトがActive Directoryのポリシーに合致しているかどうか、マルウエアに感染している可能性があるサーバーがいくつあるか、ITリソースの消費状況、アラートがいくつ上がっているか、ソフトウエアやWindowsサービスに対して行われた変更のトラッキング、設定済みのバックアップジョブなどを統合的に確認することができます。表示されている各情報はドリルダウンにも対応していますので、グラフや数字をクリックしていくだけで、簡単に状況や設定値の詳細情報を確認できます」(岡本氏)
OMSが備える基本的な機能は、「ログ分析」「自動化」「可用性」「セキュリティ」の4つになる(図3)。
「ログ分析」機能では、Microsoft Azure、Windows Server、AWS、Linuxなどが生成したログファイルから情報を収集して分析したり、累積データと比較したりして、その結果を見やすく可視化することができる。
収集・分析・可視化の処理は「ソリューションパック」と呼ばれる“規則”データをベースに指示する仕組みになっており、一般的な企業が行う「アラート管理」「容量計画」「Active Directoryの評価」「SQL Serverの評価」「変更追跡」といった管理作業の規則は、既製品のソリューションパックが用意されている。
また、「自動化」機能では、頻繁に行う運用管理の諸作業を、人の介入や立ち合いなしに自動で実行させることが可能になる。その結果、ITプロにかかる負荷(工数)が減少し、操作ミスや設定ミスも減ることで運用管理の品質も向上する。
OMSの「自動化」機能は「Runbook」として実装されており、Windows PowerShellのワークフローエンジンの上で実行される。Runbookの作成/編集はGUIベースのエディター上でグラフィカルに行えるようになっており、使用頻度が高い定型的パターンについては「Runbook Gallery」から“既製品”を取り込んで作成の手間を省くことも可能だ。
目に見えるはっきりした効果が表れることから、Runbookを利用した運用管理作業の自動化はさまざまな企業ですでに行われているという。
例えば、NTTデータでは、約370台の仮想サーバー群で構成されているメールシステムに対する監視とパッチ適用の作業を自動化することで、運用管理工数を92%削減することに成功したという。
NTTデータのメールシステムで特に問題になっていたのは、パッチを適用するたびに発生する「仮想サーバーのインスタンスを検証用サーバーに移動→パッチの適用と動作確認→正常動作する場合は本番系仮想サーバーの停止→パッチの適用→仮想サーバーの再開」という一連の煩雑な作業だった。これを手作業で行うのは非常に手間がかかり、効率が悪く、操作ミスによって重大なトラブルが発生することも懸念されていた。
そこで、NTTデータはSystem Center 2012 R2に含まれる「System Center Orchestrator(SCO)」を利用してパッチ適用などの作業を自動化。ITプロがコマンド入力などの手作業をしなくて済むようにするとともに、複数のサーバーに対して同時にパッチを適用する“並行作業”の実施も狙ったのである。
この他、サンリオもActive Directoryのデータベースに対する追加/変更作業を自動化することで、運用管理工数の削減に成功している。
なお、Runbookによる作業自動化の仕組みはSCOでもOMSでも基本的には同じだ。上記2社の事例ではオンプレミス側の作業自動化をSCOで実現しているが、OMSでも同じように自動化することが可能だ。
さらに、事業継続・災害復旧(BC/DR)への備えとして、OMSにはデータの整合性とアプリケーションの可用性を確保する「可用性」機能も備えている。
データ整合性の確保は、複数のデータセンターやクラウド上に置かれているデータをMicrosoft Azureにバックアップすることで行われる。具体的には、「Azure Backup」と「System Center Data Protection Manager(SCDPM)」を組み合わせて、SharePoint Server、Exchange Server、SQL Server、Hyper-V仮想マシンなどのエンタープライズワークロードを保護する方式だ。
また、アプリケーションの可用性確保は、プライマリーサイトのワークロードを「Microsoft Azure Site Recovery(ASR)」のレプリケーション機能で復元することで実現される。レプリケーション対象は物理サーバー、Hyper-V仮想マシン、VMwareが混在した環境であってもよく、復元先としては企業のデータセンター、ホスティングサービスプロバイダー(商用データセンター)、Microsoft Azureから選択できる。
この他、OMSにはワークロード、サーバー、ユーザーのそれぞれを保護するための「セキュリティ」機能も搭載されている。セキュリティ機能ではマルウエア感染の有無とシステム更新プログラムの適用状況を調べることができるだけでなく、監査やフォレンジックを目的とした分析も行える。
「クラウドを導入している企業、特にMicrosoft Azureをお使いの企業にはOMSのご利用をお勧めします」
岡本氏はこう述べ、ITインフラにクラウドを活用している企業、すでにハイブリッドクラウド環境を構築している企業にOMSを勧める。OMSは「ログ分析(Operational Insight)」「バックアップ」「可用性(Site Recovery)」「自動化(Automation)」といったクラウド管理に必要な機能がそろっており、個別ではなく統合されたポータル画面が提供されていることも、企業の運用管理コストとIT管理者の作業負荷の削減に大きく貢献するだろう。
Copyright © ITmedia, Inc. All Rights Reserved.