Insider's Eye
最新Microsoft Operations Managerの実力(後編)

コラム
なぜシステム監視は難しいのか?

Peter Pawlak
2004/08/03
Copyright (C) 2004, Redmond Communications Inc. and Mediaselect Inc.

 アプリケーションはOSサービスやネットワーク、そのほかのアプリケーションに大きく依存しているので、故障はしばしば怒濤のごとく押し寄せ、根本的原因が存在する限り続くことがある。

 例えば、Webサーバのファームがバックエンドのデータベース・サーバと通信できなくなった場合、各Webサーバはデータベースへの再接続が失敗するたびに繰り返しイベントを発生させる。このシナリオは以下に示す監視のいくつかの一般的問題を示している。

  • 業務スタッフは個々のWebサーバからの個別のアラートを受け取りたくない。すべてのサーバに、データベース・サーバ関連の共通の問題があることを知りたいだけである。

  • オペレータは同じ問題について何度も繰り返すメッセージ攻めを望まない。誰かが最初のアラートを認識し、その解決に取り組んでいるときはなおさらだ。

  • アプリケーションの故障にはさまざまな根本的原因が考えられる。例えばネットワーク、データベース・ソフトウェア、データベース・サーバのOS、ハードウェア、データベースやWebサーバが依存する別のマシンで稼働中のサービス(DNSサーバなど)である。

 真に効果的な監視ソフトウェアは、アラートをまとめ、反復的なアラートを抑制し、問題の原因を正しく分析できなければならない。これは根本原因分析と呼ばれる難しいプロセスだ。BMCやMicromuseなどのベンダは根本原因分析を目的に設計されたソフトウェアを用意しているが、これらの製品は高価で、詳細な設定とモデリングを行わないと宣伝どおりの効果を発揮しない。

 こうした問題から、監視システムはしばしば不完全で、実装に費用がかかる。CA UnicenterやIBM Tivoli TMEなど、包括的な管理「フレームワーク」製品が関係するプロジェクトの場合は特に難しい。異種のメインフレームやサーバ、ネットワーク・デバイスがひしめく社内全体の監視という目標をあきらめて、より小規模な「ポイント・ソリューション」に特化すれば、目標が少ないため成功する可能性が高くなるが、これらはスケーラビリティに欠ける。また、SAP R/3といった一部のエンタープライズ級の大規模アプリケーションの監視能力は限られているだろう。

 ソフトウェア自体も高価だが、監視ソリューションがこれほど費用のかかる最大の理由は、ネットワークやハードウェア、OS、システム・サービス、アプリケーションなど、システム全体についてかなりの知識が要求されるからである。こうした知識を持つ人間が、どのイベントやパフォーマンスの数的指標が監視すべき重要なもので、オペレータを無関係な情報や定常的な情報の洪水であふれさせることがないかを判断し、監視システムのルールとフィルタを設定して所期の目標を達成しなければならない。

 さらに、重要なアラートをシステム・オペレータに転送するだけではあまり役に立たないだろう。監視システムはこうしたメッセージをもっと意味のある用語に翻訳し、次に実行すべき事柄に関する状況と見通しの情報をオペレータにいくらか提示できることが望ましい。

 監視システムにすぐ使える知識をより多く組み込むほど、より早く簡単にそれを有効活用できる。監視システムによってシステム・オペレータの仕事が楽になり始めれば、これらのスタッフは監視システムの微調整や使用範囲拡大の取り組みを支持し協力する可能性が高い。


 INDEX
  Insider's Eye
  最新Microsoft Operations Managerの実力(前編)
    1.MOM2005の概要
    2.MOM2005の新機能
        コラム:システム監視の必要性
  最新Microsoft Operations Managerの実力(後編) New!
    3.管理インフラを構築する管理パックの機能 New!
      コラム:なぜシステム監視は難しいのか? New!
    4.サードパーティ製品との統合性を改善 New!
 
 「Insider's Eye」


Windows Server Insider フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

Windows Server Insider 記事ランキング

本日 月間