サーバ・ハードウェアリソースとは、サーバマシンに装着されたハードウェア機構です。サーバマシンのCPU、メモリ、ハードディスクなどに対し、使用率、使用量に注目した監視方法を適用します。
またTCP/IPネットワークに接続するためのネットワークアダプターに対しては、別のマシンからpingを実行してネットワークの死活監視を行います。
さらに、WindowsのイベントログやUNIXのsyslogなどを通して、オペレーティングシステムが提供するハードウェアの状況検知機能が出力するメッセージにより、ハードウェアリソースの状況監視を行います。
CPU、メモリ、ディスクに対する使用状況の検知は、オペレーティングシステムの機能を利用し、おおむね次のような原理で実装されています。
UNIX/Linux: 次のコマンドやコマンドに相当するシステムコールにより取得 |
Windows: 次のパフォーマンスオブジェクトの値を取得※2 |
|
---|---|---|
CPU | vmstatコマンド uptimeコマンド |
「Processor」パフォーマンスオブジェクト 「Thread」パフォーマンスオブジェクト |
メモリ | vmstatコマンド | 「Memory」パフォーマンスオブジェクト 「Paging File」パフォーマンスオブジェクト |
ディスク | dfコマンド iostatコマンド |
「PhysicalDisk」パフォーマンスオブジェクト 「Paging File」パフォーマンスオブジェクト |
表3 CPU、メモリ、ディスクの使用状況の検知の実装原理 |
※2「コントロールパネル」→「管理ツール」→「パフォーマンス」からMMC (Microsoft Management Console : Microsoft 管理コンソール)を起動し、「カウンターの追加」でどのようなオブジェクトとカウンターがあるか見ることができます。
これらの手法で取得したデータは、サーバの性能監視のデータとしても利用されます。検出した値があらかじめ設定した一定範囲に収まっているかをチェックすると同時に、値を時系列に収集し、リソース増強計画や適正化など、キャパシティープランニングに利用することも広く行われています。
拡張アダプターや電源機構、テープやディスケットドライブなどで検知されたエラー事象には、UNIX/Linuxのsyslog(システムログ)で検知されるものがあります。同様にWindowsでも、イベントログ※3で検知されるものがあります。これらはそれぞれの装置や機構が独自に検知事象を設定していることが多く、モニタリングの運用はあらかじめ判明している障害検知事象については通知されるように設定して、残りは検知された時点で通知、非通知を判断・設定するのが一般的です。
※3 「コントロールパネル」→「管理ツール」→「イベント ビューア」でイベントログを参照できます。
さらに、RAIDやUPSのような特定ハードウェアは、それらの機構が装着されたマシンとは別の装置や機構によって、状況や制御ができるものもあります。これらは別途管理用のサーバマシンを設置し、特定の機構が装着されたマシンのオペレーティングシステムの状況に依存することなく、機構の状況の検知や制御を一元的に行えるようになっています。
モニタリングの運用としては、これらの特定ハードウェアが標準的に提供しているオペレーティングシステムへの通知機能と、独立して専用制御を行う管理用サーバ機能について、どのように連携することができるかを調査、検討し、重大障害は一元的に監視できるようにする方針が推奨されます。
後編ではサーバ・ソフトウェアリソースのモニタリングについて解説します。
Copyright © ITmedia, Inc. All Rights Reserved.