アラートログ監視に当たっては、Enterprise Edition+Diagnostics Packのオプションライセンスがある環境ならば、Oracle Enterprise Manager上でメトリック設定と通知機能を使うことで容易に実現できます。エラーだけでなく、個別のしきい値なども設定した上で管理者へアラートメールで通知する仕組みを自動化できます。
一方、Enterprise Editionのみ、あるいはStandard Editionライセンスの環境でも、サードパーティー製の監視製品を利用するか、tailコマンドでアラートログを確認し、ユーザー自身で特定のメッセージが出力された際に通知するスクリプトをcronで定期的に実行するなどの方法で実現できます。
例えば筆者の所属するアシストが提供している「iDoctor監視サービス」は、アラートログに出力されたOracle Databaseエラーメッセージも監視対象にできます。運用上予期され、かつ業務に影響のないエラーについては「特定の時間帯で発生するORA-XXXXXは無視する」といった例外処理も設定できます。
今回はアラートログの中で監視しておくべきメッセージを5種類紹介しました。アラートログには膨大な量のログが記録されます。全てのメッセージの意味を把握するのは困難ですし、そもそも「特に何を監視すべきか」はシステムにより異なります。しかし、今回紹介した「最低限押さえるべきポイント」を押さえておけば、システム固有の個別対策においてもその起点になるはずです。
参考までに、筆者が過去にサポートを担当した重篤なトラブルの中には、「トラブルが発生する数日前からアラートログに警告やエラーが出力されており、その予兆を示していた。アラートログを的確に監視してさえいれば、トラブルは未然に防げた/ここまで重篤にはならなかった」と悔やまれることが多くあります。
トラブルの未然防止、早期発見、早期対策のために、まずは自身が管理するシステムでどんなメッセージが出力されているのか、アラートログをいま一度チェックすることから始めてみてください。
株式会社アシスト サービス事業部 サポートセンター。2007年にアシスト入社後、Oracle Databaseのサポート業務に従事。2017年現在はサポート業務の傍ら、顧客の未解決トラブルを1つでも多く減らせるよう、サポートセンターに蓄積されている調査のノウハウを社内外に伝える活動を行っている
Copyright © ITmedia, Inc. All Rights Reserved.