Oracle運用の基本「ログ」を理解しよう:Oracleトラブル対策の基礎知識(1)(2/3 ページ)
本連載では、Oracle Database運用の鍵となるトラブル対処法について紹介していきます。第1回、第2回では情報収集の要となるログについて見ていきます。ログの出力情報は10gと11gとでは大きく異なる点がありますので、それぞれについても確認しておきましょう。
ASMインスタンスの場合のアラート・ログ
ASMとは、Oracle Database 10gから追加された新機能である自動ストレージ管理(Automatic Storage Management)機能です。ASMはオラクルが提供するデータベースファイルシステムであり、ディスクマネージャです。
10gから提供されているデータベース向けのファイルシステムで、ファイルシステムそのものにディスクマネジメント機構が含まれています。
このASMの機能の詳細については割愛しますが、ASMの機能を利用する場合、通常のデータベース同様、ASM用のインスタンスが存在し、アラート・ログが出力されます。
・ASMインスタンスにはデータファイルが存在しない=データファイル関連のログは出力されない
ASMインスタンスのアラート・ログでは、Oracleデータベースのバージョンや初期化パラメータの情報および起動/停止などの情報については先の例と同様に出力されます。ただし、表領域の変更やログスイッチに関する情報については出力されません。
これは、ASMインスタンス自体、インスタンスのみで構成されており、ASM用のデータファイルが存在しないためです。
・ASMインスタンスでのみ出力される情報:自動リバランス
ASMインスタンスのアラート・ログにのみ出力される情報として、「ALTER DISKGROUP ALL MOUNT」などのASM関連コマンドの操作ログおよび自動リバランスなどの情報があります。
自動リバランスとは、ディスクグループを構成しているディスクを削除したり、追加した際にデータの再配置を行う機能です。当然、この機能については、ASM固有の情報になるので、ASMインスタンスのアラート・ログにのみ出力されます。
リスト2はNAS構成でのリバランス時のアラート・ログの例です(Linux環境+R10.2.0.3の場合)。
Thu Jun 12 17:46:35 2008 SQL> alter diskgroup 'DATA' add disk '/export/cfs01/oracle/data04' Thu Jun 12 17:46:35 2008 NOTE: reconfiguration of group 2/0x23e8b0c0 (DATA), full=1 Thu Jun 12 17:46:36 2008 WARNING: ignoring disk /export/cfs01/oracle/data03 in deep discovery NOTE: initializing header on grp 2 disk DATA_0002 NOTE: cache opening disk 2 of grp 2: DATA_0002 path:/export/cfs01/oracle/data04 NOTE: PST update: grp = 2 NOTE: requesting all-instance disk validation for group=2 Thu Jun 12 17:46:37 2008 NOTE: disk validation pending for group 2/0x23e8b0c0 (DATA) SUCCESS: validated disks for 2/0x23e8b0c0 (DATA) Thu Jun 12 17:46:39 2008 NOTE: PST update: grp = 2 NOTE: requesting all-instance PST refresh for group=2 Thu Jun 12 17:46:39 2008 NOTE: PST refresh pending for group 2/0x23e8b0c0 (DATA) SUCCESS: refreshed PST for 2/0x23e8b0c0 (DATA) Thu Jun 12 17:46:42 2008 NOTE: requesting all-instance PST refresh for group=2 Thu Jun 12 17:46:42 2008 NOTE: PST refresh pending for group 2/0x23e8b0c0 (DATA) SUCCESS: refreshed PST for 2/0x23e8b0c0 (DATA) Thu Jun 12 17:46:48 2008 NOTE: starting rebalance of group 2/0x23e8b0c0 (DATA) at power 5 Starting background process ARB0 Starting background process ARB1 ARB0 started with pid=21, OS id=21163 Thu Jun 12 17:46:48 2008 Starting background process ARB2 ARB1 started with pid=22, OS id=21165 Thu Jun 12 17:46:48 2008 Starting background process ARB3 ARB2 started with pid=23, OS id=21167 Thu Jun 12 17:46:48 2008 Starting background process ARB4 ARB3 started with pid=24, OS id=21169 Thu Jun 12 17:46:48 2008 NOTE: assigning ARB0 to group 2/0x23e8b0c0 (DATA) ARB4 started with pid=25, OS id=21171 Thu Jun 12 17:46:48 2008 NOTE: assigning ARB1 to group 2/0x23e8b0c0 (DATA) NOTE: assigning ARB2 to group 2/0x23e8b0c0 (DATA) NOTE: assigning ARB3 to group 2/0x23e8b0c0 (DATA) NOTE: assigning ARB4 to group 2/0x23e8b0c0 (DATA) NOTE: stopping process ARB0 Thu Jun 12 17:46:59 2008 NOTE: stopping process ARB2 NOTE: stopping process ARB1 Thu Jun 12 17:47:31 2008 NOTE: stopping process ARB4 NOTE: stopping process ARB3 Thu Jun 12 17:47:36 2008 SUCCESS: rebalance completed for group 2/0x23e8b0c0 (DATA) Thu Jun 12 17:47:37 2008 SUCCESS: rebalance completed for group 2/0x23e8b0c0 (DATA) NOTE: PST update: grp = 2 NOTE: PST update: grp = 2
RACインスタンスの場合のアラート・ログ
RAC(Oracle Real Application Clusters)は、複数のコンピュータを結合させ、1つのシステムを構成し、機能させるための仕組みです。
アプリケーションのレイヤでクラスタリングを行う機構で、効率的な分散処理を実現します。
RACでは、オラクルが独自に提供するクラスタリングソフトウェア「Oracle Cluster Ready Services(CRS)」を使用して、複数のマシン上でインスタンスを稼働させ、各マシンからアクセス可能な共有ディスクにデータファイルを作成します。
この共有ディスク上のデータファイルを各インスタンスから共有し参照・更新することで、1つのデータベースを複数インスタンス(マシン)で構成するクラスタ型のデータベース(以下:RACデータベース)を提供しています。
先に解説したとおり、RACデータベースは複数のマシン上でインスタンスが稼働するため、インスタンスごとにアラート・ログが作成されます。
RACインスタンスのアラート・ログについても、初期化パラメータの情報などの出力については同様であり、表領域の変更やログスイッチなどのデータベースに対する変更も記録されます。この点は、シングル・データベースのアラート・ログと変わりはありません。
・RACインスタンスでのみ出力される情報
RACインスタンスのみ出力される重要な情報として、RACデータベースのRECONFIGURATIONの情報が記録されます。
RECONFIGURATIONとは、RACデータベースを構成するインスタンスの起動・停止に伴い、RACデータベースを構成するインスタンスの構成情報と付随するリソースの再構築の処理を意味します。
このRECONFIGURATION情報が出力されることで、他ノードの起動や停止が行われたタイミングを確認できます(リスト3)。
Fri Jun 6 11:55:47 2008 Reconfiguration started (old inc 16, new inc 18) List of nodes: 0 Global Resource Directory frozen * dead instance detected - domain 0 invalid = TRUE Communication channels reestablished Master broadcasted resource hash value bitmaps Non-local Process blocks cleaned out Fri Jun 6 11:55:47 2008 LMS 0: 0 GCS shadows cancelled, 0 closed Fri Jun 6 11:55:47 2008 LMS 1: 0 GCS shadows cancelled, 0 closed Set master node info Submitted all remote-enqueue requests Dwn-cvts replayed, VALBLKs dubious All grantable enqueues granted Post SMON to start 1st pass IR Fri Jun 6 11:55:47 2008 LMS 1: 99 GCS shadows traversed, 0 replayed Fri Jun 6 11:55:47 2008 LMS 0: 98 GCS shadows traversed, 0 replayed Fri Jun 6 11:55:47 2008 Submitted all GCS remote-cache requests Fix write in gcs resources Reconfiguration complete
RACデータベースは、複数のインスタンスで構成されていますが、どれか1つのインスタンスのアラート・ログを管理しておけばいいというものではありません。すべてのインスタンスのアラート・ログの管理が必要となります。
・RACならではのAlart.Logの読み方を覚えておこう
RACデータベース上で問題が発生した場合には、1つのインスタンス上の問題が他のインスタンスの処理に影響を与え、全体的な問題が発生するケースがあります。
よって、RACデータベース上にて問題が発生した場合には、1つのインスタンスのアラート・ログにスポットを絞って確認するのではなく、時間軸で各インスタンス上のアラート・ログ を対比させながら確認する必要があります。
・定期的なクリーンアップが必須
アラート・ログは追記型ファイルです。このため、運用時間が長くなればなるほどファイルは肥大化していきます。従って、アラート・ログは定期的に監視し、問題となるエラーなどがなければ、データベースの再起動のタイミングで削除または退避させるような運用をすることをお勧めします。
障害時にもっとも重要な情報が含まれるトレースファイルについて、次ページで確認しておきましょう。トレースファイルには異常終了時やプロセスエラー発生時の状況が記録されています。
Copyright © ITmedia, Inc. All Rights Reserved.