- - PR -
Windows2003 CoreDump解析(KeWaitForSingleObject)
1
投稿者 | 投稿内容 | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
投稿日時: 2008-04-29 22:20
お世話になります。
下記サーバにて再起動が発生し、CoreDumpしました。 ------------------------ OS:WindowsServer2003 SE SP1 Server:HP ML350G5 CPU:Xeon 5130 DC 2.00GHz Memory:4GB ------------------------ IMLをみたところASRが発生し再起動したようです。 dumpファイルをデバッグしたところ(デバッグログは下方にあります。) ntkrnlmp.exeが原因(?)のようです。 ntkrnlmp.exe がマルチプロセッサ用カーネルだというのはわかりましたが、 KeWaitForSingleObject が何なのかまだ調べ切れておらず、 私もWindowsのデバッグが初めてなのでWindowsカーネルには精通しておらず、ちょっと困っています。 #土曜に再起動したのでblue screenの画面見れていません。 なお、再起動後、デバイスマネージャー上の全デバイスは正常に認識されています。 KeWaitForSingleObjectが何であるのかご存知の方、過去に遭遇したことのある方、 原因等わかりましたら教えてください。 ■以下、analyze -v の結果です。 2: kd> !analyze -v ******************************************************************************* * * * Bugcheck Analysis * * * ******************************************************************************* IRQL_NOT_LESS_OR_EQUAL (a) An attempt was made to access a pageable (or completely invalid) address at an interrupt request level (IRQL) that is too high. This is usually caused by drivers using improper addresses. If a kernel debugger is available get the stack backtrace. Arguments: Arg1: 00000000, memory referenced Arg2: 0000001b, IRQL Arg3: 00000001, bitfield : bit 0 : value 0 = read operation, 1 = write operation bit 3 : value 0 = not an execute operation, 1 = execute operation (only on chips which support this level of status) Arg4: 8083f112, address which referenced memory Debugging Details: ------------------ WRITE_ADDRESS: 00000000 CURRENT_IRQL: 1b FAULTING_IP: nt!KeWaitForSingleObject+24f 8083f112 8919 mov dword ptr [ecx],ebx DEFAULT_BUCKET_ID: DRIVER_FAULT BUGCHECK_STR: 0xA PROCESS_NAME: System TRAP_FRAME: b7c36b30 -- (.trap 0xffffffffb7c36b30) ErrCode = 00000002 eax=86000108 ebx=86bc9e58 ecx=00000000 edx=86000100 esi=86bc9db0 edi=86bc9e28 eip=8083f112 esp=b7c36ba4 ebp=b7c36be4 iopl=0 nv up ei ng nz na pe cy cs=0008 ss=0010 ds=0023 es=0023 fs=0030 gs=0000 efl=00010287 nt!KeWaitForSingleObject+0x24f: 8083f112 8919 mov dword ptr [ecx],ebx ds:0023:00000000=???????? Resetting default scope LAST_CONTROL_TRANSFER: from 8083f112 to 80837ed5 STACK_TEXT: b7c36b30 8083f112 badb0d00 86000100 8083f78d nt!KiTrap0E+0x2a7 b7c36be4 808412ab 86000100 0000001b 00000000 nt!KeWaitForSingleObject+0x24f b7c36c1c 80841266 00000000 efb9d9a8 852ff570 nt!ExpWaitForResource+0x30 b7c36c3c f721b438 8642ab08 852ff501 b7c36c70 nt!ExAcquireResourceExclusiveLite+0x8d b7c36c4c f724d3dc 852ff570 efb9d9a8 852ff501 Ntfs!NtfsAcquireResourceExclusive+0x20 b7c36c70 f72474b7 852ff501 efb9d9a8 00000000 Ntfs!NtfsAcquireExclusiveFcb+0x42 b7c36cec f7249f67 852ff570 efb9da70 efb9d9a8 Ntfs!NtfsCommonClose+0x8a b7c36d80 8083f72e 00000000 00000000 86bc9db0 Ntfs!NtfsFspClose+0xe2 b7c36dac 8092ccff 00000000 00000000 00000000 nt!ExpWorkerThread+0xeb b7c36ddc 80841a96 8083f671 80000000 00000000 nt!PspSystemThreadStartup+0x2e 00000000 00000000 00000000 00000000 00000000 nt!KiThreadStartup+0x16 STACK_COMMAND: kb FOLLOWUP_IP: nt!KeWaitForSingleObject+24f 8083f112 8919 mov dword ptr [ecx],ebx SYMBOL_STACK_INDEX: 1 SYMBOL_NAME: nt!KeWaitForSingleObject+24f FOLLOWUP_NAME: MachineOwner MODULE_NAME: nt IMAGE_NAME: ntkrnlmp.exe DEBUG_FLR_IMAGE_TIMESTAMP: 42435e60 FAILURE_BUCKET_ID: 0xA_W_nt!KeWaitForSingleObject+24f BUCKET_ID: 0xA_W_nt!KeWaitForSingleObject+24f Followup: MachineOwner --------- ■以下、Windowsのイベントログです。 このコンピュータはバグチェック後、再起動されました。バグチェック: 0x0000000a (0x00000000, 0x0000001b, 0x00000001, 0x8083f112) ダンプが保存されました: C:\WINDOWS\MEMORY.DMP | ||||||||||||
|
投稿日時: 2008-04-29 22:58
私は IML や ASR という用語は知らないのですが、Windows NT の昔から、落ちたときに IRQL_NOT_LESS_OR_EQUAL のように、IRQ などハードウェアっぽいものが現れたら、メモリーなどハードウェアの故障である可能性が高いと考えます。 KeWaitForSingleObject という API も良くは知りませんが、名称からしてなにか「待ち」に入るものであり、待っている期間があってその期間中にたまたまハードウェア割り込みなどに関連するエラーが発生しただけであり、KeWaitForSingleObject 自体の問題ではないように思います。 私だったら、ハードウェアの診断プログラムなどを動かして様子をみます。 トラブル解析に時間やお金がかかるようであり、それを回避したいならば、ハードウェア一式を取り替えてみる手もあります。(個人的には好きではありませんが。) | ||||||||||||
|
投稿日時: 2008-05-19 11:31
unibonさん
有難う御座います。 返信遅くなりすいません。 まずSWの問題かHWの問題か切り分けるためにHWのdiagをかける必要がありますが、 開発サーバのためなかなか停止調整ができないでいます。 それ以降HWエラーやリセットも発生していないことですので、少し様子を見ることにします。 ちなみに、以下参考までに。 IML(Integrated Management Log):hpのProLiant製品群におけるHWログです。 ASR(Automatic System Reset):チップからSWに対し死活監視を行い、一定時間応答がない場合hangしたものと見做しリセットさせる機能です。この機能はhp製品に限りません。 | ||||||||||||
|
投稿日時: 2008-05-22 16:43
こんにちは。
遅レスですが。。
ASR(これはwatch dog timerのことだと思う)が こいつが、動作してdumpを吐くよう指示をだしたっぽい のであれば(HWログから)ntkrnlmp.exeをkickしたんだと 思います。 だから、dump上はntkrnlmp.exeなんじゃないですかね。 わかんないですけど、メーカやベンダにたずねた方がいいのではないでしょうか? #開発サーバなら誰かがkernel空間までとめるような何かをした?(笑) | ||||||||||||
|
投稿日時: 2008-05-22 18:49
一般的には driver の問題だと思いますけどね。
Stop IRQL_NOT_LESS_OR_EQUAL (0xA) エラー発生後のシステムのデバッグ方法 なんてまさにという感じのものがありますが、こちらは確認されたんですよね? |
1