- - PR -
Windows2003Server 予期しない再起動
1
投票結果総投票数:14 | |||
---|---|---|---|
Windows | ![]() |
14票 | 100.00% |
|
投稿者 | 投稿内容 |
---|---|
|
投稿日時: 2005-07-12 16:58
はじめまして。
サーバーが勝手に再起動され原因が分からずとても困っています。 Webなどで調べると最新のBIOSをあてる/電源の問題/メモリの問題/ウィルス…など 数は少ないですが色々な原因が書かれていてよく分かりませんでした。 情報は、以下の通りです。 ◎サーバー情報 -------------------------------------------------------------------------------- OS 名 :Microsoft(R) Windows(R) Server 2003, Standard Edition バーョン :5.2.3790 ビルド 3790 OS 製造元 :Microsoft Corporation システム製造元 :IBM システムモデル :eserver xSeries 235 -[86718XJ]- システムの種類 :X86-ベース PC -------------------------------------------------------------------------------- ◎問題 -------------------------------------------------------------------------------- システムが勝手に再起動されてしまいます。 10ヶ月で不定期に10回再起動されました。 再起動された時にイベントビューアに記録される情報は2パターンあります。 1.以下、@-1〜@-3までのエラーが記録される。 2.以下、A-1のエラーが記録される。 同じシステムをWindows2000Serverで運用していた時には問題は起こりませんでした。 Windows2003Serverとインストールしているドライバやアプリケーションに互換性がない のでしょうか… -------------------------------------------------------------------------------- ◎これまでの対応 -------------------------------------------------------------------------------- ・5回目位に再起動になった時にMSDNのサポートからSP1を入手してあてました。 ※その時点でSP1はオフィシャルではありませんでした。 ・サーバー製造元に確認をしてBIOSを最新にアップしました。 ※これらのエラーがBIOS関係でない事を確認してもらいました。 -------------------------------------------------------------------------------- @-1 -------------------------------------------------------------------------------- 種類 :エラー ソース :System Error イベントID :1003 説明 : エラー コード 1000008e、パラメータ1 c000001d、パラメータ2 b65e67a5, パラメータ3 b661dd40、パラメータ4 00000000. -------------------------------------------------------------------------------- @-2 -------------------------------------------------------------------------------- 種類 :警告 ソース :USER32 イベントID :1076 説明 : ユーザー US102\\Administrator は、このコンピュータの前回の予期しない再起動の 理由として、次の理由を提供しました: システム障害: STOP エラー 理由コード: 0x805000f バグ ID: バグチェック文字列: 0x0000008e (0xc0000005, 0xf76788a9, 0xb5fa6b98, 0x00000000) コメント:0x0000008e (0xc0000005, 0xf76788a9, 0xb5fa6b98, 0x00000000) -------------------------------------------------------------------------------- @-3 -------------------------------------------------------------------------------- 種類 :情報 ソース :Save Dump イベントID :1001 説明 : このコンピュータはバグチェック後、再起動されました。 バグチェック: 0x0000008e (0xc000001d, 0xb65e67a5, 0xb661dd40, 0x00000000) ダンプが保存されました: C:\\WINDOWS\\MEMORY.DMP -------------------------------------------------------------------------------- A-1 -------------------------------------------------------------------------------- 種類 :情報 種類 :警告 ソース :USER32 説明 : ユーザー US102\\Administrator は、このコンピュータの前回の予期しない再起動の 理由として、次の理由を提供しました: その他 (計画外) 理由コード: 0xa000000 バグ ID: バグチェック文字列: コメント:u -------------------------------------------------------------------------------- どうかヨロシクお願い致します。 |
|
投稿日時: 2005-07-13 11:37
こんにちは、大変ですね。
私もトラブルシュートで苦労した経験が幾度となくあります。 基本的に、OSやBIOSのバージョンは仕方がないにしても、買った時の状態でそのような症状が出れば、 有償かもしれませんがメーカが対応してくれるのではないでしょうか? また、メーカーのサイトに行って製品情報を見直してみたりするのも大切です(トラブル情報があったりします)。 あるいは、MSに問い合わせる方法もあると思います。これも有償かもしれませんが。 自助努力では、 買った時の状態(初期状態)に戻し、SWにしろHWにしろ、あるいは設定にしろ、 怪しい順に一つ一つ追加なり変更なりして様子を見てみる。 とか セーフモードから個別に一つ一つドライバ類の組み込みを やめた状態で立ち上げて様子を見てみる。 とか サービスの起動を最小限にして一つ一つ追加して様子を見てみる。 などでまず原因を突き止める、位しか思い浮かびません。 運用中でできない場合もあるのかもしれませんが。 それで運用できているなら、そのまま使い続けるしかないのではないでしょうか。 通り一辺倒な回答ですが、無回答状態なのも同じ経験を持つ者として忍びないものがありましたので、 ご返事させて頂きました。 |
|
投稿日時: 2005-07-14 10:16
saysos様
おはようございます! 気遣っていただきとても嬉しいです。 ありがとうございます。 問題のサーバーにはシステムが導入されていて現在運用中なので教えていただいたことを試せないのですが、再発するということはなにかしら原因となっていることがあり、その原因を1つ1つ地道に突き止めていくしかないのですね...。 実は、全く同じ設定のサーバーがもう1台稼動していますが、それも同様にSTOPエラーを起こしています。 でも、メインのサーバーがダウンした時にもう1台のサーバーに自動で切替わるように設定しているので実際にSTOPエラーとなってもシステムが停止することはありませんが、切替った際にエラーを表示して管理者に知らせるように言ってあるのでサーバーがダウンしているのがバレてしまい心象がよくありません。 それと、もう1台全く同じ設定の予備サーバーがありますがそちらはSTOPエラーを起こしたことはありません。違いは、そのサーバーは仮環境(ローカル)で追加案件を開発するのに使用していて本番環境につなげていないということです。 その辺でなにか絞れてくるかもしれません。 サポートについて ---------------- 製造元 >今年始めに無償で問い合わせができました。BIOS関係でのエラーではないが、BIOSを最新にして下さいと。 MSDN >今年初めに有償でサポートを依頼しました。その時に今回のエラーが対象になってるかもしれない部分のSP1を送ってもらいあてました。それで様子を見て下さいと言われましたが、再発しているのでもう1度サポートを再依頼してみます(できるかな?) 今後、やってみようと思っていること --------------------------------- MEMORY.DMPが生成されているので確認してみようと思います。ちゃんと解析できれば問題となってるドライバが分かるそうです。(ちょっと見方が難しそうなので自信がありませんが、、) saysosさん、今後ともよろしくお願いします。 |
|
投稿日時: 2005-07-14 17:27
こんにちわ。otohaと申します。
こういうネタ(STOP系)の時だけ出没する怪しいヤツです、、、 コードが0x8Eの場合はカッコの中の2つめの引数(0xb65e67a5)がエラーの発生した アドレスです。まずはそこにあったドライバを突き止めましょう。 サポートツールをインストールして、コマンドプロンプトで「dumpchk.exe ダンプファイル名」を実行してみてください。 ロードされたドライバの一覧が出ます。スタートのアドレスとエンドのアドレスが出るので、まずは b65e67a5 がどのドライバなのかを調べてみてください。 分からなければここに貼り付けておいてください。見てみます。 それと、もし可能であればイベントログを「save dump」でフィルタして頂き、そのコードの一覧を教えてください。パターンがあるはずなんで。 もしOSのファイルでエラーになっていた場合はダンプの調査が必要になりますのでその時はまたご連絡ください。 それでは!!ご検討を祈ります。 |
|
投稿日時: 2005-07-14 19:35
otoha様
こんにちは。 >こういうネタ(STOP系)の時だけ出没する怪しいヤツです、、、 心強いです。 otohaさんの他の方への対応を読ませていただいたり、HPを読ませてもらいました。 どうぞよろしくお願いします。 >コードが0x8Eの場合はカッコの中の2つめの引数(0xb65e67a5)がエラーの発生した >アドレスです。まずはそこにあったドライバを突き止めましょう。 このような事は、どこで勉強されたのですか? 本題です。 Save Dump -------------- 厚かましく2台のサーバー分です。 Save Dumpのコード一覧 1台目のサーバー ------------------------------------------------------------------------ 2004/07/26 0x00000050 (0xb281db9a, 0x00000000, 0x804e2f80, 0x00000000) 2004/07/23 0x0000008e (0xc0000005, 0x804e2f80, 0xb7257cf0, 0x00000000) 2004/09/19 0x00000050 (0x9133f8e1, 0x00000000, 0x804e2f80, 0x00000000) 2005/02/08 0x0000008e (0xc0000005, 0x804e2f80, 0xb65a2cf0, 0x00000000) 2005/03/30 0x00000050 (0x802794cd, 0x00000000, 0x804e2f80, 0x00000000) 2005/06/25 0x0000007f (0x00000008, 0xf7737ef0, 0x00000000, 0x00000000) 2005/07/12 0x0000008e (0xc0000005, 0x804e2f80, 0xb7303cf0, 0x00000000) ------------------------------------------------------------------------ 2台目のサーバー ------------------------------------------------------------------------ 2004/07/14 0x0000008e (0xc0000005, 0xbf8e8d73, 0xb6520304, 0x00000000) 2004/09/06 0x0000008e (0xc0000005, 0xf76788a9, 0xb5fa6b98, 0x00000000) 2004/09/13 0x0000008e (0xc000001d, 0xb65e67a5, 0xb661dd40, 0x00000000) 2004/11/16 0x0000008e (0xc0000005, 0x804e2f80, 0xb685fcf0, 0x00000000) 2005/02/20 0x0000008e (0xc0000005, 0x804e2f80, 0xb5771cf0, 0x00000000) 2005/07/09 0x00000050 (0xb281db9a, 0x00000000, 0x804e2f80, 0x00000000) ------------------------------------------------------------------------ dumpchk.exe ----------------- これは事情がありできませんでした。 でも、ご意見を頂く前にPstat.exeはやってました。 そこにもドライバーの一覧がありましたが参考になりませんか? 一応、関係しそうな部分だけ貼り付けてみます。 1台目のサーバー ------------------------------------------------------------------------ ※0x804e2f80に関係しそうなもの ntoskrnl.exe 804E1000 ← これかな? hal.dll 8074A000 ※0xf7737ef0に関係しそうなもの pciide.sys F7717000 dmload.sys F771F000 ← これかな? Fs_Rec.SYS F778F000 ------------------------------------------------------------------------ 2台目のサーバー ------------------------------------------------------------------------ ※0xbf8e8d73に関係しそうなもの usbohci.sys BACCB000 win32k.sys BF800000 ← これかな? ati2drad.dll BF9C6000 ※0xf76788a9に関係しそうなもの netbios.sys F75F7000 ← これかな? dump_nfrd960.sys F76A7000 ※0xb65e67a5に関係しそうなもの VIDEOPRT.SYS BA604000 ati2mpad.sys BA61D000 ← これかな? ※0x804e2f80に関係しそうなもの ntoskrnl.exe 804E1000 ← これかな? hal.dll 8074A000 ------------------------------------------------------------------------ どうぞよろしくお願い致します。 |
|
投稿日時: 2005-07-14 22:48
見てみました。
結構厳しいですね(役立たずの本領発揮・・・??) まず、注目すべきは2台とも 0x804e2f80 というアドレスでSTOPが頻発 している点です(合計9回)。 このアドレスはご指摘の通り、カーネルの置かれるアドレスです。 つまりこれについてのSTOPはダンプを見ないと何とも・・・ 1台目の0x0000007fについて。 このコードはスタックオーバーフローです、2番目のパラメーターはスタックの アドレスなので、ドライバは突き止められず・・・ 2台目 0xbf8e8d73:これも指摘通り win32k.sys の内部です。 0xf7737ef0:これはたぶん他の所です(netbios.sysはそこまで大きくないので)。 0xb65e67a5:1つめのパラメーターが 0xc000001d です。これはCPUが解釈できない 命令を実行した事を意味するコードです、つまり、暴走の結果プログラムコード ではない場所(データ領域など)を実行したためと判断できます。 総合すると、カーネル(win32k.sysも含む)内部でのSTOPがほとんどで現状では 何ともいえない状況です。すみません、、、お役に立てずです、、 しかし原因はソフトだと思いますよ。 経験からですが、STOPエラーの9割以上はソフトです。 では次の段階ですね。 ntoskrnl.exe / win32k.sys の日付を教えてください。 同じモジュールからエラーになっている関数名を調べてみます。 そこでさらに何かしらの見解が出せるかどうかですが、、、(あまり期待しないで・・) あと、CPUがマルチなのかシングルなのかも教えてください。 p.s もしどこかにダンプを置いて頂ければこちらで調べることはいつでもできます。 (PMでもメールでも頂ければ調べます。もちろん結果はここにフィードバック する義務がありますから、原因がどうであれここに報告させて頂きます) ・・・さっそくダメ男ぶりを発揮しています。ワタシ・・・ [ メッセージ編集済み 編集者: otoha 編集日時 2005-07-15 10:32 ] |
|
投稿日時: 2005-07-21 09:16
otohaさま
おはようございます。 なかなか返答できず申し訳ございません。 仕事が立て込んでいて時間を取る事ができない状態です。 また、必ず返答しますので、よろしくお願いします。 |
|
投稿日時: 2006-02-09 11:58
もう見てないかもしれませんが。。。ServeRAIDのドライバが原因と思われます
|
1