- PR -

Windows2003Server 予期しない再起動

1
投票結果総投票数:14
Windows 14 100.00%
  • 投票は恣意的に行われます。統計的な調査と異なり、投票データの正確性や標本の代表性は保証されません。
  • 投票結果の正当性や公平性について、@ITは一切保証も関与もいたしません。
投稿者投稿内容
まこ
会議室デビュー日: 2005/07/12
投稿数: 4
投稿日時: 2005-07-12 16:58
はじめまして。

サーバーが勝手に再起動され原因が分からずとても困っています。
Webなどで調べると最新のBIOSをあてる/電源の問題/メモリの問題/ウィルス…など
数は少ないですが色々な原因が書かれていてよく分かりませんでした。

情報は、以下の通りです。

◎サーバー情報
--------------------------------------------------------------------------------
 OS 名 :Microsoft(R) Windows(R) Server 2003, Standard Edition
 バーョン :5.2.3790 ビルド 3790
 OS 製造元 :Microsoft Corporation
 システム製造元 :IBM
 システムモデル :eserver xSeries 235 -[86718XJ]-
 システムの種類 :X86-ベース PC
--------------------------------------------------------------------------------

◎問題
--------------------------------------------------------------------------------
システムが勝手に再起動されてしまいます。
10ヶ月で不定期に10回再起動されました。

再起動された時にイベントビューアに記録される情報は2パターンあります。
 1.以下、@-1〜@-3までのエラーが記録される。
 2.以下、A-1のエラーが記録される。
同じシステムをWindows2000Serverで運用していた時には問題は起こりませんでした。

Windows2003Serverとインストールしているドライバやアプリケーションに互換性がない
のでしょうか…
--------------------------------------------------------------------------------

◎これまでの対応
--------------------------------------------------------------------------------
・5回目位に再起動になった時にMSDNのサポートからSP1を入手してあてました。
 ※その時点でSP1はオフィシャルではありませんでした。
・サーバー製造元に確認をしてBIOSを最新にアップしました。
 ※これらのエラーがBIOS関係でない事を確認してもらいました。
--------------------------------------------------------------------------------

@-1
--------------------------------------------------------------------------------
種類 :エラー
ソース :System Error
イベントID :1003
説明 :
 エラー コード 1000008e、パラメータ1 c000001d、パラメータ2 b65e67a5,
 パラメータ3 b661dd40、パラメータ4 00000000.
--------------------------------------------------------------------------------


@-2
--------------------------------------------------------------------------------
種類 :警告
ソース :USER32
イベントID :1076
説明 :
 ユーザー US102\\Administrator は、このコンピュータの前回の予期しない再起動の
 理由として、次の理由を提供しました: システム障害: STOP エラー
  理由コード: 0x805000f
  バグ ID:
  バグチェック文字列: 0x0000008e (0xc0000005, 0xf76788a9, 0xb5fa6b98, 0x00000000)
  コメント:0x0000008e (0xc0000005, 0xf76788a9, 0xb5fa6b98, 0x00000000)
--------------------------------------------------------------------------------


@-3
--------------------------------------------------------------------------------
種類 :情報
ソース :Save Dump
イベントID :1001
説明 :
 このコンピュータはバグチェック後、再起動されました。
 バグチェック: 0x0000008e (0xc000001d, 0xb65e67a5, 0xb661dd40, 0x00000000)
 ダンプが保存されました: C:\\WINDOWS\\MEMORY.DMP
--------------------------------------------------------------------------------


A-1
--------------------------------------------------------------------------------
種類 :情報
種類 :警告
ソース :USER32
説明 :
 ユーザー US102\\Administrator は、このコンピュータの前回の予期しない再起動の
 理由として、次の理由を提供しました: その他 (計画外)
  理由コード: 0xa000000
  バグ ID:
  バグチェック文字列:
  コメント:u
--------------------------------------------------------------------------------

どうかヨロシクお願い致します。
saysos
常連さん
会議室デビュー日: 2005/06/30
投稿数: 23
投稿日時: 2005-07-13 11:37
こんにちは、大変ですね。
私もトラブルシュートで苦労した経験が幾度となくあります。

基本的に、OSやBIOSのバージョンは仕方がないにしても、買った時の状態でそのような症状が出れば、
有償かもしれませんがメーカが対応してくれるのではないでしょうか?
また、メーカーのサイトに行って製品情報を見直してみたりするのも大切です(トラブル情報があったりします)。
あるいは、MSに問い合わせる方法もあると思います。これも有償かもしれませんが。

自助努力では、

買った時の状態(初期状態)に戻し、SWにしろHWにしろ、あるいは設定にしろ、
怪しい順に一つ一つ追加なり変更なりして様子を見てみる。

とか

セーフモードから個別に一つ一つドライバ類の組み込みを
やめた状態で立ち上げて様子を見てみる。

とか

サービスの起動を最小限にして一つ一つ追加して様子を見てみる。

などでまず原因を突き止める、位しか思い浮かびません。
運用中でできない場合もあるのかもしれませんが。
それで運用できているなら、そのまま使い続けるしかないのではないでしょうか。

通り一辺倒な回答ですが、無回答状態なのも同じ経験を持つ者として忍びないものがありましたので、
ご返事させて頂きました。
まこ
会議室デビュー日: 2005/07/12
投稿数: 4
投稿日時: 2005-07-14 10:16
saysos様

おはようございます!

気遣っていただきとても嬉しいです。
ありがとうございます。

問題のサーバーにはシステムが導入されていて現在運用中なので教えていただいたことを試せないのですが、再発するということはなにかしら原因となっていることがあり、その原因を1つ1つ地道に突き止めていくしかないのですね...。

実は、全く同じ設定のサーバーがもう1台稼動していますが、それも同様にSTOPエラーを起こしています。
でも、メインのサーバーがダウンした時にもう1台のサーバーに自動で切替わるように設定しているので実際にSTOPエラーとなってもシステムが停止することはありませんが、切替った際にエラーを表示して管理者に知らせるように言ってあるのでサーバーがダウンしているのがバレてしまい心象がよくありません。

それと、もう1台全く同じ設定の予備サーバーがありますがそちらはSTOPエラーを起こしたことはありません。違いは、そのサーバーは仮環境(ローカル)で追加案件を開発するのに使用していて本番環境につなげていないということです。

その辺でなにか絞れてくるかもしれません。


サポートについて
----------------
製造元
>今年始めに無償で問い合わせができました。BIOS関係でのエラーではないが、BIOSを最新にして下さいと。
MSDN
>今年初めに有償でサポートを依頼しました。その時に今回のエラーが対象になってるかもしれない部分のSP1を送ってもらいあてました。それで様子を見て下さいと言われましたが、再発しているのでもう1度サポートを再依頼してみます(できるかな?)

今後、やってみようと思っていること
---------------------------------
MEMORY.DMPが生成されているので確認してみようと思います。ちゃんと解析できれば問題となってるドライバが分かるそうです。(ちょっと見方が難しそうなので自信がありませんが、、)

saysosさん、今後ともよろしくお願いします。


otoha
会議室デビュー日: 2005/06/24
投稿数: 10
投稿日時: 2005-07-14 17:27
こんにちわ。otohaと申します。
こういうネタ(STOP系)の時だけ出没する怪しいヤツです、、、

コードが0x8Eの場合はカッコの中の2つめの引数(0xb65e67a5)がエラーの発生した
アドレスです。まずはそこにあったドライバを突き止めましょう。

サポートツールをインストールして、コマンドプロンプトで「dumpchk.exe ダンプファイル名」を実行してみてください。
ロードされたドライバの一覧が出ます。スタートのアドレスとエンドのアドレスが出るので、まずは b65e67a5 がどのドライバなのかを調べてみてください。
分からなければここに貼り付けておいてください。見てみます。

それと、もし可能であればイベントログを「save dump」でフィルタして頂き、そのコードの一覧を教えてください。パターンがあるはずなんで。

もしOSのファイルでエラーになっていた場合はダンプの調査が必要になりますのでその時はまたご連絡ください。

それでは!!ご検討を祈ります。
まこ
会議室デビュー日: 2005/07/12
投稿数: 4
投稿日時: 2005-07-14 19:35
otoha様

こんにちは。
>こういうネタ(STOP系)の時だけ出没する怪しいヤツです、、、
 心強いです。
 otohaさんの他の方への対応を読ませていただいたり、HPを読ませてもらいました。
 どうぞよろしくお願いします。

>コードが0x8Eの場合はカッコの中の2つめの引数(0xb65e67a5)がエラーの発生した
>アドレスです。まずはそこにあったドライバを突き止めましょう。
 このような事は、どこで勉強されたのですか?


本題です。

Save Dump
--------------
厚かましく2台のサーバー分です。

Save Dumpのコード一覧

 1台目のサーバー
 ------------------------------------------------------------------------
 2004/07/26 0x00000050 (0xb281db9a, 0x00000000, 0x804e2f80, 0x00000000)
 2004/07/23 0x0000008e (0xc0000005, 0x804e2f80, 0xb7257cf0, 0x00000000)
 2004/09/19 0x00000050 (0x9133f8e1, 0x00000000, 0x804e2f80, 0x00000000)
 2005/02/08 0x0000008e (0xc0000005, 0x804e2f80, 0xb65a2cf0, 0x00000000)
 2005/03/30 0x00000050 (0x802794cd, 0x00000000, 0x804e2f80, 0x00000000)
 2005/06/25 0x0000007f (0x00000008, 0xf7737ef0, 0x00000000, 0x00000000)
 2005/07/12 0x0000008e (0xc0000005, 0x804e2f80, 0xb7303cf0, 0x00000000)
 ------------------------------------------------------------------------

 2台目のサーバー
 ------------------------------------------------------------------------
 2004/07/14 0x0000008e (0xc0000005, 0xbf8e8d73, 0xb6520304, 0x00000000)
 2004/09/06 0x0000008e (0xc0000005, 0xf76788a9, 0xb5fa6b98, 0x00000000)
 2004/09/13 0x0000008e (0xc000001d, 0xb65e67a5, 0xb661dd40, 0x00000000)
 2004/11/16 0x0000008e (0xc0000005, 0x804e2f80, 0xb685fcf0, 0x00000000)
 2005/02/20 0x0000008e (0xc0000005, 0x804e2f80, 0xb5771cf0, 0x00000000)
 2005/07/09 0x00000050 (0xb281db9a, 0x00000000, 0x804e2f80, 0x00000000)
 ------------------------------------------------------------------------



dumpchk.exe
-----------------
これは事情がありできませんでした。
でも、ご意見を頂く前にPstat.exeはやってました。
そこにもドライバーの一覧がありましたが参考になりませんか?
一応、関係しそうな部分だけ貼り付けてみます。

 1台目のサーバー
 ------------------------------------------------------------------------
 ※0x804e2f80に関係しそうなもの
  ntoskrnl.exe  804E1000  ← これかな?
  hal.dll     8074A000

 ※0xf7737ef0に関係しそうなもの
  pciide.sys  F7717000
  dmload.sys  F771F000  ← これかな?
  Fs_Rec.SYS  F778F000
 ------------------------------------------------------------------------

 2台目のサーバー
 ------------------------------------------------------------------------
 ※0xbf8e8d73に関係しそうなもの
  usbohci.sys  BACCB000
  win32k.sys  BF800000  ← これかな?
  ati2drad.dll  BF9C6000

 ※0xf76788a9に関係しそうなもの
  netbios.sys  F75F7000  ← これかな?
  dump_nfrd960.sys  F76A7000

 ※0xb65e67a5に関係しそうなもの
  VIDEOPRT.SYS  BA604000
  ati2mpad.sys  BA61D000  ← これかな?

 ※0x804e2f80に関係しそうなもの
  ntoskrnl.exe  804E1000  ← これかな?
  hal.dll   8074A000
 ------------------------------------------------------------------------


どうぞよろしくお願い致します。
otoha
会議室デビュー日: 2005/06/24
投稿数: 10
投稿日時: 2005-07-14 22:48
見てみました。
結構厳しいですね(役立たずの本領発揮・・・??)

まず、注目すべきは2台とも 0x804e2f80 というアドレスでSTOPが頻発
している点です(合計9回)。
このアドレスはご指摘の通り、カーネルの置かれるアドレスです。
つまりこれについてのSTOPはダンプを見ないと何とも・・・

1台目の0x0000007fについて。
このコードはスタックオーバーフローです、2番目のパラメーターはスタックの
アドレスなので、ドライバは突き止められず・・・

2台目
0xbf8e8d73:これも指摘通り win32k.sys の内部です。
0xf7737ef0:これはたぶん他の所です(netbios.sysはそこまで大きくないので)。
0xb65e67a5:1つめのパラメーターが 0xc000001d です。これはCPUが解釈できない
 命令を実行した事を意味するコードです、つまり、暴走の結果プログラムコード
 ではない場所(データ領域など)を実行したためと判断できます。

総合すると、カーネル(win32k.sysも含む)内部でのSTOPがほとんどで現状では
何ともいえない状況です。すみません、、、お役に立てずです、、
しかし原因はソフトだと思いますよ。
経験からですが、STOPエラーの9割以上はソフトです。

では次の段階ですね。
ntoskrnl.exe / win32k.sys の日付を教えてください。
同じモジュールからエラーになっている関数名を調べてみます。
そこでさらに何かしらの見解が出せるかどうかですが、、、(あまり期待しないで・・)
あと、CPUがマルチなのかシングルなのかも教えてください。

p.s
もしどこかにダンプを置いて頂ければこちらで調べることはいつでもできます。
(PMでもメールでも頂ければ調べます。もちろん結果はここにフィードバック
 する義務がありますから、原因がどうであれここに報告させて頂きます)
 
・・・さっそくダメ男ぶりを発揮しています。ワタシ・・・

[ メッセージ編集済み 編集者: otoha 編集日時 2005-07-15 10:32 ]
まこ
会議室デビュー日: 2005/07/12
投稿数: 4
投稿日時: 2005-07-21 09:16
otohaさま

おはようございます。
なかなか返答できず申し訳ございません。

仕事が立て込んでいて時間を取る事ができない状態です。
また、必ず返答しますので、よろしくお願いします。
balance
会議室デビュー日: 2006/02/09
投稿数: 1
投稿日時: 2006-02-09 11:58
もう見てないかもしれませんが。。。ServeRAIDのドライバが原因と思われます
1

スキルアップ/キャリアアップ(JOB@IT)