- PR -

ActiveDirectoryサーバーでRPCエンドポイントマッパーエラーが発生する。

1
投稿者投稿内容
Sparhawk
会議室デビュー日: 2007/06/14
投稿数: 10
投稿日時: 2007-06-14 15:39
初めて書き込みします。

以下の様にサーバー2台構成でActiveDirectory運用しております。
---------------------------------------------
Server_A:
 Windows Server2003SP1 ActiveDirectory
            FSMO
            DNSサーバー AD統合
Server_B:
 Windows Server2003SP1 ActiveDirectory
            FSMOなし
            DNSサーバー AD統合
----------------------------------------------

最近、Server_Aの構成でH/W障害が発生したため約1日程Server_Bのみで
運用し、Server_Aの障害復旧後にServer_Aを起動しました。
Server_AはFSMOだったのですが、ディスク障害ではなかったため短時間で
復旧できると思い、Server_BにFSMO移行せず運用しました。

この状態でServer_Bのレプリケーションイベントで次の様なエラーが
発生しました。

-------------------------------------------------------------------------------
イベントの種類: 警告
イベント ソース: NTDS Replication
イベント カテゴリ: レプリケーション
イベント ID: 1586
ユーザー: NT AUTHORITY\\\\ANONYMOUS LOGON
説明:
PDC エミュレータ マスタとの、Windows NT 4.0 またはそれ以前のレプリケーション チェックポイントに失敗しました。

PDC エミュレータ マスタ役割がローカル ドメイン コントローラに次に成功したチェックポイントの前に転送される場合は、Windows NT 4.0 およびそれ以前の OS を実行しているドメイン コントローラにセキュリティ アカウント マネージャ (SAM) データベースの完全同期が実行される可能性があります。

4 時間後にチェックポイント処理を再試行します。

追加のデータ
エラー値:
1753 エンドポイント マッパーから使用できるエンドポイントはこれ以上ありません。

-------------------------------------------------------------------------------

「1753エンドポイント 」について調べましたら、RPCで使用されるTCPポートがないとの事、NETSTATコマンドで確認した所、ポート5000までのポート(全てではありませんが)がServer_A ポート1025に対してTIME_WAITの状態で使用されていました。
数時間ほど定期的にNETSTATでポート状態を確認していたのですが、ポートが解放される
ことはありせんでした。


そこで質問なのですが

1) FSMOをもつActiveDirectoryサーバーが長時間ダウンする場合、Server_BにFSMOを移行
  する必要はありますか?(FSMO移行する目安の時間がある?)
2) 1753:エンドポイント 〜のエラーが発生した場合、一般的にどのような対処が
  必要になりますか?
 (http://support.microsoft.com/kb/839880/jaを参照し、ポート番号の拡張方法があることは確認しました。)
3) NETSTAT で表示されるポートがTIME_WAITのまま状態が変わらない現象を解消するこ
  とはできますか?

現時点では各サーバーの再起動くらいしか解決策が考え付かない状態です。
不足している情報等あるかとは思いますが、何か解決の手がかりになる情報がありまし
たらアドバイスお願いいたします。



チャブーン
大ベテラン
会議室デビュー日: 2006/11/25
投稿数: 149
投稿日時: 2007-06-15 11:22
チャブーンです。

FSMO のダウンタイムが許される(?)目安、といった一般的な値はありません。FSMO にはいくつかの機能があり、「この機能を使わないとシステムが立ちいかない」ときにないと困る、ということで、このタイミングはシステムによって違うからです。

ですが、特別なシチュエーションを除いては、1 日程度 FSMO がダウンしていても普通は問題はありません。

イベント ID: 1586 エラーは Windows NT 4.0 BDC が複製を行なうときに必要な情報が得られなかった、ということを指しているので、BDC が存在しない限り、エラーそのものは無視して問題ありません。

で、RPC エンドポイントの問題、という点では、基本的には KB839880 の資料を参考にして対応することになりますが、ケースバイケースなので、一般論といったものはないでしょう。

このケースでは、RPC クライアント側でポートがいっぱいになってしまっている、という風にみえるので、RPC というより TCP/IP レベルでエフェメラルポートの上限値を増やすといった方法があるかもしれません。

http://support.microsoft.com/kb/196271

TIME_WAIT 設定の調整を行なうには TCP/IP のレジストリ値 TcpTimedWaitDelay を調整します。デフォルトでは 120 秒たつとポートが開放される実装です。

http://www.microsoft.com/japan/technet/windowsserver/2003/technologies/networking/tcpip03.mspx

ですが、どちらもネットワーク負荷が高い環境などでのチューニングテクニックに属する内容で、このケースのような場面で調整が必要な内容ではありません。とりあえず、両ドメインコントローラを再起動して様子を見て、(他の内容も含めて) エラーが現れないか確認したほうがよいかもしれません。
Sparhawk
会議室デビュー日: 2007/06/14
投稿数: 10
投稿日時: 2007-06-15 12:11
チャブーンさん

丁寧な回答、ありがとうございました。

現在の環境ではWindowsNT 4.0がないため件のエラーは無視しようと思います。

TCPポートがいっぱいになっているほうですが、チャブーンさんのご指摘通り設定変更
は控えてサーバー再起動で様子を見ようと思います。
結果はまた報告させていただきます。


しかし、数千ある各ポートが何故TIME_WAIT状態から変化しないのか不思議ですね。。。
Sparhawk
会議室デビュー日: 2007/06/14
投稿数: 10
投稿日時: 2007-06-18 16:45
結果ですが。。

結局、サーバー再起動を実施することなく、イベントログが表示された3日後に自然復旧してしまいました。

イベント ID: 1586も表示されず、TCPポートも使い切った状態が解消され、RPC通信を伴う操作も問題なくできるようになりました。
(例:ADサイトとサービスで、レプリケーショントポロジの確認が実行できる。)

結局何が起きてしまったのかよくわかりませんが、暫く様子見したいと思います。

1

スキルアップ/キャリアアップ(JOB@IT)