- PR -

メールサーバ(Postfix+courier-imap)で発生している問題について

1
投稿者投稿内容
tsuyo
会議室デビュー日: 2004/08/17
投稿数: 15
投稿日時: 2007-11-26 13:37
現在以下の環境でメールサーバを運用しておりますが、errorが発
生している状況です。何か情報をお持ちの方がいらっしゃいました
らご支援よろしくお願いいたします。

1.環境
(1)ソフトウェア
 @RHEL ES v3.0
 APostfix2.1.5
 Bcourier-imap3.0.6
(2)ハードウェア
 @メールサーバ(Linux)×2(アクティブ/アクティブ)
 Aメールスプール用NAS(Windows Storage Server 2003)×1

2.発生現象
 maillogに以下のメッセージが出力されます。
*****
Sep 25 08:37:55 xxxxx15 pop3d: calcsize fopen: Stale NFS
file handle
Sep 25 08:37:55 xxxxx15 last message repeated 94 times
Sep 25 08:37:55 xxxxx15 pop3d: calcsize ferror: Input/output error
Sep 25 08:37:55 xxxxx15 pop3d: calcsize ferror: Input/output error
Sep 25 08:37:55 xxxxx15 pop3d: calcsize fopen: Stale NFS file handle
*****
上記はいまのところ特定の1名のユーザのみで発生しています。

なお、クライアント側はOutlookExpressを使用しており上記エラー
はPOPのタイミングで出力されています。
なお、本現象は再現性がなく(ユーザの話では「休み明け等でメー
ルが大量にあるときに発生」とのこと)、基本的には問題なくメー
ル受信ができています。

下記は、クライアント側のOutlookのメッセージの抜粋です。
*****
メッセージ番号 Xは取得できませんでした。アカウント'xxxxx',サー
バー:'xxx.xxx.xxx.xxx',プロトコル:'POP3',サーバーの応答
:'-ERR Can't open the message file -it's gone!',ポート:110,
セキュリティ(SSL):なし,サーバーエラー:0x800CCC90,エラー番
号:0x800420CD
*****

3.その他
 maillogにはNFS というキーワードがあり、NASとの連携部分が
原因ではないかと考えております。
 関連するかどうか分かりませんが、/etc/fstabの設定は以下のと
おりとなっております。

*****
xxx.xxx.xxx.xxx:/home /home nfs
rw,rsize=4096,wsize=4096,hard 0 0
*****

以上、よろしくお願いいたします。
みなと
大ベテラン
会議室デビュー日: 2002/06/14
投稿数: 202
お住まい・勤務地: Q州地方の日本海側
投稿日時: 2007-11-26 15:01
こんにちは。

直接の回答ではないですし、内容はわかりませんが
エラーから想像できることを書きます。
#っていうか、自分ならこう調べるというかんじ
引用:

tsuyoさんの書き込み (2007-11-26 13:37) より:
 maillogに以下のメッセージが出力されます。
*****
Sep 25 08:37:55 xxxxx15 pop3d: calcsize fopen: Stale NFS
file handle
Sep 25 08:37:55 xxxxx15 last message repeated 94 times
Sep 25 08:37:55 xxxxx15 pop3d: calcsize ferror: Input/output error
Sep 25 08:37:55 xxxxx15 pop3d: calcsize ferror: Input/output error
Sep 25 08:37:55 xxxxx15 pop3d: calcsize fopen: Stale NFS file handle
*****
*****
メッセージ番号 Xは取得できませんでした。アカウント'xxxxx',サー
バー:'xxx.xxx.xxx.xxx',プロトコル:'POP3',サーバーの応答
:'-ERR Can't open the message file -it's gone!',ポート:110,
セキュリティ(SSL):なし,サーバーエラー:0x800CCC90,エラー番
号:0x800420CD
*****



ferrorでIOエラーと言っているので、十中八九ファイルが読めていません
これがnfsということで、単純にその部分のfilesystemが壊れているのか
NWが遅いのかはこの時点では判断できません。
”Stale NFSfile handle”ってーのをぐぐるとそういうハンドルをつけていた
nfsがumountされた場合とかにでるよと言うことなので、Fileが見えない話と
合致するような気がします。
さらに、MailClientは"itsgone!"なくなったよ!と言ってますから
これも、あるはずなのにないと言ってます。

つまり、このあたりからファイルがあるべきものがない、あるいは
読めていないのであろうと想像します。

最後に、ユーザからの使用感報告の”月曜日なんかの多いときにでるんだ”
と言うところから、以下の推測が成り立つんじゃないかなと思います。
1)NWの帯域不足
2)nfsサーバのディスクIOの帯域不足(っていう言い方でいいのかしら)
3)その他
 ディスクの不調とかほんとにNTFSが壊れてるとか
 NICが死にそうとかケーブルが切れかけてるとか(笑)
 
 ふだんおきないけど負荷をかけるとでるというのはよくある
潜在的な障害なので、なるべく放置しないでつぶしておく方が無難です。
じゃないと、いざっていうときダメダメですから。。。

と、自分の想像したのはここまでです。
とりあえずnfsサーバからの大量コピーあたりから始めては
どうですかね。

#方針間違ってたらツッコミお願いします>みなさん
F/A
ぬし
会議室デビュー日: 2006/03/18
投稿数: 312
お住まい・勤務地: Tokyo
投稿日時: 2007-11-26 18:45
courier-imapならMaildirだろうと信じて…

みなとさんの方向性で問題ないと思います。

しかし気になるのは「特定1名」って所ですかね。
その人だけやたら受信メール量が多いんですかね…?
じゃなければ、その人の設定が特殊で
その結果何らかの問題を踏んでいる可能性が高いように思います。

あとありそうなのはアンチウィルス製品が水際で勝手にファイルを削除してたりすると、
メールサーバからはファイルが消失したように見えるのでそんなエラーが
出るかもしれないですね。

OSのログ(messages)(イベントログ?)も見てみて下さい。

あとは(1)メールサーバ(Linux)×2(アクティブ/アクティブ) って所ですが、
同時にどちらからでもアクセスが可能なのでしょうか?

同じアカウントに同時に両方からアクセスすれば、
そういったエラーが出るかもしれないですね。

*****
xxx.xxx.xxx.xxx:/home /home nfs
rw,rsize=4096,wsize=4096,hard 0 0
*****

あとはこれですが、結構バッファサイズ絞っていますよね?
パフォーマンスが低下しそうですけど、何か意味があるのですか?
(今回の問題にはあまり関係ないと思いますが)


[ メッセージ編集済み 編集者: F/A 編集日時 2007-11-26 18:56 ]
1

スキルアップ/キャリアアップ(JOB@IT)