- PR -

一般的な意見として教えて下さい(messages/maillog)

1
投稿者投稿内容
まあ
常連さん
会議室デビュー日: 2004/08/09
投稿数: 36
投稿日時: 2005-01-18 13:46
RedHat ES2.1でPostfixとLDAP認証を稼動させているのですが、maillogへ以下のようなメッセージを出力し、Postfix等がダウンしてしまいます。
サーバーへのアクセスが多いのではないかと予測し、ps、netstatなどの情報収集を行っていはいますが、まだ結果は出ていません。
TCPラッパーにて、限界を超えてしまっているようには感じているのですが、
何か意見を頂ければと思います。

エラー(抽出)
>>>maillog内
Jan 5 11:40:08 hogehoge01 in.qpopper[31621]: PAM unable to dlopen(/lib/security/pam_ldap.so)
Jan 5 11:40:08 hogehoge01 in.qpopper[31621]: PAM [dlerror: libsasl.so.7: cannot open shared object file: Too many open files in system]
Jan 5 11:40:08 hogehoge01 in.qpopper[31621]: PAM adding faulty module: /lib/security/pam_ldap.so
>>>messages内
Jan 5 11:40:08 IPDMSV01 in.qpopper[31621]: unable to dlopen /usr/lib/sasl/liblogin.so: libcrypt.so.1: cannot open shared object file: Too many open files in system
Jan 5 11:40:08 IPDMSV01 in.qpopper[31621]: unable to dlopen /usr/lib/sasl/libplain.so: /usr/lib/sasl/libplain.so: cannot open shared object file: Too many open files in system
Jan 5 11:40:08 IPDMSV01 qpopper(pam_unix)[31621]: check pass; user unknown
Jan 5 11:40:08 IPDMSV01 qpopper(pam_unix)[31621]: authentication failure; logname= uid=0 euid=0 tty= ruser= rhost=
Jan 5 11:40:08 IPDMSV01 xinetd[25572]: service pop-3, accept: Too many open files in system (errno = 23)
はゆる
ぬし
会議室デビュー日: 2004/02/16
投稿数: 1008
お住まい・勤務地: 首都圏をウロウロと
投稿日時: 2005-01-18 14:36
こんにちは。

Postfix 〜 といいつつ、示されたログは qpopper のもののようですが…

引用:

まあさんの書き込み (2005-01-18 13:46) より:
Too many open files in system


が原因ではないでしょうか。
ので、各サービスが次々ダウンする、と。

大量にファイルを開いている原因は何でしょう?
ぽんす
ぬし
会議室デビュー日: 2003/05/21
投稿数: 1023
投稿日時: 2005-01-18 17:30
はゆるさんが書かれているとおりで、
errno = 23、すなわち ENFILE を open()システムコールが返している
わけで、人間の言葉でいうと「Too many open files in system」という
ことなわけです。
システム全体でオープンできるファイルの合計数の制限がどこにあるか
というと /proc/sys/fs/file-max です。そこの値を引き上げれば
とりあえず問題を回避できます。
# 後ろに別の問題が待っているかもしれませんが...
OSを再起動するとその設定はデフォルトに戻ってしまうので
設定ファイル(RedHatだと /etc/sysctl.conf かな?)に記述して
おいて下さい。

ファイルを開いているプロセスを調べるには...
lsof(8) かな? これは
lsof -p プロセス番号
というふうに使います。詳しくは man 8 lsof で。
まあ
常連さん
会議室デビュー日: 2004/08/09
投稿数: 36
投稿日時: 2005-01-18 17:55
はゆるさん
ぽんすさん
そして焦って投稿したので、qpopper部分を抜粋してしまいました。
大変失礼しました。
もう少し現状の状態調査と/procの勉強をしてみます。

有難うございました。また何かありましたら質問をしてしまうかもしれませんが、
宜しくお願い致します。
ぽんす
ぬし
会議室デビュー日: 2003/05/21
投稿数: 1023
投稿日時: 2005-01-18 18:11
先ほど書き忘れました。
サーバの状態を調べるには sar を使ったほうがよいです。
RedHat だと sysstat という名前の rpm パッケージをインストールします。
これの使い方、見方も最初は分からないかもしれませんが...

まずは file-max を引き上げて、それからの話と思いますが。
はゆる
ぬし
会議室デビュー日: 2004/02/16
投稿数: 1008
お住まい・勤務地: 首都圏をウロウロと
投稿日時: 2005-01-18 20:00
重要な情報は拾えたので、結果オーライかと (^^; > まあ さん

思い出したのですが、以前 IBM なホストで苦労されていた方ですよね。
# 同じホストのことかな?
ぽんす さんがおっしゃる sar でログを取る方法は、よい案だと思います。
ダウンしまくるまでの動きが分かるでしょうから。
# 朝夕の稼動状態が安定しているのなら、その隙に仕込めばよいかと

試したことがないので、私からは参考資料だけ (^^;

 ・ Linux管理者への道: 第7回 障害の兆候を見逃さないためのサーバ監視 (2/3)
   (@IT さんより)

他、sysstat で検索エンジンにお伺いを立てれば、解説しているドキュメントを見つけることもできそうです。

## いまさらタイトルミスを修正 orz
_________________
日本の中心で、オフを叫ぶ(@名古屋)。 ご意見募集中!

[ メッセージ編集済み 編集者: はゆる 編集日時 2005-01-19 17:22 ]
まあ
常連さん
会議室デビュー日: 2004/08/09
投稿数: 36
投稿日時: 2005-01-27 11:10
はゆるさん、ぽんすさん
お疲れ様です。
以前IBMなホストで苦労していたものです。
結果的にfile-maxの値を変更してから、特に問題は発生しなくなりました。
sar、sysstat、iostat、vmstat共に異常な数値は見当たらず、安定しております。

ただ。。。別の問題が発生し、interscanをライセンスしている会社と、問題判別を行っています。
本件も沢山のヒントとアドバイスを有難うございました。大変助かりました。
1

スキルアップ/キャリアアップ(JOB@IT)