- PR -

dmesgらしき出力があり、完全に動作不能状態

投稿者投稿内容
jamshin
会議室デビュー日: 2005/04/27
投稿数: 8
投稿日時: 2005-04-27 11:56
お世話になります。

jamshinと申します。

質問させていただきたいのは、原因解明の手法に関してです。

現象としましては、sshでアクセスできないとの連絡をもらい
確認したところ、その通りでした。
pingは通りました。
そこで直接マシンにデバイスをさし、接続したところ
dmesgの結果らしきものが、表示されました。
Enterを押下するとその表示は消えたのですが
何も表示されない状態になってしまいました。
Enterを何度も押下するとたまに、dmesgらしき
表示はされたのですが、それも一瞬だけでした。

ctl+cを押下しても何も変わりません。
ctl+qを押下しても何も変わりません。
ctl+alt+delを押下しても何も起きません。

結局、まだ構築中のマシンということで電源ボタンを
押して再起動しました。現状、特に問題なく動いています。

この原因を解明したいと思っています。
1. /var/log/messages
2. /var/log/secure
3. # dmesg
これら以外にどこを調査すると、原因など分かるものなのでしょうか。

初歩的な質問で大変申し訳ございませんが、
助言いただきたいと存じます。

どうぞ宜しくお願いいたします。
NAO
ぬし
会議室デビュー日: 2001/10/24
投稿数: 1256
お住まい・勤務地: 神奈川のはずれから東京の下町
投稿日時: 2005-04-27 12:55
今日は。

え〜とまず環境を書いて下さいね。
その上で原因を追及するならまずはsyslogですかね。 
ぽんす
ぬし
会議室デビュー日: 2003/05/21
投稿数: 1023
投稿日時: 2005-04-27 13:16
「dmesgの結果らしきもの」とは何じゃろ、ってのがありますが...

高負荷をかけるとTCPでは接続もできなくなるけどpingは返る、
という症状になったりしますがそういう話でもなさそうなので。
ハードウェアのにおいがしたり。

/var/log/messages、dmesg のほかにやるとすると magic SysRq を
有効にしておいて再現した際にメモリやレジスタの情報を拾うとか
ですかねえ。その場合、拾った結果を誰かにみてもらう、という
ことになるでしょうけど。
jamshin
会議室デビュー日: 2005/04/27
投稿数: 8
投稿日時: 2005-04-27 14:44
NAO様

早速のご返答ありがとうございます!

>え〜とまず環境を書いて下さいね。
すみません。すっかり忘れてました。。

OS:RedhatEnterpriseLinux AS3 Update4
CPU:Xeon3.4Ghz
Memory:PC2-3200 ECC DDR2 SDRAM(2GB)
HD:Ultra320SCSI 15K 36.4GB

>その上で原因を追及するならまずはsyslogですかね。 
ここでsyslogの設定をみてみました。

# more syslog.conf
---------------------------------------------------------------------------
# Log all kernel messages to the console.
# Logging much else clutters up the screen.
#kern.* /dev/console

# Log anything (except mail) of level info or higher.
# Don't log private authentication messages!
*.info;mail.none;authpriv.none;cron.none /var/log/messages

# The authpriv file has restricted access.
authpriv.* /var/log/secure

# Log all the mail messages in one place.
mail.* /var/log/maillog


# Log cron stuff
cron.* /var/log/cron

# Everybody gets emergency messages
*.emerg *

# Save news errors of level crit and higher in a special file.
uucp,news.crit /var/log/spooler

# Save boot messages also to boot.log
local7.* /var/log/boot.log
# for NIC SNMP agents link status reporting
kern.info;kern.err |/var/spool/compaq/nic/messages_fifo
---------------------------------------------------------------------------
上のようになっています。
ここにあるように/var/log配下のファイルを見ましたが、
特にエラーらしきものは見つかりませんでした。

また、syslogの使い方自体が分かっていないのでしょうか。
NAO
ぬし
会議室デビュー日: 2001/10/24
投稿数: 1256
お住まい・勤務地: 神奈川のはずれから東京の下町
投稿日時: 2005-04-27 14:49
引用:

jamshinさんの書き込み (2005-04-27 14:44) より:
NAO様

また、syslogの使い方自体が分かっていないのでしょうか。



書き方解りづらかったですかね。(^^ゞ
syslogの内容→/var/log/messagesの内容
です。
_________________
Inspired Ambitious
ISMS Assistant Auditor
jamshin
会議室デビュー日: 2005/04/27
投稿数: 8
投稿日時: 2005-04-27 15:29
ぽんす様

お世話になります。
ご返答ありがとうございます。

>「dmesgの結果らしきもの」とは何じゃろ、ってのがありますが...

分かりにくくて申し訳ございません。
単純に申しますと、ディスプレイにつないで画面が出力されたときに
何もない状態です。
ただ、Enterを何回かたたくと、たまにdmesgの結果が表示されます。
しかも1行だけ。それも一瞬のみです。

>高負荷をかけるとTCPでは接続もできなくなるけどpingは返る、
>という症状になったりしますがそういう話でもなさそうなので。
>ハードウェアのにおいがしたり。
なるほど。そういう現象もあるのですね。
週末は誰も使用していなかったはずなので、負荷はかかっていないと思いますが
もしかしたら不正アクセスを受けていたのかもしれません。
ただ、こちらからはアクセスできない状況だったので確認できませんでした。

ハードウェアに関してですが、実はハード自体を監視している
アプリ(iLO)がありますので、そこのログを確認しました。
エラーは出ていなかったので、ハードの問題もないのかと思っています。

>/var/log/messages、dmesg のほかにやるとすると magic SysRq を
>有効にしておいて再現した際にメモリやレジスタの情報を拾うとか
>ですかねえ。その場合、拾った結果を誰かにみてもらう、という
>ことになるでしょうけど。
はい。これに尽きましては手順などを調査の上、実施したいと思います。
再現しないのが一番いいのですが、起きたときに対応できるように致します。
jamshin
会議室デビュー日: 2005/04/27
投稿数: 8
投稿日時: 2005-04-27 15:38
NAOさま

お世話になります。

/var/log/messages
ですが、確認したところエラーがありませんでした。
実は、この現象が起きたと分かったのが昨日のことです。

金曜の夜までは正常にアクセスできていたとのことでした。
そこで、/var/log/messagesを確認しました。

いかに抜粋します。

-----------------------------------------------------------------------
Apr 22 14:51:12 HOSTNAME sshd(pam_unix)[14973]: session opened for user USERNAME by (uid=500)
Apr 22 14:51:12 HOSTNAME sshd(pam_unix)[14973]: session closed for user USERNAME
Apr 22 18:12:04 HOSTNAME sshd(pam_unix)[15051]: session opened for user USERNAME by (uid=500)
Apr 22 18:12:10 HOSTNAME su(pam_unix)[15094]: session opened for user root by USERNAME(uid=500)
Apr 22 18:17:30 HOSTNAME sshd(pam_unix)[30193]: session opened for user USERNAME by (uid=500)
Apr 22 18:17:30 HOSTNAME sshd(pam_unix)[30193]: session closed for user USERNAME
Apr 22 18:17:47 HOSTNAME sshd(pam_unix)[30203]: session opened for user USERNAME by (uid=500)
Apr 22 18:17:47 HOSTNAME sshd(pam_unix)[30203]: session closed for user USERNAME
Apr 22 18:53:37 HOSTNAME sshd(pam_unix)[30240]: session opened for user USERNAME by (uid=500)
Apr 22 18:53:37 HOSTNAME sshd(pam_unix)[30240]: session closed for user USERNAME
Apr 22 18:53:44 HOSTNAME sshd(pam_unix)[30250]: session opened for user USERNAME by (uid=500)
Apr 22 18:53:44 HOSTNAME sshd(pam_unix)[30250]: session closed for user USERNAME
Apr 22 18:55:18 HOSTNAME su(pam_unix)[15094]: session closed for user root
Apr 22 18:55:20 HOSTNAME sshd(pam_unix)[15051]: session closed for user USERNAME
Apr 22 21:47:04 HOSTNAME sshd(pam_unix)[30334]: session opened for user USERNAME by (uid=500)
Apr 22 21:47:07 HOSTNAME su(pam_unix)[30377]: session opened for user root by USERNAME(uid=500)
Apr 22 21:47:23 HOSTNAME su(pam_unix)[30377]: session closed for user root
Apr 22 21:47:23 HOSTNAME sshd(pam_unix)[30334]: session closed for user USERNAME
Apr 27 10:45:29 HOSTNAME syslogd 1.4.1: restart.
Apr 27 10:45:29 HOSTNAME syslog: syslogd startup succeeded
Apr 27 10:45:29 HOSTNAME kernel: klogd 1.4.1, log source = /proc/kmsg started.
Apr 27 10:45:29 HOSTNAME kernel: Linux version 2.4.21-27.ELsmp (bhcompile@bugs.build.redhat.com) (gcc version 3.2.3 2003050
2 (Red Hat Linux 3.2.3-47)) #1 SMP Wed Dec 1 21:59:02 EST 2004
Apr 27 10:45:29 HOSTNAME kernel: BIOS-provided physical RAM map:
Apr 27 10:45:29 HOSTNAME kernel: BIOS-e820: 0000000000000000 - 000000000009f400 (usable)
Apr 27 10:45:29 HOSTNAME kernel: BIOS-e820: 000000000009f400 - 00000000000a0000 (reserved)
Apr 27 10:45:29 HOSTNAME kernel: BIOS-e820: 00000000000f0000 - 0000000000100000 (reserved)
Apr 27 10:45:29 HOSTNAME kernel: BIOS-e820: 0000000000100000 - 000000007fff3000 (usable)
Apr 27 10:45:29 HOSTNAME kernel: BIOS-e820: 000000007fff3000 - 000000007fffb000 (ACPI data)
Apr 27 10:45:29 HOSTNAME kernel: BIOS-e820: 000000007fffb000 - 0000000080000000 (reserved)
Apr 27 10:45:29 HOSTNAME kernel: BIOS-e820: 00000000fec00000 - 00000000fed00000 (reserved)
Apr 27 10:45:29 HOSTNAME kernel: BIOS-e820: 00000000fee00000 - 00000000fee10000 (reserved)
Apr 27 10:45:29 HOSTNAME kernel: BIOS-e820: 00000000ffc00000 - 0000000100000000 (reserved)
------------------------------------------------------------------------------------
上を見ていただくと分かるとおり、22日から今日までの間で
特にアクセスされた形跡はありません。

今日の始まりは、私が強制でリブートをかけた時間になっています。
ここから何かお分かりになるでしょうか?
情報が少なくて申し訳御座いませんが、宜しくお願いいたします
NAO
ぬし
会議室デビュー日: 2001/10/24
投稿数: 1256
お住まい・勤務地: 神奈川のはずれから東京の下町
投稿日時: 2005-04-27 15:42
今日は。

う〜ん…特に変な点無いですね。
しかもリブート後再現してないって一番やっかいなパターン…

と言う事でぽんすさんが書いている様に
情報を取る仕掛けを仕掛けておいて、「再現待ち」しか無いですね(^^ゞ

で、再現した際に赤帽さんに聞くしか無いと思います。
事前にどんな情報を取っておく必要があるか聞いておいて、
それを仕掛けておいた方が良いですよ 

_________________
Inspired Ambitious
ISMS Assistant Auditor

スキルアップ/キャリアアップ(JOB@IT)