- PR -

ファイルサーバークラッシュ

1
投稿者投稿内容
たけし
会議室デビュー日: 2007/10/28
投稿数: 2
投稿日時: 2007-10-28 16:50
ファイルサーバークラッシュ
 FTP及び社内のファイルサーバーとして使用しておりましたサーバーが動作不能になり、現在復旧作業をしております。一筋縄ではいかずかなり苦戦を強いられております。
 大変恐縮ですが、お知恵をお借りしたく投稿致しました。

【発生】
 特に変わったこと(衝撃を与える、水を掛ける、雷が落ちるといった基本的なことから、プログラムをインストールするなどちょっとしたことを含めて)は何もしてないのですが、24日、サーバーへ接続が出来なくなりました。FTPサーバーとしても、ファイルサーバー(samba)としても、SSHサーバーとしても接続が出来なくなりました。

【状況】
 はじめに行ったことはサーバーにディスプレイ、キーボード、マウスを接続して、起動することです。起動が出来ませんでした。ファイルシステムのチェックが自動的に走る旨表示が英語で出て、そのままフリーズしました。もう一度再起動を試みたところ、チェックは始まりましたが、途中で赤字のメッセージが出て、フリーズしました。
 何度も再起動することはまずいと感じ、CDブートリナックス( knoppix 5.1.1 )を使用して、起動しました。この時点では、ハードディスク動作音は正常でした。起動後、1つ目のパーティション(システムパーティション)はマウントも正常に出来、閲覧できました。2つ目のパーティション(データパーティション)は画面にハードディスクのアイコンは出ているものの、マウントが出来ない状態でした。そのとき出たエラーメッセージを記載します。

mount: wrong fs type, bad option, bad superblock on /dev/hda2,
missing codepage or other error
in some cases useful info is found in syslog - try dmesg | tail or so

 その後自力で調査を行い大まかに次のようなことを行っております。
1.ハードディスクイメージを外付けハードディスクへ保存する
 dd if=/dev/hda2 of=/media/sda1/server.img bs=512 count=490223475 conv=sync,noerror
 ※CDブート時のハード構成
 /dev/hda1 … 内蔵ハードディスクパーティション1、マウント先 /media/hda1(正常、システムパーティション)
 /dev/hda2 … 内蔵ハードディスクパーティション2、マウント先 /media/hda2(異常、データパーティション)
 /dev/sda1 … 外付ハードディスク(イメージ保存用)、マウント先 /media/sda1(同じファイルシステムでフォーマット後使用、ext2)

2.そのイメージを使い、同じサイズのハードディスクに展開
 dd if=/media/sdb1/server.img of=/dev/sda1 bs=65536
 ※中古のPCでCDブートを行い、そのUSB端子に2つのHDDを接続
 /dev/sda1 … 外付ハードディスク(イメージ展開用)、マウント先 /media/sda1
 /dev/sdb1 … 外付ハードディスク(イメージ保存用)、マウント先 /media/sdb1

3.fsck を使用して、修復を試みております。
 mke2fs -S /dev/sda1 … これで、スーパーブロックの再作成を行う
 mke2fs -n /dev/sda1 … これで、スーパーブロックのバックアップ保存先を確認
 e2fsck -y -b 32768 -B 4096 /dev/sda1 … これで、エラーの修復作業を行う。
 ※現在1日半が経過してまだ終わっていない。


【環境】
 サーバーは無名のところで、OSのディストリビューションは Fedora Core 2 で、250GBのハードディスクを2機載しており、ミラーリング(raid 1)になっております。FTPは vsftpd を使用しており、ファイルサーバーは samaba を使用しています。総接続人数は10名程度。


お力添えの程よろしくお願い致します。尾崎
SHR
ベテラン
会議室デビュー日: 2006/06/15
投稿数: 99
投稿日時: 2007-10-29 12:32
RAIDはハードウェアRAIDですか?ソフトウェアRAIDですか?
※hdbやらhdcの記載が無いところを見るとハードウェアRAIDっぽいですが。
RAIDしているHDD両方が飛んだのでしょうか?

ファイルの量がどれだけあるか解りませんが、
1日半で終わらないというのはちょっと時間がかかりすぎかも。
友人が似たような事をした際、接続しているUSBが1.1だったといった事がありましたが…。
たけし
会議室デビュー日: 2007/10/28
投稿数: 2
投稿日時: 2007-11-01 13:02
返信ありがとうございます。

RAIDはハードウェアのRAIDです。
> RAIDしているHDD両方が飛んだのでしょうか?
→ はい。確認できない期間が長くなり2つとも飛んでから気がつきました。

e2fsck -y -b 32768 -B 4096 /dev/sda1
その後、この命令で行っていた修復作業が途中で止まりました。英語のメッセージでしたが、内容は「まだ、すべての修復が完了しておりません」といった感じの内容でした。時間がかかり過ぎたため止まったのでしょうか。

その他、やった方が良いことなどがございましたら、ご教授下さい。

よろしくお願い致します。尾崎
1

スキルアップ/キャリアアップ(JOB@IT)