- PR -

HDD救済方法 Fedora4 lvm2

投稿者投稿内容
かっぺちゃん
会議室デビュー日: 2007/11/12
投稿数: 7
投稿日時: 2007-11-12 22:52
HDDの物理的異常(セクタエラー)が発生している様で、その救済方法を模索しています。

[ハードウェア構成]
sda,sdb,sdcの3つのSCSI-HDDをLVM2のEXT3でVolGroup00として利用しています。
(swapはVolGroup01です)

[OS]
Fedora core 4
(ほぼデフォルトでHDD構築しています)

[現象]
どうやらsdbが物理的に故障した様で、Errorが頻発して、OSがフリーズする
再起動しても起動しないことが多く、起動できてもカーネルパニックで止まる

[やってみたこと]
故障していると思われるsdbと同等品をsdaに接続してFedora7レスキューCDにて起動し、dd if=/dev/sdb of=/dev/sda bs=512 count=8916043 conv=sync,noerrorを実施しましたがinput/output errorの表示がところどころ出ていました。
(HDDは9.1Gです)
その同等品を今度はsdbに接続、sdaを元に接続しなおして起動しても、起動中にカーネルパニックで止まってしまいます。
また、ブートメニューのカーネル選択(現在3つほどのリビジョンがあります)で選ぶカーネルによってエラーの内容が少し異なる様で、たまに不良のHDDをsdbに接続して、他のカーネルのリビジョンを選択すると偶然に起動することもあります。
(現在はどれも起動できないまでに弱っています・・・)
また、Fedora7liveCDでVolGroup00をマウントしようとしてもできないみたいです。

そこで、何を確認して、どのように対処すればいいのかをお知恵を拝借したいと思っております。上記だけでは情報不足かもしれませんがご指摘いただいた内容についてはご呈示させて頂きたいと思っています。
よろしくお願いします。
かっぺちゃん
会議室デビュー日: 2007/11/12
投稿数: 7
投稿日時: 2007-11-12 23:33
情報の追記です。

[ブートメニュー]
GNU GRUB version 0.95 (693K lower/523136K upper memory)
Fedora Core (2.6.17-1.2442_FC4)
Fedora Core (2.6.17-1.2442_FC4smp)
Fedora Core (2.6.15-1.1830_FC4smp)
Fedora Core (2.6.15-1.1830_FC4)
Fedora Core (2.6.11-1.1369_FC4smp)
Fedora Core (2.6.11-1.1830_FC4)

[ブートメッセージ]
Fedora Core (2.6.17-1.2442_FC4)を選択した場合です。


EXT3-fs error (device dm-0): ext3_check_descriptors: Block bitmap for group 0 not in group(block 2553887680)!
EXT3-fs: group descriptors corrupted!
mount: error 22 mounting ext3
Switching to new root
Error opening /dev/consle!!!!:2
error dup2'ing fd of 0 to 0
error dup2'ing fd of 0 to 1
error dup2'ing fd of 0 to 2
unmounting old /proc
unmounting old /sys
switchroot: mount failed: 22
kernel panic - not syncing : Attempted to kill init!

で止まります。


[ メッセージ編集済み 編集者: かっぺちゃん 編集日時 2007-11-12 23:58 ]
かっぺちゃん
会議室デビュー日: 2007/11/12
投稿数: 7
投稿日時: 2007-11-12 23:57
情報の追記です。
前回もそうですが、sdbは故障しているHDDを接続しています。
今回は2.6.15-1.1830_FC4smpを選択した場合です

[ブートメッセージ]

EXT3-fs error (device dm-0): ext3_check_descriptors: Block bitmap for group 0 not in group(block 2553887680)!
EXT3-fs: group descriptors corrupted!
mount: error 22 mounting ext3
Switching to new root
Error opening /dev/consle!!!!:2
error dup2'ing fd of 0 to 0
error dup2'ing fd of 0 to 1
error dup2'ing fd of 0 to 2
unmounting old /proc
unmounting old /sys
switchroot: mount failed: 22
kernel panic - not syncing : Attempted to kill init!
[<c0124b38>]panic+0x45/0x1c4 [<c0125dc1>]profile_task_exit+0x31/0x45
[<c0127e4c>]do_exit+0x3b1/0x400 [<015d9d0>]do_munmap+0xc2/0xf4
[<c127ef0>]do_group_exit+0x29/0x90 [<0104035>]syscall_call+0x7/0xb

で止まります。
F/A
ぬし
会議室デビュー日: 2006/03/18
投稿数: 312
お住まい・勤務地: Tokyo
投稿日時: 2007-11-12 23:57
素朴な疑問として…
元々sdaとsdbのデータは同じじゃないんですから、
ddしても駄目なんじゃないでしょうか?

 ※RAID1やRAID5構成なら別ですが、
  その場合もRAID用のコマンド等を使用する必要があると思います

LVMは複数のディスクをまとめてひとつのディスクに見せるのですから、
構成するディスクがお亡くなりになれば、復旧は難しいです。

 ※ある程度は回収出来るかもしれませんが、
  少なくともddでは無理でしょう
かっぺちゃん
会議室デビュー日: 2007/11/12
投稿数: 7
投稿日時: 2007-11-13 00:16
F/Aさま、ご返信ありがとうございます。

「元々sdaとsdbのデータは同じじゃないんですから」についてですが、相違が生じる前に再度ご説明したいと思います。(私の誤解なら再度おしかりをください)

sda,sdb,sdcの3つのSCSI-HDDがあり、SCSIケーブルの都合上、3HDDまでしか接続できない環境にあります。
そのため、仕方なく、sdaをはずしてnewHDDをsda(SCSI-ID:0)に接続しました。
その状態でFedora7レスキューCDにて起動し、ddコマンドにて故障HDD→newHDDへのデータの移動を行いました。ddコマンド実行中は入出力エラーが頻発していました。
ddコマンド終了後に、sdbに接続していた故障HDDをはずし、sdaに接続していたnewHDDをsdbに接続しなおし、本来のsdaのHDDをsdaに接続し直して再起動してみました。
しかし、newHDDを加えた場合での結果はOS起動できない状態です。
故障したHDDをsdbに接続して起動すると稀ですが、起動する場合がありました。
しかし、しばらくするとカーネルパニックで沈黙してしまいます。
(セクターエラーが出ていますので分からなくもないですが・・・)

その上で、「構成するディスクがお亡くなりになれば、復旧は難しいです。」ということであれば、F/Aさまのご指南通りに諦めたいと思います。
ただ、Fedora7LiveCDにてマウントができるのであれば、ある程度のデータを救いたいと考えております。

よろしくお願いします。
F/A
ぬし
会議室デビュー日: 2006/03/18
投稿数: 312
お住まい・勤務地: Tokyo
投稿日時: 2007-11-13 00:16
読み違えてました…失礼しました。

ext3のスーパーブロックが壊れているのかもしれないですが、
レスキューディスク(またはLiveCDですね)で起動してfsckとか実行できないですか?


[ メッセージ編集済み 編集者: F/A 編集日時 2007-11-13 00:20 ]
かっぺちゃん
会議室デビュー日: 2007/11/12
投稿数: 7
投稿日時: 2007-11-13 00:53
F/Aさま、ご返信ありがとうございます。

Fedora7レスキューCDではfsckを実行すると、
sh-3.2#fsck
fsck 1.39 (29-May-2006)
WARNING: couldn't open /etc/fstab: No such file or directory
と表示され機能しないようです。
(レスキューCD?と疑いたくなるのは小生だけでしょうか?)

Fedora7LiveCDでターミナルを起動し、fsckを実行すると、
#fsck /dev/sdb
fsck 1.39 (29-May-2006)
fsck.ext2: Device orresource busy while trying to open /dev/sdb
Filesystem mounted or opened exclusively by another program?

となり、また、

#fsck /dev/VolGroup00/LogVol00
fsck 1.39 (29-May-2006)
e2fsck 1.39 (29-May-2006)
Group descriptors look bad... trying backup blocks
Block bitmap for group 0 is not in group (block 2553887680)
Relocate<y>?

となるのでyで答え続ける(この後同じように問い合わせが来ました)あとにRebootしても結果は変わりませんでした。
かっぺちゃん
会議室デビュー日: 2007/11/12
投稿数: 7
投稿日時: 2007-11-14 22:47
fsckについて詳細な情報を提示してみました。
Fedora7LiveCDからの実施で、故障HDDをsdbに繋げた状態です。
※省略部分は〜group xx is〜と数字が上がっていくだけの単調なものでしたので省略しました。

#fsck -y /dev/VolGroup00/VolLog00

fsck 1.39 (29-May-2006)
Group descriptors look bad... trying backup blocks...
Block bitmap for group 0 is not in group. (block 2553887680)
Relocate? yes

Inode bitmap for group 0 is not in group. (block 33554432)
Relocate? yes

Inode table for group 0 is not in group. (block 1680277504)
WARNING: SEVERE DATA LOSS POSSIBLE.
Relocate? yes

Block bitmap for group 1 is not in group. (block 0)
Relocate? yes

Inode bitmap for group 1 is not in group. (block 0)
Relocate? yes

Inode table for group 1 is not in group. (block 0)
WARNING: SEVERE DATA LOSS POSSIBLE.
Relocate? yes

Block bitmap for group 2 is not in group. (block 0)
Relocate? yes

Inode bitmap for group 2 is not in group. (block 0)
Relocate? yes

Inode table for group 2 is not in group. (block 0)
WARNING: SEVERE DATA LOSS POSSIBLE.
Relocate? yes

〜省略〜

Block bitmap for group 127 is not in group. (block 0)
Relocate? yes

Inode bitmap for group 127 is not in group. (block 0)
Relocate? yes

Inode table for group 127 is not in group. (block 0)
WARNING: SEVERE DATA LOSS POSSIBLE.
Relocate? yes

Block bitmap for group 128 is not in group. (block 2553887680)
Relocate? yes

Inode bitmap for group 128 is not in group. (block 33554432)
Relocate? yes

Inode table for group 128 is not in group. (block 1562836992)
WARNING: SEVERE DATA LOSS POSSIBLE.
Relocate? yes

Block bitmap for group 129 is not in group. (block 0)
Relocate? yes

Inode bitmap for group 129 is not in group. (block 0)
Relocate? yes

Inode table for group 129 is not in group. (block 0)
WARNING: SEVERE DATA LOSS POSSIBLE.
Relocate? yes

〜省略〜

Block bitmap for group 194 is not in group. (block 0)
Relocate? yes

Inode bitmap for group 194 is not in group. (block 0)
Relocate? yes

Inode table for group 194 is not in group. (block 0)
WARNING: SEVERE DATA LOSS POSSIBLE.
Relocate? yes

fsck.ext3: e2fsck_read_bitmaps: illegal bitmap block(s) for /dev/VolGroup00/LogVol00

また、マウントを試みたときの内容です。

#mkdir /mnt/work
#mount /dev/VolGroup00/LogVol00 /mnt/work
mount: wrong fs type, bad option, bad superblock on /dev/VolGroup00/LogVol00.
missing codepage or other error
Is some cases useful info is found in syslog - try
dmesg | tail or so

#dmesg | tail
EXT3-fs error (device dm-0): ext3_check_descriptors: Block bitmap for group 0 not in group(block 2553887680)!
EXT3-fs: group descriptors corrupted!

この他に、確認事項がありましたらご指南頂きたいと思います。
また「このコマンドを叩いて、この結果なら諦めてください」というデットラインがありましたらご助言頂きたいと思います。

スキルアップ/キャリアアップ(JOB@IT)