特集 4. ソフトウェアRAIDの障害復旧の手順は?
デジタルアドバンテージ |
障害発生からの復旧
いくら冗長化しても、障害発生からの復旧が面倒だったり、困難だったりすればまったく意味をなさない。そこで、ソフトウェアRAIDにおける障害復旧方法について紹介しよう。
ハードディスクに何らかの障害が発生すると、通常は予兆として書き込みエラーや読み出しエラーなどの頻度が高くなる。このときソフトウェアRAIDでは、イベントビューアにディスクI/Oエラーなどが記録され、再書き込みなどが発生するためハードディスクの性能が落ちることになる。ただ、そのRAIDボリュームをネットワーク経由で利用しているような場合は、「少しハードディスクのレスポンスが悪くなった」程度しか感じないことが多い。この時点では、[ディスクの管理]上でエラー状態にならないことも多く、管理者も見逃しがちである。この点、ハードウェアRAIDは、ハードディスクに書き込みエラーなどがある程度の頻度で発生するようになると、そのディスクに対する書き込み/読み出しを停止し、ユーティリティなどによって障害を報告する機能を持つものが多く、管理が容易となっている。
さらに障害が進み、ミラーボリュームまたはRAID-5ボリューム内で不整合が発生すると、[ディスクの管理]ではエラーが発生したボリュームが[正常]から[冗長の障害]または[冗長の障害(危険)]に変わる。これはディスクI/Oエラーが検出されたことを示すもので、この状態になると冗長性は失われる。この状態では、ディスクが「オフライン」になっているはずなので、[ディスクの再アクティブ化]を実行し、「オンライン」にする。[冗長の障害]の場合はこれでボリュームの状態が[正常]に戻り、[冗長の障害(危険)]の場合は[冗長の障害]に変わるので、[ボリュームの再アクティブ化]を実行する。それでもボリュームの状態が[正常]にならない場合は、ディスクが故障しているので、早急な交換が必要になる。また、頻繁にディスクI/Oエラーが発生する場合も、早急にハードディスクの交換を行うべきだ。
ミラーボリュームでエラーが発生した場合 | ||||||
ミラーボリューム化したシステムボリュームにエラーが発生すると、[冗長の失敗(システム)]と表示される。ミラーボリューム化されているため、この状態でもシステムの起動や運用は可能だ。 | ||||||
|
RAID-5ボリュームでエラーが発生した場合 | ||||||
画面はディスク2に障害が発生し、ハードディスクが認識しなくなった場合だ。やはり[冗長の失敗]と表示される。 | ||||||
|
ハードディスク自体が認識されなくなってしまった場合は、ボリュームは[冗長の失敗]となる。この状態でもRAIDボリュームへの読み書きが行えるため、[ディスクの管理]やエラー・ログなどを常に確認しておかないとRAIDボリュームに発生した障害を見逃すことにもなりかねない。もちろん、さらに別のハードディスクに故障が発生すれば、すべてのデータが失われることになるので、早急に復旧する必要がある。
上述のような状況では、まず[冗長の障害(危険)]の場合と同様、[ディスクの再アクティブ化]の実行を試してみよう。それでも[冗長の失敗]のままならば、ハードディスクの自体かインターフェイスに障害が発生している可能性が高い。本体を開け、[ディスクの管理]で×となっているハードディスクのIDEケーブルや電源ケーブルが外れていないかどうかを、まず確認する。問題がないようならば、この状態で電源を入れて、ハードディスクに異音がないかどうか、またディスクが回転しているか(振動や稼働音)を再確認しよう。ここで何らかの異常を感じたならば、ハードディスクが故障している可能性が高い。異常を感じないようでも、ハードディスクが認識されないようならば、ハードディスクの交換が必要になる。
そこでサーバの電源を落とし、ハードディスクを物理的に交換する。このとき、RAIDボリュームとして利用していたよりも大きな容量のハードディスクにする。交換するハードディスクは、まったく同じ製品である必要も、同じ容量である必要もない。交換後、[ディスクの管理]では以下の画面のようになっているはずだ。
ディスク交換後の[ディスクの管理]画面 | ||||||
[ディスク 2]が新規に追加したハードディスク、[不足]が障害が発生し交換前のハードディスクをそれぞれ示す。 | ||||||
|
画面の「ディスク 2」が交換したハードディスクで、「不足」となっているのが取り外したものだ。ここで、ディスク2が「異形式」となっていた場合は、[形式の異なるディスクのインポート]でハードディスクを認識させる。また、システムボリュームのミラーリングを復旧する場合で、追加のハードディスクにプライマリ・パーティションがあるときは、プライマリ・パーティションを削除しておくことを忘れないようにしたい。
ディスク2をインポートする | |||
ディスク2が「異形式」になっていた場合、メニューから[形式の異なるディスクのインポート]を実行する。 | |||
|
[形式の異なるディスクのインポート]ダイアログ | |||
ダイアログの指示に従い、ディスク2をシステム構成に追加する。追加が完了すると、ディスク2も[ディスクの管理]上で[未割り当て]となる。 | |||
|
あとは、[冗長の失敗]となっているボリューム上で[ボリュームの修復]を実行する。自動的にボリュームが再構築され、[正常]に戻るはずだ。[不足]となっている「ディスク」は、[ディスクの削除]を実行することで[ディスクの管理]から削除しておく。これで復旧が完了する。故障しているハードディスクを取り違えたり、手順を誤ったりしなければ、[ディスクの管理]ツールだけで作業がすべて行えるので、復旧作業自体はそれほど難しいものではない。
ボリュームの修復を行う | |||||||||
ディスク0もしくはディスク1の[冗長の失敗]となっているボリューム上で右クリックを行い、メニューから[ボリュームの修復]を選択する。 | |||||||||
|
ボリュームの再生成 | |||
自動的にボリュームの再生成が行われる。このときディスク2も自動的に同じ容量のボリュームが確保される。 | |||
|
[不足]の削除 | ||||||
RAID-5ボリュームの復旧が完了した時点で、[ディスクの管理]上から[不足]となっているディスクを削除する。 | ||||||
|
ソフトウェアRAIDかハードウェアRAIDか
このようにWindows 2000 ServerのソフトウェアRAIDは、システムボリュームがRAID-5化できないなど、制約はあるものの、使い勝手の面ではハードウェアRAIDとそれほど違いがない。さらにサーバのプロセッサ性能が向上したことや、ソフトウェアRAIDのメインターゲットであるIDEハードディスクが大容量化したことなどにより、ソフトウェアRAIDの利用可能範囲は広がっている。ただ、ハードウェアRAIDの中にはホットスワップに対応可能な製品もあり、こうしたソフトウェアRAIDでは実現が難しい機能が必要とされる用途もある。こうした場合は、コスト的には不利だが、ハードウェアRAIDを選択することになるだろう。
今回、ソフトウェアRAIDを試してみて、「意外と使えそうだ」というのが正直な感想だ。120GbytesクラスのIDEハードディスクを3台用いてRAID-5ボリュームとすれば、システムボリュームを除いて200Gbytes程度がデータボリュームとして確保可能だ。部署単位や小規模な事業所のファイル・サーバとしてならば、十分な容量といえるだろう。性能面でも、ハードディスク単体やハードウェアRAIDに比べると遅くなるものの、ユーザーが「遅い」と感じるほどではない。逆に性能やホットスワップ機能が求められる用途では、ハードウェアRAIDの中でも高機能なRAIDコントローラの利用をすすめたい。
INDEX | ||
[特集]Windows 2000 ServerのソフトウェアRAIDを極める | ||
1.システム ボリュームのミラー化を試す | ||
2.システムボリューム以外を冗長化するには | ||
3.最適なソフトウェアRAID構成を考える | ||
4.ソフトウェアRAIDの障害復旧の手順は? | ||
「System Insiderの特集」 |
- Intelと互換プロセッサとの戦いの歴史を振り返る (2017/6/28)
Intelのx86が誕生して約40年たつという。x86プロセッサは、互換プロセッサとの戦いでもあった。その歴史を簡単に振り返ってみよう - 第204回 人工知能がFPGAに恋する理由 (2017/5/25)
最近、人工知能(AI)のアクセラレータとしてFPGAを活用する動きがある。なぜCPUやGPUに加えて、FPGAが人工知能に活用されるのだろうか。その理由は? - IoT実用化への号砲は鳴った (2017/4/27)
スタートの号砲が鳴ったようだ。多くのベンダーからIoTを使った実証実験の発表が相次いでいる。あと半年もすれば、実用化へのゴールも見えてくるのだろうか? - スパコンの新しい潮流は人工知能にあり? (2017/3/29)
スパコン関連の発表が続いている。多くが「人工知能」をターゲットにしているようだ。人工知能向けのスパコンとはどのようなものなのか、最近の発表から見ていこう
|
|