短時間のノード障害に耐える仮想マシン――フェイルオーバークラスターの新機能(その1):vNextに備えよ! 次期Windows Serverのココに注目(30)(2/3 ページ)
Windows Server 2016 Technical Preview 3(TP3)では、「フェイルオーバークラスタリング」に「Virtual Machine Resiliency(仮想マシンの回復性)の向上」という新機能が追加されました。この機能により、クラスターで発生する瞬間的な障害は許容され、仮想マシンのダウンタイムがさらに縮小されることが期待できます。
これからは、短時間の通信障害 → 4分以内なら許容
Windows Server 2016 TP3のHyper-Vホストクラスターでは、次のような短時間の通信障害を一定時間許容し、クラスターから孤立したノードで仮想マシンの実行を継続します。
- ノードの完全な切断(ノードはクラスターの全て他のノードと通信不可)
- ノードのCluster Serviceのクラッシュ(ノードのダウン)
- ノードの部分的な切断(ノードはクラスターの別のノードの一部と通信可能)
例として、iSCSI接続の「クラスター共有ボリューム(Cluster Shared Volume:CSV)」に仮想マシンを配置する2ノードのHyper-Vホストクラスター環境で、ノード間の通信をWindowsファイアウォールを利用して遮断することで、仮想マシンを実行しているノードを孤立させてみました。
仮想マシンを実行するノードは、アクティブなノードの「フェイルオーバークラスターマネージャー」から見ると「Isolated(分離)」という状態、仮想マシンは「Unmonitored(監視されていない)」という状態です(画面2)。
意図的に孤立させたノードの「フェイルオーバークラスターマネージャー」を見ると、クラスターは全てのノードがダウンした状態になっています。しかし、「Hyper-Vマネージャー」で仮想マシンの状態を見ると、仮想マシンは同じノードで稼働中のままでした(画面3)。
Windowsファイアウォールの規則を無効化してノード間の通信を復旧させると、孤立しているノードがクラスターに復帰し、仮想マシンは「Unmonitored(監視されていない)」から「Running(実行中)」の状態に戻りました。この間、仮想マシンのゲストOSが停止することはありません。ノードの孤立状態が4分以内であれば、このように仮想マシンのフェイルオーバーは発生することなく、クラスターは正常な状態に戻ります(画面4)。
ストレージアクセスの一時的な断絶は、仮想マシンの一時停止で切り抜ける
続いて、ノードの全てのネットワーク接続を物理的に切断してみました。全てのネットワークが切断されるため、仮想マシンが配置されているiSCSI接続のクラスター共有ボリューム(CSV)へのアクセスも不能になります。
この場合、仮想マシンの実行を継続することはできませんが、仮想マシンは「Paused-Critical(一時停止−重大)」の状態でフリーズします(画面5)。そして、4分以内にネットワーク接続が復旧すれば、仮想マシンは一時停止の状態から再開され、「Running(実行中)」の状態に戻ります。
Copyright © ITmedia, Inc. All Rights Reserved.