Windows Server 2016 Technical Preview 3(TP3)では、「フェイルオーバークラスタリング」に「Virtual Machine Resiliency(仮想マシンの回復性)の向上」という新機能が追加されました。この機能により、クラスターで発生する瞬間的な障害は許容され、仮想マシンのダウンタイムがさらに縮小されることが期待できます。
「Hyper-Vの役割」を実行する2台以上のWindows Serverコンピューターでフェイルオーバークラスターを構成すると、高可用性仮想マシンを実行できる「Hyper-Vホストクラスター」を構築できます。
Hyper-Vホストクラスターでは、物理サーバー(ノード)のメンテナンスタスクの実行や、リソース使用の最適化のために、仮想マシンを停止することなく、ノード間で「ライブマイグレーション」を実行して再配置できます。また、物理サーバーのハードウエア/ソフトウエア/ネットワーク障害と、仮想マシンのハートビート/アプリケーション/ネットワーク障害に対しては、自動的なフェイルオーバーで仮想マシンを迅速に復旧します。
ライブマイグレーションはWindows Server 2008 R2から、仮想マシンのアプリケーション(のサービスまたはイベント)監視はWindows Server 2012から、仮想マシンのネットワーク監視はWindows Server 2012 R2からサポートされる機能です。
「Virtual Machine Resiliency(仮想マシンの回復性)の向上」は、Windows Server 2016のHyper-Vホストクラスターに追加予定の新機能であり、Windows Server 2016 Technical Preview 3(TP3)に初めて搭載されました。
クラウド基盤として運用されるような大規模な仮想化環境を持つデータセンターでは、ハードウエア障害対応が高度であったり、ソフトウエア定義(Software- Defined)のコンポーネントを数多く使っていたりします。従って、ハードウエアの物理的な障害よりも、ソフトウエアやネットワークに起因する短期的な障害の方が多い傾向にあります。このような状況において、仮想マシンの回復性の向上は、障害が解消されるまで一定時間待機することが必要になるものの、フェイルオーバー回数を抑制することで、相対的にダウンタイムを短縮します。
これまでは、Hyper-Vホストクラスターがノードの障害を検知すると、すぐに正常なノードへの仮想マシンのフェイルオーバーが開始されました(画面1)。また、仮想マシンのリソースやゲストOS内のアプリケーションのエラーに対しては、既定では同一ノードでゲストOSの再起動を試み、再起動に失敗した場合に別ノードへのフェイルオーバーが開始されました。
フェイルオーバーが開始し、仮想マシンが復旧するまでにはしばらく時間がかかります。仮想マシンのフェイルオーバーは、障害や異常をトリガーとして開始します。この動作は、正常運用時に仮想マシンを停止することなくノード間を移動できるライブマイグレーションの動作とは全く異なります。
フェイルオーバーが発生すると、仮想マシンは正常なノードで開始(リセット)することになります。完全復旧するまでには、ゲストOSの起動やアプリケーションの修復処理(データベースなど)の完了を待つ必要があるため、ある程度のダウンタイムが生じます。
Copyright © ITmedia, Inc. All Rights Reserved.