仮想環境に対するSigmaSystemCenterの障害復旧機能の1つとして、障害発生時に実行される仮想マシンの退避の機能があります。
SigmaSystemCenterは、vCenterServer、ESMPRO/ServerManager、SystemProvisioningなどにより、仮想マシンサーバに対し定期的に死活監視を行います。仮想マシンサーバからの反応がなくなった場合、 SigmaSystemCenterはVM最適配置機能のVM退避機能により、その仮想マシンサーバ上で動作していた仮想マシンを別仮想マシンサーバに退避させることで、業務を継続できるようにします。
VM退避機能では、システム全体の仮想マシンの配置状況を確認し、仮想マシンの退避先となる仮想マシンサーバを自動で適切に決定することができます。また、VM配置制約機能により、配置先の仮想マシンサーバの決定方法をシステムの要件に応じてカスタマイズすることが可能です。
そして、SigmaSystemCenterは、VM退避をより確実に実行できるように、次の機能も提供しています。
仮想マシンサーバの強制OFF
障害時、障害が発生した仮想マシンサーバがOff状態になっていることを想定し、移動元の仮想マシンサーバがOff状態でも移動が可能なFailoverを使用して、仮想マシンを別仮想マシンサーバに退避させる必要があります。
しかし、仮想マシンサーバの電源はOn状態ではあるがその上のホストが反応しない半死のような状況では、通常、仮想マシンのFailoverを実行することができません。Failoverの実行条件を満たすためには仮想マシンサーバを電源off状態にする必要がありますが、仮想マシンサーバが半死状態のため通常のシャットダウンでは失敗するケースが少なくありません。
これに対し、SigmaSystemCenter はBMC経由の電源制御で仮想マシンサーバを強制OFFすることで、Failoverが可能な状態にすることができます。これにより、仮想マシンサーバがどのような状態の時でも確実にFailoverを実行することができるようになります。
仮想マシンサーバの診断処理
ネットワークスイッチの障害やストレージの障害などシステム全体に波及するような障害やダウン状態の仮想マシンサーバが多数あるような状況の場合、復旧処理を実行しても成功せず、復旧処理の負荷によりさらに状況が悪化することも考えられます。このような状況の時は、診断処理により復旧処理は実行されません。
また、仮想マシンサーバが一時的な高負荷な状況の時、監視製品が誤ってアクセス不可のイベントを検出し、実行する必要がない復旧処理が実行される可能性があります。このような問題に対しても、診断処理により対応することができます。診断処理により仮想マシンサーバが正常と判断した場合は、復旧処理は実行されません。
本機能を利用するために使用する標準ポリシーは、標準ポリシー(仮想マシンサーバ)、標準ポリシー(仮想マシンサーバ 予兆)、標準ポリシー(仮想マシンサーバ 省電力)です。これらの標準ポリシーでは、VMSアクセス不可のポリシー規則が有効な状態で登録されています。
次の図は、VMware(vCenter Server管理)の環境で標準ポリシー(仮想マシンサーバ)を使用した場合に、VMSアクセス不可のイベントが発生した時の動作の説明です。