トポロジを用いて、稼動中のシステムが正常に稼動していることを、[運用]ビュートップの[トポロジ]タブの画面により、迅速に把握できます。
また、複数のノードの障害時に、優先順位を設けて、素早く原因の把握を行うことができます。
以下のように、仮想マシン、仮想マシンサーバ、ディスクボリュームなど、多数の障害が発生した場合におけるトポロジの利用例を記載します。
以下の4ステップで、障害の把握から復旧後の確認まで実現できます。
ステップ1.システム構成および障害の影響範囲の把握
ステップ2.関連ノードの強調表示による障害の影響元の特定
ステップ3.ノードの障害の原因の把握
ステップ4.復旧後の確認
[運用]ビュートップにて、稼動中の業務システムの全体構成を確認します。
「(1)関連ノードの表示によるシステム構成の把握の容易化」により、業務全体を確認できます。
また、「(2)障害の影響範囲を見える化」により、影響を受けているノードを確認でき、これにより、業務システム(運用グループ、カテゴリ、テナント)における障害の影響の有無を確認できます。
業務システム(運用グループ、カテゴリなど)が影響を受けている場合、重要な業務システムから障害を復旧することが望まれます。
ここでは、例としてDB Serverグループを優先的に復旧することを考えます。
トポロジ機能の「(3)関連ノードの強調表示」により、DB Serverグループをクリックすることで、DB Serverグループにおける障害の影響元を特定することができます。
以下の図の例では、DB ServerグループはdiskTestの影響を受けていることがわかります。
ステップ2 で特定したdiskTestの障害原因を特定します。
diskTestノードを右クリックして、サマリ情報を表示します。
ノード名のリンクをクリックすると、トポロジ機能の「(5)関連ノードの画面への速やかな移動」により、diskTestの詳細ビューを閲覧できます。
また、サマリ情報の右下のアイコンをクリックすると、「(6)簡易的な障害情報、性能情報、構成情報を即座に把握」により、イベント履歴などの障害情報や、データストアなどの構成情報も即座に把握できます。
diskTestの詳細ビューにおけるイベント履歴より、障害の原因になったイベントを閲覧することができます。
これにより、ユーザは、障害の原因を素早く把握して対処することができます。
復旧が終わったら、元のビューに戻り、赤い丸が消去されていることを確認します。
DB Serverグループに障害の影響(赤い丸)が消去されていることを確認できます。
以上のように、トポロジを用いることで、システムの全体構成を把握し、優先順位を設けてノードの障害を復旧することができます。