死活監視では、SigmaSystemCenterは、定期的に管理対象マシンが動作しているかどうかのチェックを行い、管理対象マシンから反応がない場合に、異常を通報する監視を行います。監視対象のマシンの種類により、死活監視の機能を提供する製品・コンポーネントは異なります。「2.5.2. 管理対象種類別の使用可能製品一覧」を参照してください。なお、BMC死活監視については、「2.5.6. BMC死活監視」を参照してください。
死活監視で検出されるイベントの定義とその処置内容は、各標準ポリシーで定義されています。多くの標準ポリシーでは、死活監視のイベントが発生した状況を、管理対象マシンがダウン状態になり、業務が継続できない状況と想定して、復旧のポリシーアクションが動作するように設定されています。
管理サーバや管理対象マシンの高負荷やネットワークの高負荷の影響が大きい環境で誤って異常を検出しやすい場合は、抑制機能を利用して対処することができます。死活監視の処理は、管理対象マシンに対してネットワーク経由で実際にアクセスを行うことによりチェックを行うため、外部の影響を受けやすいことが考慮されて、抑制機能が提供されています。
抑制機能では、死活監視のイベントの検出後に一定時間内に回復のイベントを検出した場合、死活監視のイベントを誤検出と判断して、イベントを破棄してポリシーアクションの実行を行いません。抑制機能は、ポリシープロパティの[全般]タブで、以下のチェックをオンにすることで有効になります。詳細については、「2.2.5. ポリシーアクションの実行の抑制」を参照してください。
死活監視障害検出時のアクション実行の抑制(運用グループプロパティの[死活監視]タブのイベント)
ESMPRO/ServerManagerとSystemProvisioningの死活監視機能のイベントに対する抑制設定です。
死活監視障害検出時のアクション実行の抑制(仮想化基盤経由イベント)
各仮想化基盤の製品で検出される死活監視のイベントに対する抑制設定です。
なお、死活監視のイベントは、管理対象マシンのダウン状態を判別するイベントのため、死活監視のイベントと重複して発生する可能性があるイベントについては、基本的に標準ポリシーに定義されないようになっています。これは、近いタイミングでイベントが複数回発生し、それぞれに対してポリシーアクションが実行されると、復旧処理が複数回実行されたり、アクション実行中のため復旧処理がスキップされたりする可能性があるためにそうなっています。管理対象マシンがダウン状態になる状況の障害では、死活監視のイベント以外にハードウェアの障害イベントなどが発生する場合があります。