BMC死活監視は、SystemProvisioningで提供される管理対象マシン上のBMCに対して、死活監視を行う機能です。
SigmaSystemCenterのOOB管理を利用した運用において、下記図のように、管理対象マシン上のBMCに対して死活監視を行うことで、BMCの制御不可を要因とする問題を未然に防ぐことができます。
また、BMC死活監視では、予備マシンに対しても監視を行うことができます。
本機能では、以下の監視機能を利用して監視を行います。後述の図も参照してください。
なお、仮想マシンでは利用できません。
IPMI使用時
RMCP Ping
RMCP Pingの疎通有無により、監視対象のBMCの死活監視を行います。
ICMP Pingとは異なり、RMCPプロトコルに則った通信が行われます。
IPMIコマンド
監視対象のBMCに対して、IPMIコマンドを実行し、死活監視を行います。
Redfish使用時
HTTPリクエスト
HTTP GETリクエストの結果により、監視対象の BMC の死活監視を行います。
本機能の設定は、Webコンソールでは[管理]ビューの環境設定の[死活監視]タブで行うことができます。ssc update environmentコマンドでも設定可能です。
また、本機能を利用するためには、管理対象マシン([リソース]ビュー)のプロパティの[アカウント情報]タブで、タイプがOOBのアカウントの設定を行う(監視設定を「有効」にする)必要があります。
その他、各監視機能は、監視対象のマシンの状態が以下のすべての条件を満たしている場合に動作します。条件を満たしていないマシンに対しては、監視は行われません。
対象マシンがOOBアカウント登録済みで、接続状態が「接続可能」または「接続不可」であること
対象マシンのメンテナンスモードがOFFであること
異常検出時に発行されるイベントは、以下のとおりです。
イベント区分: BMCアクセス不可能障害
通報元: BMCAliveMonitor
イベントID: [PeriodicalBMCAliveMonitor] TargetDown
上記イベントに対応する処理は、次の標準ポリシーで定義されています。
稼動マシン用: 標準ポリシー(稼働マシンBMC死活)
BMC死活監視専用の標準ポリシーのため、標準ポリシー(N+1)など他用途の標準ポリシーをテンプレートとして作成したポリシーと併用して利用してください。運用グループには、複数のポリシーを割り当てることが可能です。
本標準ポリシーでは、異常検出時に、イベントログ出力・メール通報やハードウェアステータスを一部故障に変更します。
予備マシン用: 標準ポリシー(プールマシン)
予備マシン用のポリシーの指定は、[管理]ビューの環境設定の[死活監視]タブで行います。
本標準ポリシーでは、異常検出時に、イベントログ出力・メール通報やハードウェアステータスを故障に変更します。
また、障害検出時に、以下の個別ステータスが更新されます。
個別ステータスの詳細は、「2.3.2. マシンのハードウェアステータスと個別ステータスの関係」、「2.3.3. マシンの個別ステータス」を参照してください。
BMC 死活監視状態
「RMCP Ping状態」、「IPMIコマンド状態」、「Redfish状態」を統合した状態です。
以下の通り、利用内容によって、正常状態の判定が異なります。
Redfishのみでの監視:「Redfish状態」が正常の場合、正常
IPMIのみでの監視:「RMCP Ping状態」、「IPMIコマンド状態」の2つが正常の場合、正常
両方での監視:「Redfish状態」、「RMCP Ping状態」、「IPMIコマンド状態」の3つが正常の場合、正常
RMCP Ping状態
RMCP Pingの疎通有無が反映されます。
IPMIコマンド状態
IPMIコマンドを実行結果が反映されます。
Redfish状態
HTTP GETリクエストの結果が反映されます。
異常検出後、BMCが修理などで復旧した場合、監視により回復が確認されると、回復イベントが上がります。OOBアカウントの接続状態と個別ステータスも、正常に戻ります。
ただし、監視の間隔は、既定では30分間隔のため、正常に戻るまで時間がかかる場合があります。
また、ハードウェアステータスは、既定の標準ポリシーでは回復イベント発生時に正常に戻すアクションは実行されないため、[故障状態の解除]の操作で正常に戻してください。
手動での正常性確認は、マシンプロパティの[アカウント情報]タブにてタイプが「OOB」の接続確認を実行することで可能です。[アカウント情報]タブの接続確認の結果は、ハードウェアステータス、個別ステータスに反映されないため、正常性を確認できた場合は、ハードウェアステータスと各個別ステータスを[故障状態の解除]の操作で正常に戻してください。
IPMI使用時における監視動作の詳細は、以下の図の通りです。
Redfish使用時における監視動作の詳細は、以下の図の通りです。
監視対象マシンの台数や、ネットワーク環境によっては、BMC障害を意図せず検出する場合があります。その場合は、リトライ回数などの調整を行ってください。