デバイス監視は、ストレージ装置やネットワーク機器などのデバイスから送信される障害のイベント(SNMP Trap)の監視を行う機能です。
デバイス監視の機能の特徴は以下の通りです。後述の図も参照してください。
障害が発生したデバイスの特定が簡易に行えます。障害が発生したデバイスは以下のように情報が表示されるため、見つけやすくなっています。
障害が発生したデバイスのハードウェアステータスが故障または一部故障に変更されます。ステータスについては、「2.3.1. ステータスの概要」を参照してください。
ハードウェアステータスが上記に変更されたデバイスのアイコンが異常を示すアイコンに切り替わります。
デバイス別にイベント情報を表示することができます。関係のない他のデバイスのイベント情報が表示されないため、発生した障害の内容の確認がしやすいです。
デバイスの[トポロジ]タブの画面で障害の影響範囲の把握を即座に行えます。
デバイスに設定された関連の情報より、[トポロジ]タブの画面で障害が発生したデバイスと関係があるマシンや運用グループなどの情報がわかりやすく表示されます。トポロジについては、「2.10. システム構成のトポロジ」を参照してください。関連については、「1.2.11. デバイス・マシンの関連(障害の影響関係)について」を参照してください。
デバイスの障害発生時にポリシーアクションを自動実行することができます。
利用可能なポリシーアクションはメール通報などの汎用的なもの以外に、関連がある稼動マシン(1台のみ)に対して実行するマシン用のポリシーアクションもあります。
iStorageの監視にはイベント定義ファイルのサンプル:necstorage.xmlが利用できます。iStorageの監視では、障害のイベントの対象がディスクアレイ内のディスクボリューム単体に限定される場合、該当するディスクボリューム単体の障害として識別することができます。「6.8.1. iStorageのSNMP Trapによる監視」を参照してください。また、「1.2.10. デバイスのノード」も参照してください。
本機能の前提として、監視対象のデバイスは、 障害発生時にSNMP TrapのイベントをSigmaSystemCenterに送信できる必要があります。
そのため、デバイス監視を行うためには、障害発生時にデバイスからSigmaSystemCenterの管理サーバへSNMP Trapが送信されるようにデバイスに対して設定を行う必要があります。SNMP Trap送信の設定方法については、各デバイスのマニュアルを参照してください。
管理サーバOSには、SNMP Trapを受信するためにSNMP Trapサービスをインストールしておく必要があります。
また、デバイスのSNMP TrapのイベントをSigmaSystemCenterが処理できるように、イベントの定義情報が後述のイベント定義ファイルに記述されている必要があります。
SigmaSystemCenterが対応しているSNMPバージョンは、v1とv2cです。デバイス側の設定では前述のバージョンのSNMP Trapが送信されるように設定してください。
また、デバイスの種類やSNMP Trapのバージョンにより送信される内容が異なるため、イベント定義ファイルでは、デバイスや送信されるSNMP Trapのバージョンに特化した定義を行う必要があります。複数のデバイスで異なるバージョンを利用することは可能です。
デバイス監視が利用可能なデバイスの種類は以下の通りです。
ディスクアレイ
ディスクアレイがiStorageの場合、ディスクアレイ内のディスクボリューム(LUN)とストレージプールのイベントも特定可能。
物理スイッチ、ロードバランサ
カスタムオブジェクト
デバイス監視を行うためには、以下の設定が必要です。監視の設定手順は、「(2)監視の設定」を参照してください。
イベント定義ファイル
登録するデバイスから送信されるSNMP Trapのイベント定義を行うxmlファイルです。作成したファイルは、<SystemProvisioningのインストールフォルダ>\conf\snmptrap下にファイルを格納し、ssc config-load eventコマンドを実行することで有効となります。
イベント定義ファイルは、対象となるデバイス、イベントとして受信するSNMP Trapの詳細情報、受信時に設定するハードウェアステータスの値(SNMP Trapの重要度に応じて設定)などの定義情報から構成されます。
イベント定義ファイルの編集方法については、「イベント定義ファイル(XML) 編集手順」を参照してください。
サンプルとして、<SystemProvisioningのインストールフォルダ>\opt\snmptrap下のファイルを参考にすることができます。
iStorageの監視については、necstorage.xmlの利用が可能です。本ファイルの使用上の注意などについては、「6.8.1. iStorageのSNMP Trapによる監視」を参照してください。
デバイス用のポリシーの設定
上記のイベント定義ファイルで定義された各イベントに対するポリシーアクションを設定します。設定したポリシーはssc update object -policyコマンドで対象デバイスに割り当てます。ディスクアレイについては、Webコンソールでもポリシーの割り当てを行うことができます。
iStorage用の「ストレージポリシー(ストレージプール診断)」以外のデバイス用の標準ポリシーはないため、iStorage以外は新規にポリシーを作成する必要があります。アクションの実行が必要なイベントごとにポリシー規則の設定を行ってください。
ポリシーの設定は、マシンと同様にWebコンソールの管理ビュー上で設定を行います。イベントに対応してポリシーアクションを実行する必要がない場合は、ポリシーの設定を行う必要がありません。
なお、本監視機能によりデバイスのハードウェアステータスが異常になった場合、復旧後に[故障状態の解除]の操作でステータスを正常に手動で戻す必要があります。「(3)障害発生後のステータス回復」を参照してください。
iStorageのデバイス監視では、予兆イベントを検出することができます。下記の予兆系イベントは、稼動中のOSに影響が未だ出ていない物理ディスクの障害(ストレージプールの縮退)をストレージプールの状態を確認することで、OSが異常停止する前に可能な限り安全に停止したり、仮想マシンを退避したりする事ができるように想定されたものです。
デバイス障害回復
デバイス予兆:縮退障害
次の図のように監視の設定を行います。
図の手順では監視設定の対象デバイスが既にSigmaSystemCenterに登録されている前提です。各デバイスの登録方法の要点一覧は、「1.2.1. [リソース]ビューと[仮想]ビューへの登録 - 概要」の「(6)種類別登録方法の一覧」を参照してください。
カスタムオブジェクトについては、監視設定も含めた登録手順を「1.2.9. [リソース]ビューへの登録 - その他デバイス(カスタムオブジェクト)」に記載しています。
イベント定義ファイルの編集方法については、「イベント定義ファイル(XML) 編集手順」を参照してください。
障害発生時、ハードウェアステータスが異常になった場合、ステータスを正常に戻すためには[故障状態の解除]の操作を行う必要があります。
自動で元に戻す方法はありません。
対象デバイスの復旧を確認した後、手動で[故障状態の解除]の操作を行ってください。