以下について、説明します。
デバイス監視は、ストレージ装置やネットワーク機器などのデバイスの障害の監視を行う機能です。
デバイス監視の機能の特徴は、以下のとおりです。後述の図も参照してください。
監視の方法は、以下の2種類があります。
デバイスから送信されるSNMP Trapを利用した監視
ESMPRO/ServerManagerによる死活監視
障害が発生したデバイスの特定が簡易に行えます。障害が発生したデバイスは、以下のように情報が表示されるため、見つけやすくなっています。
障害が発生したデバイスのハードウェアステータスが、故障、または一部故障に変更されます。ステータスについては、「2.3.1. ステータスの概要」を参照してください。
ハードウェアステータスが上記に変更されたデバイスのアイコンが、異常を示すアイコンに切り替わります。
デバイス別に、イベント情報を表示することができます。関係のない他のデバイスのイベント情報が表示されないため、発生した障害の内容の確認がしやすいです。
デバイスの[トポロジ]タブの画面で、障害の影響範囲の把握を即座に行えます。
デバイスに設定された関連の情報より、[トポロジ]タブの画面で、障害が発生したデバイスと関係があるマシンや運用グループなどの情報がわかりやすく表示されます。トポロジについては、「2.10. システム構成のトポロジ」を参照してください。関連については、「1.2.12. デバイス・マシンの関連(障害の影響関係)について」を参照してください。
デバイスの障害発生時に、ポリシーアクションを自動実行することができます。
利用可能なポリシーアクションは、メール通報などの汎用的なもの以外に、関連がある稼動マシン(1台のみ)に対して実行するマシン用のポリシーアクションもあります。
iStorageの監視には、イベント定義ファイルのサンプル:necstorage.xmlが利用できます。iStorageの監視では、障害のイベントの対象がディスクアレイ内のディスクボリューム単体に限定される場合、該当するディスクボリューム単体の障害として識別することができます。「6.8.1. iStorageのSNMP Trapによる監視」を参照してください。また、「1.2.11. デバイスのノード」も参照してください。
デバイス監視が利用可能なデバイスの種類は、以下のとおりです。
ディスクアレイ
ディスクアレイがiStorageの場合、ディスクアレイ内のディスクボリューム(LUN)とストレージプールのイベントも特定可能。
物理スイッチ、ロードバランサ
カスタムオブジェクト
SNMP Trapによる監視を行うためには、監視対象のデバイスは、障害発生時に、SNMP TrapのイベントをSigmaSystemCenterに送信できる必要があります。
そのため、デバイス監視を行うためには、障害発生時に、デバイスからSigmaSystemCenterの管理サーバへSNMP Trapが送信されるように、デバイスに対して設定を行う必要があります。SNMP Trap送信の設定方法については、各デバイスのマニュアルを参照してください。
SNMP Trapを受信するために、管理サーバOSにはSNMP Trapサービスをインストールしておく必要があります。
また、デバイスのSNMP Trapのイベントを、SigmaSystemCenterが処理できるように、イベントの定義情報が後述のイベント定義ファイルに記述されている必要があります。
SigmaSystemCenterが対応しているSNMPバージョンは、v1とv2cです。デバイス側の設定では、前述のバージョンのSNMP Trapが送信されるように設定してください。
また、デバイスの種類やSNMP Trapのバージョンにより送信される内容が異なるため、イベント定義ファイルでは、デバイスや送信されるSNMP Trapのバージョンに特化した定義を行う必要があります。複数のデバイスで異なるバージョンを利用することは可能です。
デバイスに対して、SNMP Trapを利用した監視を行うためには、以下の設定が必要です。
監視の設定手順は、「(2)SNMP Trapを利用した監視の概要」を参照してください。
イベント定義ファイル
登録するデバイスから送信されるSNMP Trapのイベント定義を行うxmlファイルです。作成したファイルは、<SystemProvisioningのインストールフォルダ>\conf\snmptrap下にファイルを格納し、ssc config-load eventコマンドを実行することで有効となります。
イベント定義ファイルは、対象となるデバイス、イベントとして受信するSNMP Trapの詳細情報、受信時に設定するハードウェアステータスの値(SNMP Trapの重要度に応じて設定)などの定義情報から構成されます。
イベント定義ファイルの編集方法については、「イベント定義ファイル(XML) 編集手順」を参照してください。
サンプルとして、<SystemProvisioningのインストールフォルダ>\opt\snmptrap下のファイルを参考にすることができます。
iStorageの監視については、necstorage.xmlの利用が可能です。本ファイルの使用上の注意などについては、「6.8.1. iStorageのSNMP Trapによる監視」を参照してください。
デバイス用のポリシーの設定
上記のイベント定義ファイルで定義された各イベントに対するポリシーアクションを設定します。設定したポリシーは、ssc update object -policyコマンドで対象デバイスに割り当てます。ディスクアレイについては、Webコンソールでもポリシーの割り当てを行うことができます。
iStorage用の「ストレージポリシー(ストレージプール診断)」以外のデバイス用の標準ポリシーはないため、iStorage以外は新規にポリシーを作成する必要があります。アクションの実行が必要なイベントごとに、ポリシー規則の設定を行ってください。
ポリシーの設定は、マシンと同様に、Webコンソールの管理ビュー上で設定を行います。イベントに対応してポリシーアクションを実行する必要がない場合は、ポリシーの設定を行う必要がありません。
なお、本監視機能によりデバイスのハードウェアステータスが異常になった場合、復旧後に、[故障状態の解除]の操作でステータスを正常に手動で戻す必要があります。「(3)SNMP Trapを利用した監視の設定」を参照してください。
iStorageのデバイス監視では、予兆イベントを検出することができます。下記の予兆系イベントは、稼動中のOSに影響がいまだ出ていない物理ディスクの障害(ストレージプールの縮退)をストレージプールの状態を確認することで、OSが異常停止する前に、可能なかぎり安全に停止したり、仮想マシンを退避したりすることができるように想定されたものです。
デバイス障害回復
デバイス予兆:縮退障害
次の図のように、監視の設定を行います。
図の手順では、監視設定の対象デバイスが既にSigmaSystemCenterに登録されている前提です。各デバイスの登録方法の要点一覧は、「1.2.1. [リソース]ビューと[仮想]ビューへの登録 - 概要」の「(6)種類別登録方法の一覧」を参照してください。
カスタムオブジェクトについては、監視設定も含めた登録手順を「1.2.9. [リソース]ビューへの登録 - その他デバイス(カスタムオブジェクト)」に記載しています。
イベント定義ファイルの編集方法については、「イベント定義ファイル(XML) 編集手順」を参照してください。
障害発生時、ハードウェアステータスが異常になった場合、ステータスを正常に戻すためには[故障状態の解除]の操作を行う必要があります。
自動で元に戻す方法はありません。
対象デバイスの復旧を確認した後、手動で[故障状態の解除]の操作を行ってください。
ESMPRO/ServerManagerにデバイスを登録することで、ESMPRO/ServerManagerによる死活監視のイベントを受信し、障害を検知することができます。
本監視ではステータス変更は行われません。
本機能を利用するためには、以下の設定が必要です。
デバイスをアラート受信のみ管理するコンポーネントでESMPRO/ServerManagerに登録
デバイスのカスタムオブジェクトのSigmaSystemCenterへの登録
SigmaSystemCenter上でデバイス用のポリシーの作成
ESMPRO/ServerManagerにて、デバイスをアラート受信のみ管理するコンポーネントで登録します。ESMPRO/ServerManagerの設定方法については、ESMPRO/ServerManagerのマニュアルを参照してください。
上記マニュアルは、以下のESMPRO/ServerManagerの製品サイトのダウンロードページからダウンロードできます。
ESMPRO/ServerManagerに登録したコンポーネントのIPアドレスを識別子に設定したカスタムオブジェクトを、SigmaSystemCenterに登録します。
カスタムオブジェクトについては、監視設定も含めた登録手順を「1.2.9. [リソース]ビューへの登録 - その他デバイス(カスタムオブジェクト)」に記載しています。
デバイス用のポリシーを作成します。
本監視で検出されるイベントは、以下のとおりです。
イベント区分: マシンアクセス不可能障害
通報元: SystemMonitorEvent
イベントID: ESMPRO/SM[0XC000000C]
上記イベントに対するポリシーアクションを設定したポリシーを作成します。
作成したポリシーは、ssc update object -policy コマンド、またはWeb コンソールでカスタムオブジェクトに割り当てます。