1. はじめに

1.1. 対象読者と目的

『CLUSTERPRO X SingleServerSafe for Linux 設定ガイド』は、システムの導入を行うシステムエンジニアと、システム導入後の保守・運用を行うシステム管理者を対象読者とし、CLUSTERPRO X SingleServerSafeの構築作業の手順について説明します。

1.2. 本書の構成

1.3. 本書で記述される用語

本書で説明する CLUSTERPRO X SingleServerSafe は、クラスタリングソフトウェアである CLUSTERPRO X との操作性などにおける親和性を高めるために、共通の画面・コマンドを使用しています。そのため、一部、クラスタとしての用語が使用されています。

以下ように用語の意味を解釈して本書を読み進めてください。

クラスタ、クラスタシステム

CLUSTERPRO X SingleServerSafe を導入した単サーバのシステム

クラスタシャットダウン/リブート

CLUSTERPRO X SingleServerSafe を導入したシステムのシャットダウン、リブート

クラスタリソース

CLUSTERPRO X SingleServerSafe で使用されるリソース

クラスタオブジェクト

CLUSTERPRO X SingleServerSafe で使用される各種リソースのオブジェクト

フェイルオーバグループ

CLUSTERPRO X SingleServerSafe で使用されるグループリソース(アプリケーション、サービスなど)をまとめたグループ

1.4. CLUSTERPRO X SingleServerSafe マニュアル体系

CLUSTERPRO X SingleServerSafeのマニュアルは、以下の 3 つに分類されます。各ガイドのタイトルと役割を以下に示します。

CLUSTERPRO X SingleServerSafe for Linux インストールガイド』 (Install Guide)

CLUSTERPRO X SingleServerSafeを使用したシステムの導入を行うシステムエンジニアを対象読者とし、CLUSTERPRO X SingleServerSafeのインストール作業の手順について説明します。

『CLUSTERPRO X SingleServerSafe for Linux 設定ガイド』 (Configuration Guide)

CLUSTERPRO X SingleServerSafeを使用したシステムの導入を行うシステムエンジニアと、システム導入後の保守・運用を行うシステム管理者を対象読者とし、CLUSTERPRO X SingleServerSafeの構築作業の手順について説明します。

CLUSTERPRO X SingleServerSafe for Linux 操作ガイド』 (Operation Guide)

CLUSTERPRO X SingleServerSafe を使用したシステム導入後の保守・運用を行うシステム管理者を対象読者とし、CLUSTERPRO X SingleServerSafe の操作方法について説明します。

1.5. 本書の表記規則

本書では、注意すべき事項、重要な事項および関連情報を以下のように表記します。

注釈

この表記は、重要ではあるがデータ損失やシステムおよび機器の損傷には関連しない情報を表します。

重要

この表記は、データ損失やシステムおよび機器の損傷を回避するために必要な情報を表します。

参考

この表記は、参照先の情報の場所を表します。

また、本書では以下の表記法を使用します。

表記

使用方法

[ ] 角かっこ

コマンド名の前後
画面に表示される語 (ダイアログボックス、メニューなど) の前後
[スタート] をクリックします。
[プロパティ] ダイアログ ボックス

コマンドライン中の [ ] 角かっこ

かっこ内の値の指定が省略可能であることを示します。

clpstat -s[-h host_name]

#

Linux ユーザが、root でログインしていることを示すプロンプト

# clpcl -s -a

モノスペースフォント

パス名、コマンドライン、システムからの出力 (メッセージ、プロンプトなど)、ディレクトリ、ファイル名、関数、パラメータ

/Linux/5.0/jp/server/

太字

ユーザが実際にコマンドラインから入力する値を示します。

以下を入力します。
# clpcl -s -a

斜体

ユーザが有効な値に置き換えて入力する項目

rpm -i clusterprosss-<バージョン番号>-<リリース番号>.x86_64.rpm

CLUSTERPRO X SingleServerSafe 本書の図では、CLUSTERPRO X SingleServerSafe を表すために このアイコンを使用します。

1.6. 最新情報の入手先

最新の製品情報については、以下のWebサイトを参照してください。

2. CLUSTERPRO X SingleServerSafe について

本章では、CLUSTERPRO X SingleServerSafe の機能概要の説明と、監視可能な障害について説明します。

本章で説明する項目は以下のとおりです。

2.1. CLUSTERPRO X SingleServerSafe とは?

CLUSTERPRO X SingleServerSafeは、サーバにセットアップすることで、サーバ上のアプリケーションやハードウェアの障害を検出し、障害発生時には、アプリケーションの再起動やサーバの再起動を自動的に実行することで、サーバの可用性を向上させる製品です。

通常のサーバでは、アプリケーションが異常終了した場合、アプリケーションの終了に気づいた時点で、アプリケーションの起動を手動で行う必要があります。 また、アプリケーションは異常終了していないが、アプリケーション内部での動作が不安定になり正常に動作していない場合があります。このような異常状態になっていることは、通常では容易に知ることはできません。 ハードウェア障害が発生した場合、一時的な障害であれば、サーバの再起動で正常に戻る可能性があります。しかし、ハードウェア障害に気づくのは困難で、アプリケーションの動作がどうもおかしいと調査を行った結果、ハードウェア障害であったということがよくあります。

CLUSTERPRO X SingleServerSafeでは、異常を検出したいアプリケーション、ハードウェアを指定することで、自動的に障害を検出し、自動的にアプリケーション、サーバの再起動を行うことで、障害からの復旧処理を行います。

注釈

上述のようにハードウェアの物理的な障害に関しては、サーバの再起動では復旧できないことが多いです。ハードウェアの物理的障害に備えるには、ハードウェアの二重化やクラスタリングソフトなどの導入を検討してください。

2.2. CLUSTERPRO X SingleServerSafe の障害監視のしくみ

CLUSTERPRO X SingleServerSafeでは、各種監視を行うことで、迅速かつ確実な障害検出を実現しています。以下にその監視の詳細を示します。

  • アプリケーションの死活監視

    アプリケーションを起動用のリソース (アプリケーションリソース、サービスリソースと呼びます) により起動し、監視用のリソース (アプリケーションモニタリソース、サービスモニタリソースと呼びます) により定期的にプロセスの生存を確認することで実現します。業務停止要因が業務アプリケーションの異常終了である場合に有効です。

    注釈

    CLUSTERPRO X SingleServerSafe が直接起動したアプリケーションが監視対象の常駐プロセスを起動し終了してしまうようなアプリケーションでは、常駐プロセスの異常を検出することはできません。

    注釈

    アプリケーションの内部状態の異常 (アプリケーションのストールや結果異常) を検出することはできません。

  • 監視オプションによるアプリケーション/プロトコルのストール/結果異常監視

    別途ライセンスの購入が必要となりますが、データベースアプリケーション(Oracle,DB2等)、プロトコル(FTP,HTTP等)、アプリケーションサーバ(WebSphere,WebLogic等)のストール/結果異常監視を行うことができます。詳細は、「6. モニタリソースの詳細」を参照してください。

  • リソースの監視

    CLUSTERPRO X SingleServerSafe のモニタリソースにより各種リソース(アプリケーション、サービスなど)やLANの状態を監視することで実現します。業務停止要因が業務に必要なリソースの異常である場合に有効です。

2.2.1. 監視できる障害と監視できない障害

CLUSTERPRO X SingleServerSafe には、監視できる障害とできない障害があります。クラスタシステム構築時、運用時に、どのような監視が検出可能なのか、または検出できないのかを把握しておくことが重要です。

2.2.2. 業務監視で検出できる障害とできない障害

監視条件: 障害アプリケーションの消滅、 継続的なリソース異常、 あるネットワーク装置への通信路切断

  • 監視できる障害の例

    • アプリケーションの異常終了

    • LAN NICの故障

  • 監視できない障害の例

    • アプリケーションのストール/結果異常
      アプリケーションのストール/結果異常をCLUSTERPRO X SingleServerSafe で直接監視することはできませんが、アプリケーションを監視し異常検出時に自分自身を終了するプログラムを作成し、そのプログラムを EXEC リソースで起動、PID モニタリソースで監視することで、再起動を発生させることは可能です。

3. 構成情報を作成する

CLUTERPRO X SingleServerSafe では、構成内容を記述するデータのことを、構成情報と呼びます。Cluster WebUI を用いて構成情報を作成します。本章では、Cluster WebUI の起動方法、および構成情報の作成手順をサンプルの構成例を用いて説明します。

本章で説明する項目は以下のとおりです。

3.1. 設定値を確認する

Cluster WebUI を使用して実際に構成情報を作成する前に、構成情報として設定する値を確認します。値を書き出して、情報に漏れがないかを確認しておきましょう。

3.1.1. 環境のサンプル

以下に、構成情報のサンプル値を記載します。以降のトピックでは、この条件で構成情報を作成する手順をステップ バイ ステップで説明します。実際に値を設定する際には、構築する構成情報と置き換えて入力してください。値の決定方法については、「5. グループリソースの詳細」「6. モニタリソースの詳細」を参照してください。

構成設定例

設定対象

設定パラメータ

設定値

サーバの情報

サーバ名

server1

モニタ リソース数

3

タイプ

フェイルオーバ

グループ名

failover1

起動サーバ

server1

1 つ目のグループリソース

タイプ

EXEC リソース

グループ リソース名

exec1

常駐タイプ

常駐

開始パス

実行ファイルのパス

1 つ目のモニタリソース(デフォルト作成)

タイプ

ユーザ空間モニタ

モニタ リソース名

userw1

2 つ目のモニタリソース

タイプ

IPモニタ

モニタリソース名

ipw1

監視 IP アドレス

192.168.0.254(ゲートウェイ)

回復対象

LocalServer

再活性しきい値

-

最終動作

サービス停止とOS再起動

3 つ目のモニタリソース

タイプ

PIDモニタ

モニタリソース名

pidw1

対象リソース

exec1

回復対象

failover1

再活性しきい値

3

最終動作

サービス停止とOS再起動

注釈

1 つ目のモニタリソースの「ユーザ空間モニタ」は自動的に設定されます。

3.2. Cluster WebUI を起動する

構成情報を作成するには、Cluster WebUI にアクセスする必要があります。ここでは、まず Cluster WebUI の概要を説明し、その後、Cluster WebUI にアクセスして、構成情報を作成する方法について説明します。

3.2.1. Cluster WebUI とは

Cluster WebUI とは、Webブラウザ経由でサーバの状態監視、サーバ/グループの起動/停止及び、動作ログの収集などを行うための機能です。

サーバおよび管理PC

図 3.1 Cluster WebUI

3.2.2. Cluster WebUI を起動するには

Cluster WebUI を起動する手順を示します。

  1. Web ブラウザを起動します。
    ブラウザのアドレス バーに、CLUSTERPRO X SingleServerSafeをインストールしたサーバのIP アドレスとポート番号を入力します。
    http://ip-address:port/
    ip-address

    CLUSTERPRO X SingleServerSafeをインストールしたサーバのIPアドレスを指定します。自サーバの場合は localhost でも問題ありません。

    port

    インストール時に指定したWebManagerのポート番号と同じ番号を指定します(既定値29003)。

  2. Cluster WebUI が起動します。

  3. ツールバーのドロップダウンメニューで [設定モード] を選択して、設定モードに切り替えます。

    参考

    CLUSTERPRO サーバと暗号化通信を有効にして接続する場合は、「8. その他の設定の詳細」- 「8.1. クラスタプロパティ」 - 「8.1.11. WebManager タブ」を参照してください。暗号化通信を行う場合は下記を入力します。

    https://192.168.0.3:29003/

3.3. 構成情報の作成手順

構成情報を作成するには、サーバの設定、グループの作成、モニタリソースの作成の 3 つのステップを踏みます。新規に構成情報を作成する場合は、生成ウィザードを使います。以下に手順の流れを示します。

注釈

作成した構成情報のほとんどは名称変更機能やプロパティ表示機能を使用して後から変更できます。

  1. 3.3.1. サーバの設定

    CLUSTERPRO X SingleServerSafe を動作させるサーバを設定します。

  2. 3.3.2. グループの設定

    グループを作成します。グループでアプリケーションの起動・終了を制御します。必要な数のグループを作成します。通常、制御したいアプリケーション数ほど必要ですが、「スクリプトリソース」を使用した場合は、1 つのグループで複数のアプリケーションをまとめることもできます。

  3. 3.3.3. モニタリソースの設定

    指定された監視対象を監視する、モニタリソースを追加します。
    監視したい数、作成します。

3.3.1. サーバの設定

サーバを設定します。

3.3.1.1. サーバを設定する

CLUSTERPRO X SingleServerSafeをインストール後、OSを再起動することで自動的に作成されます。Cluster WebUI の操作モードから設定モード画面に切り替えると既に作成済みの情報が表示されます。

画面は以下のようになっています。

3.3.2. グループの設定

グループとは、システム内のある 1 つの独立した業務を実行するために必要なサービスやプロセスの集まりのことです。

グループを追加する手順を説明します。

3.3.2.1. グループを追加する

グループの設定を行います。

  1. [グループ] の [グループの追加] をクリックします。

  2. [グループの定義] 画面が開きます。
    以下のタイプから、選択してください。

    タイプ

    • フェイルオーバ
      通常はこちらのタイプを選択します。

    [名前] ボックスにグループ名 (failover1) を入力し、[次へ] をクリックします。

  3. [全てのサーバでフェイルオーバ可能] チェックボックスのチェックがオンになっていることを確認し、[次へ] をクリックします。

  4. グループの各属性値を設定する画面です。そのまま [次へ] をクリックします。

  5. [グループリソースの定義一覧]が表示されます。そのまま [完了] をクリックします。

3.3.2.2. グループリソース (EXEC リソース) を追加する

スクリプトによってアプリケーションの起動/終了を行う、EXECリソースを追加します。

  1. [failover1] の [リソースの追加] をクリックします。

  2. [グループのリソース定義 | failover1]画面が開きます。[タイプ] ボックスでグループリソースのタイプ (EXEC リソース) を選択し、[名前] ボックスにグループ名 (exec1) を入力します。[次へ] をクリックします。

  3. 依存関係設定が表示されます。何も指定せず [次へ] をクリックします。

  4. 復旧動作設定が表示されます。[次へ] をクリックします。

  5. [ユーザアプリケーション] をチェックします。また、[Start path]に、実行ファイルのパスを指定します。

  6. [調整]をクリックし、ダイアログボックスを開きます。[開始スクリプト]で、[非同期]をチェックし、[OK]をクリックします。

  7. [完了] をクリックします。

3.3.3. モニタリソースの設定

指定した対象を監視するモニタリソースを追加します。

3.3.3.1. モニタリソース (IP モニタリソース) を追加する

  1. [モニタ] の [モニタリソースの追加] をクリックします。[モニタリソースの定義] が表示されます。

  2. [タイプ] ボックスでモニタリソースのタイプ (IP モニタ) を選択し、[名前] ボックスにモニタリソース名 (ipw1) を入力します。[次へ] をクリックします。

    注釈

    タイプとして、モニタリソースが表示されるので、監視したいリソースを選択します。
    オプション製品のライセンスがインストールされていない場合、ライセンスに対応するリソースおよびモニタリソースはCluster WebUI の一覧に表示されません。
    インストールされているライセンスが表示されない場合、[ライセンス情報取得] をクリックしてライセンス情報を取得してください。
  3. 監視 (共通) 設定を入力します。ここではデフォルト値のまま変更せず、[次へ] をクリックします。

  4. [IP アドレス一覧] が表示されます。[追加] をクリックします。

  5. [IP アドレス] ボックスに監視IP アドレス (192.168.0.254) を入力し [OK] をクリックします。

    注釈

    IP モニタリソースの監視対象には、LAN 上で、常時稼動が前提とされている機器 (例えば、ゲートウェイ) の IP アドレスを指定します。

  6. 入力した IP アドレスが [IP アドレス一覧] に設定されます。[次へ] をクリックします。

  7. 回復動作設定が表示されます。[参照] を押して LocalServer を選択します。[完了] をクリックします。

3.3.3.2. モニタリソース (PID モニタリソース) を追加する

このモニタリソースは EXEC リソースの開始スクリプトの種類が[非同期]の場合に設定可能です。

  1. モニタ] の [モニタリソースの追加] をクリックします。

  2. [タイプ] ボックスでモニタリソースのタイプ (PIDモニタ) を選択し、[名前] ボックスにモニタリソース名 (pidw1) を入力します。[次へ] をクリックします。

  3. 監視(共通) 設定を入力します。[参照] をクリックします。

  4. 表示されるツリービューで [exec1] をクリックし、[OK] をクリックします。[対象リソース] に [exec1] が設定されます。[次へ] をクリックします。

  5. 回復対象を設定します。[参照] をクリックします。

  6. 表示されるツリー ビューで [failover1] をクリックし、[OK] をクリックします。[回復対象] に [failover1] が設定されます。

  7. [完了] をクリックします。
    設定後の画面は以下のようになります。

以上で構成情報の作成は終了です。次の「 3.4. 構成情報を保存する 」へ進んでください。

3.4. 構成情報を保存する

構成情報は、ファイルシステム上に保存する方法と、外部メディアに保存する方法があります。Cluster WebUI で保存した情報をCLUSTERPRO Server をインストールしたサーバマシンにCluster WebUI 経由で反映させることができます。

構成情報を保存するには、以下の手順に従ってください。

  1. Cluster WebUI の設定モードから [設定のエクスポート] をクリックします。

  2. 保存先を選択し、保存します。

    注釈

    保存されるのはファイル 1 点 (clp.conf) とディレクトリ 1 点 (scripts) です。これらのファイルとディレクトリがすべて揃っていない場合はクラスタ生成コマンドの実行が不成功に終わりますので、移動する場合はかならずこの 2 点をセットとして取り扱ってください。なお、新規作成した構成情報を変更した場合は、上記 2 点に加えて clp.conf.bak が作成されます。

3.5. 構成情報をチェックする

Cluster WebUI で作成したクラスタ構成情報をクラスタサーバに反映する前に、設定したクラスタ構成情報のチェックを行うことができます。

  1. Cluster WebUI の設定モードから [クラスタ構成情報チェック] をクリックします。

3.6. 構成情報を反映する

Cluster WebUI で構成情報を作成したら、サーバに構成情報を反映させます。

構成情報を反映するには、以下の手順に従ってください。

  1. Cluster WebUI の設定モードから、[設定の反映] をクリックします。

  2. 設定の反映前後の構成情報の差異によっては、ポップアップウィンドウに反映に必要な動作に関する確認が表示されます。
    動作内容に問題がなければ、[OK] をクリックします。
    アップロードに成功すると、[反映に成功しました。] のメッセージが表示されますので、[了解] をクリックします。
    アップロードに失敗した場合は、表示されるメッセージに従って操作を行ってください。
  3. 状態が Cluster WebUI に表示されます。
    Cluster WebUI の操作・確認方法についてはオンラインマニュアルを参照してください。
    オンラインマニュアルは画面右上部の [ ] から参照できます。

4. システムを確認する

本章では、作成したシステムが正常に起動するかどうかを確認します。

本章で説明する項目は以下のとおりです。

4.1. Cluster WebUI による動作確認

設定後のシステムの確認には、Cluster WebUI を使用して行う方法と、コマンドラインを使用して行う方法があります。本トピックでは、Cluster WebUI を使用してシステムの確認を行う方法について説明します。Cluster WebUI は、CLUSTERPRO Server のインストール時点ですでにインストールされています。新たにインストールを行う必要はありません。ここでは、まず Cluster WebUI の概要を説明し、その後、Cluster WebUI にアクセスし、サーバの状態を確認する方法について説明します。

参考

Cluster WebUI の動作環境については、『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」 - 「CLUSTERPRO X SingleServerSafe の動作環境を確認する」 - 「ソフトウェア」を参照してください。

Cluster WebUI を接続後、以下の手順で動作を確認します。

参考

Cluster WebUIの操作方法についてはオンラインマニュアルを参照してください。

  1. ハートビートリソース
    Cluster WebUI 上でサーバのステータスが起動済であることを確認します。
    サーバのハートビートリソースのステータスが正常であることを確認します。
  2. モニタリソース
    Cluster WebUI 上で各モニタリソースのステータスが正常であることを確認します。
  3. グループ起動
    グループを起動します。
    Cluster WebUI 上でグループのステータスが起動済であることを確認します。
  4. EXEC リソース
    EXEC リソースを持つグループが起動しているサーバで、アプリケーションが動作していることを確認します。
  5. グループ停止
    グループを停止します。
    Cluster WebUI 上でグループのステータスが停止済であることを確認します。
  6. グループ起動
    グループを起動します。
    Cluster WebUI 上でグループのステータスが起動済であることを確認します。
  7. サーバ シャットダウン
    サーバをシャットダウンします。サーバが正常にシャットダウンされることを確認します。

4.2. コマンドによるサーバの動作確認

生成後、コマンドラインを使用して構成するサーバ上から状態を確認するには、以下の手順で動作を確認します。

参考

コマンドの操作方法については『操作ガイド』の「CLUSTERPRO X SingleServerSafe コマンドリファレンス」を参照してください。

clpstat コマンドを使用して、サーバのステータスが ONLINE であることを確認します。 サーバのハートビート リソースのステータスが NORMALで あることを確認します。

  1. ハートビート リソース
    clpstat コマンドを使用して、サーバのステータスが ONLINE であることを確認します。
    サーバのハートビート リソースのステータスが NORMAL であることを確認します。
  2. モニタ リソース
    clpstat コマンドを使用して、各モニタ リソースのステータスが NORMAL であることを確認します。
  3. グループ起動
    clpgrp コマンドを使用して、グループを起動します。
    clpstat コマンドを使用して、グループのステータスが ONLINE であることを確認します。
  4. EXEC リソース
    EXEC リソースを持つグループが起動しているサーバで、アプリケーションが動作していることを確認します。
  5. グループ停止
    clpgrp コマンドを使用して、グループを停止します。
    clpstat コマンドを使用して、グループのステータスが OFFLINE であることを確認します。
  6. グループ起動
    clpgrp コマンドを使用して、グループを起動します。
    clpstat コマンドを使用して、グループのステータスが ONLINE であることを確認します。
  7. シャットダウン
    clpstdn コマンドを使用してサーバをシャットダウンします。サーバが正常にシャットダウンされることを確認します。

5. グループリソースの詳細

本章では、グループリソースについての詳細を説明します。

CLUSTERPRO X SingleServerSafe は、クラスタリングソフトウェアである CLUSTERPRO X との操作性などにおける親和性を高めるために、共通の画面を使用しています。

本章で説明する項目は以下のとおりです。

5.1. グループリソース一覧

グループリソースとして定義可能なリソースは以下の通りです。

グループリソース名

機能

略称

EXECリソース

グループの起動時、終了時に実行されるアプリケーションやシェルスクリプトを登録します。

exec

5.2. EXEC リソースの設定

CLUSTERPRO では、CLUSTERPRO によって管理され、グループの起動時、終了時に実行されるアプリケーションやシェルスクリプトを登録できます。EXEC リソースには、ユーザ独自のプログラムやシェルスクリプトなども登録できます。シェルスクリプトは、sh のシェルスクリプトと同じ書式なので、それぞれのアプリケーションの事情にあわせた処理を記述できます。

5.2.1. EXEC リソースで使用するスクリプト

スクリプトの種類

EXEC リソースには、それぞれ開始スクリプトと終了スクリプトが用意されています。CLUSTERPRO は、サーバの状態遷移が必要な場面において、EXEC リソースごとのスクリプトを実行します。動作させたいアプリケーションの起動、終了、もしくは復旧の手順を、これらのスクリプトに記述する必要があります。

サーバ、その中の2つのグループ、およびスクリプト

図 5.1 EXECリソースで使用するスクリプト

Start

開始スクリプト

Stop

終了スクリプト

5.2.2. EXEC リソースのスクリプトで使用する環境変数

CLUSTERPRO は、スクリプトを実行する場合に、どの状態で実行したか(スクリプト実行要因)などの情報を環境変数にセットします。

スクリプト内で下図の環境変数を分岐条件として、システム運用にあった処理内容を記述できます。

終了スクリプトの環境変数は、直前に実行された開始スクリプトの内容を、値として返します。開始スクリプトでは CLP_FACTOR および CLP_PID の環境変数はセットされません。

CLP_LASTACTION の環境変数は、CLP_FACTOR の環境変数がCLUSTERSHUTDOWN または SERVERSHUTDOWN の場合にのみセットされます。

環境変数

環境変数の値

意味

CLP_EVENT
…スクリプト実行要因

START

グループの起動により、実行された場合。
モニタリソースの異常検出によるグループの再起動により、同じサーバで実行された場合。
モニタリソースの異常検出によるグループリソースの再起動により、同じサーバで実行された場合。

FAILOVER

使用しません。

CLP_FACTOR
…グループ停止要因

CLUSTERSHUTDOWN

サーバ停止により、グループの停止が実行された場合。

SERVERSHUTDOWN

サーバ停止により、グループの停止が実行された場合。

GROUPSTOP

グループ停止により、グループの停止が実行された場合。

GROUPMOVE

使用しません。

GROUPFAILOVER

使用しません。

GROUPRESTART

モニタリソースの異常検出により、グループの再起動が実行された場合。

RESOURCERESTART

モニタリソースの異常検出により、グループリソースの再起動が実行された場合。

CLP_LASTACTION
…停止後処理

REBOOT

OSをreboot (再起動) する場合。

HALT

OSをhalt (シャットダウン) する場合。

NONE

何もしない。

CLP_SERVER

HOME

使用しません。

OTHER

使用しません。

CLP_DISK

SUCCESS

使用しません。

FAILURE

使用しません。

CLP_PRIORITY

1~クラスタ内のサーバ数

使用しません。

CLP_GROUPNAME
…グループ名

グループ名

スクリプトが属している、グループ名を示す。

CLP_RESOURCENAME
…リソース名

リソース名

スクリプトが属している、リソース名を示す。

CLP_PID
…プロセスID

プロセスID

プロパティとして開始スクリプトが非同期に設定されている場合、開始スクリプトのプロセスIDを示す。開始スクリプトが同期に設定されている場合、本環境変数は値を持たない。

CLP_VERSION_FULL
…CLUSTERPROフルバージョン

CLUSTERPROフルバージョン

CLUSTERPROのフルバージョンを示す。
(例) 5.0.0-1
CLP_VERSION_MAJOR
…CLUSTERPROメジャーバージョン

CLUSTERPROメジャーバージョン

CLUSTERPROのメジャーバージョンを示す。
(例)5
CLP_PATH
…CLUSTERPROインストールパス

CLUSTERPROインストールパス

CLUSTERPROがインストールされているパスを示す。
(例)/opt/nec/clusterpro
CLP_OSNAME
…サーバOS名

サーバOS名

スクリプトが実行されたサーバのOS名を示す。
(例)
(1) OS名が取得できた場合:
Red Hat Enterprise Linux Server release 6.8 (Santiago)
(2) OS名が取得できなかった場合:
Linux
CLP_OSVER
…サーバOSバージョン

サーバOSバージョン

スクリプトが実行されたサーバのOSバージョンを示す。
(例)
(1) OSバージョンが取得できた場合:6.8
(2) OSバージョンが取得できなかった場合:※値なし

5.2.2.1. EXEC リソース スクリプトの実行タイミング

開始、終了スクリプトの実行タイミングと環境変数の関連を、状態遷移図にあわせて説明します。

  • 図中のサーバは以下の状態を表しています。

    サーバ

    サーバ状態

    Server (Normal)

    正常状態

    Server (Stopped)

    停止状態

    • (例) 正常状態にある Server 1 において Group A が動作している。

      Server

  • 定義されているグループはA、Bの2つ。

【状態遷移図】

状態遷移について説明します。

サーバとその中の2つのグループ

図 5.2 状態遷移図

図中の(1)~(2)は、以下の説明に対応しています。

(1) 通常立ち上げ

ここでいう通常立ち上げとは、開始スクリプトがサーバで正常に実行された時を指します。

サーバとその中の2つのグループ、その中のスクリプト

図 5.3 状態とスクリプト実行(通常立ち上げ)

Startに対する環境変数

Group A

Group B

CLP_EVENT

START

START

(2) 通常シャットダウン

ここでいう通常シャットダウンとは、終了スクリプトに対応する開始スクリプトが、通常立ち上げにより実行されたシャットダウンを指します。

サーバとその中の2つのグループ、その中のスクリプト

図 5.4 状態とスクリプト実行(通常シャットダウン)

Stopに対する環境変数

Group A

Group B

CLP_EVENT

START

START

5.2.3. EXEC リソーススクリプトの記述の流れ

前のトピックの、スクリプトの実行タイミングと実際のスクリプト記述を関連付けて説明します。文中の(数字)は「 5.2.2.1. EXEC リソース スクリプトの実行タイミング 」の各動作をさします。

グループA開始スクリプト: start.shの一例

#!/bin/sh
# ***************************************
# *              start.sh               *
# ***************************************

# スクリプト実行要因の環境変数を参照して処理の振り分けを行う。
if ["$CLP_EVENT"="START"]
then
    # ここに、業務の通常起動処理を記述する。
    # この処理は以下のタイミングで実行される。
    #
    # (1) 通常立ち上げ
    #

else
    # CLUSTERPROは動作していない。

fi

# 終了コードが0の場合、EXECリソースの活性処理は成功と判定される。
# スクリプト内でエラーが発生した場合には 0以外の終了コードを返却するように記述する。
exit 0

グループA終了スクリプト: stop.shの一例

#!/bin/sh
# ***************************************
# *              stop.sh               *
# ***************************************

# スクリプト実行要因の環境変数を参照して処理の振り分けを行う。
if ["$CLP_EVENT"="START"]
then
    # ここに、業務の通常終了処理を記述する。以下のタイミングで実行される。
    #
    # (2) 通常シャットダウン
    #

else
    # CLUSTERPROは動作していない。
fi

exit 0

5.2.4. EXEC リソーススクリプト作成のヒント

以下の点に注意して、スクリプトを作成してください。

  • スクリプト中にて、実行に時間を必要とするコマンドを実行する場合には、コマンドの実行が完了したことを示すトレースを残すようにしてください。この情報は、問題発生時、障害の切り分けを行う場合に使用することができます。トレースを残す方法は下記の 2 つがあります。

  • スクリプト中に echo コマンドを記述して EXEC リソースのログ出力先を設定する方法
    トレースを echo コマンドにて標準出力することができます。その上で、スクリプトが属しているリソースのプロパティでログ出力先を設定します。

デフォルトではログ出力されません。ログ出力先の設定については「 5.2.6. 詳細タブ 」の「EXEC リソース調整プロパティ」にある「メンテナンスタブ」を参照してください。[ローテートする] チェックボックスがオフの場合は、ログ出力先に設定されたファイルには、サイズが無制限に出力されますのでファイルシステムの空き容量に注意してください。

(例:スクリプト中のイメージ)

echo "appstart.."
appstart
echo "OK"

(例:スクリプト中のイメージ)

clplogcmd -m "appstart.."
appstart
clplogcmd -m "OK"

5.2.5. EXEC リソース 注意事項

  • スクリプトのログローテート機能について
    スクリプトのログローテート機能を有効にした場合、ログ出力を仲介するプロセス(仲介プロセス)が生成されます。仲介プロセスは、「開始・停止スクリプト」および「開始・停止スクリプトから標準出力・標準エラー出力のいずれかまたは両方を継承した子孫プロセス」からのログ出力が全て停止 (ファイルディスクリプタがクローズ) するまで動作を継続します。子孫プロセスの出力をログから除外する場合は、スクリプトからのプロセス生成時に標準出力および標準エラー出力をリダイレクトしてください。
  • 開始スクリプト/終了スクリプトはroot ユーザで実行されます。

  • 環境変数に依存するアプリケーションを起動する際には必要に応じてスクリプト側で環境変数の設定を行っていただく必要があります。

5.2.6. 詳細タブ

ユーザアプリケーション

スクリプトとしてサーバ上の実行可能ファイル(実行可能なシェルスクリプトやバイナリファイル)を使用します。各実行可能ファイル名は、サーバ上のローカルディスクのパスで設定します。

Cluster WebUI の構成情報には含まれません。スクリプトファイルは Cluster WebUI では編集できません。

この製品で作成したスクリプト

スクリプトとして Cluster WebUI で準備したスクリプトファイルを使用します。必要に応じて Cluster WebUI でスクリプトファイルを編集できます。スクリプトファイルは、構成情報に含まれます。

表示

[この製品で作成したスクリプト] を選択した場合に、スクリプトファイルを表示します。

編集

[この製品で作成したスクリプト] を選択した場合に、スクリプトファイルを編集します。変更を反映するには [保存] をクリックしてください。スクリプトファイル名の変更はできません。

ユーザアプリケーション] を選択している場合は [アプリケーション・パスの入力] ダイアログボックスが表示されます。

アプリケーション・パスの入力

EXEC リソースの実行可能ファイル名を設定します。

開始 (1023バイト以内)

EXECリソースの開始時の実行可能ファイル名を設定します。「/」 で始まる必要があります。引数を指定することも可能です。

終了 (1023バイト以内)

EXECリソースの終了時の実行可能ファイル名を設定します。「/」 で始まる必要があります。終了スクリプトは省略可能です。

実行可能ファイル名はサーバ上のファイルを「/」 から始まる完全なパス名で設定する必要があります。引数を指定することも可能です。

置換

[この製品で作成したスクリプト] を選択した場合に、[ファイル選択] ダイアログボックスが表示されます。

[リソースのプロパティ] で選択したスクリプトファイルの内容が、ファイル選択ダイアログ ボックスで選択したスクリプトファイルの内容に置換されます。スクリプトが表示中または編集中の場合は置換できません。ここではスクリプトファイルを選択してください。バイナリファイル(アプリケーションなど)は選択しないでください。

調整

EXECリソース調整プロパティダイアログを表示します。EXECリソースの詳細設定を行います。EXECリソースをPIDモニタリソースで監視するには、開始スクリプトの設定を非同期にする必要があります。

EXEC リソース調整プロパティ

パラメータタブ

[開始スクリプト]、[終了スクリプト]全スクリプト共通

同期

スクリプトの実行時にスクリプトの終了を待ちます。常駐しない(実行後に処理がすぐ戻る)実行可能ファイルの場合に選択します。

非同期

スクリプトの実行時にスクリプトの終了を待ちません。常駐する実行可能ファイルの場合に選択します。
EXECリソースの開始スクリプトを非同期で実行する場合は、PIDモニタリソースで監視できます。

タイムアウト(1~9999)

スクリプトの実行時に終了を待つ場合([同期])のタイムアウトを設定します。[同期]を選択している場合のみ入力可能です。設定時間内にスクリプトが終了しないと、異常と判断します。

メンテナンスタブ

ログ出力先 (1023バイト以内)

EXEC リソースのスクリプトや実行可能ファイルの標準出力と標準エラー出力のリダイレクト先を指定します。何も指定しない場合、/dev/null に出力されます。[/] で始まる必要があります。

[ローテートする]チェックボックスがオフの場合は無制限に出力されますのでファイルシステムの空き容量に注意してください。

[ローテートする]チェックボックスがオンの場合は、出力されるログファイルは、ローテートします。また、以下の注意事項があります。

  • [ログの出力先] には 1009 バイト以内でログのパスを記述してください。1010 バイトを超えた場合、ログの出力が行えません。

  • ログファイルの名前の長さは 31 バイト以内で記述してください。32 バイト以上の場合、ログの出力が行えません。

  • EXEC リソースごとに異なるログファイル名を設定してください。
    複数の EXEC リソースでログローテートを行う場合、パス名が異なってもログファイルの名前が同じ場合(ex. /home/foo01/log/exec.log, /home/foo02/log/exec.log)、複数の EXEC リソースのログが、いずれか 1 つのログファイルに出力されます。また、ローテートサイズが正しく反映されないことがあります。

ローテートする

EXEC リソースのスクリプトや実行可能ファイルの実行ログを、オフの場合は無制限のファイルサイズで、オンの場合はローテートして出力します。

ローテートサイズ (1~999999999)

[ローテートする]チェックボックスがオンの場合に、ローテートするサイズを指定します。

ローテート出力されるログファイルの構成は、以下のとおりです。

ファイル名

内容

[ログ出力先]指定のファイル名

最新のログです。

[ログ出力先]指定のファイル名.pre

ローテートされた以前のログです。

6. モニタリソースの詳細

本章では、CLUSTERPRO X SingleServerSafe で監視を実行する単位であるモニタリソースについての詳細を説明します。

CLUSTERPRO X SingleServerSafe は、クラスタリングソフトウェアである CLUSTERPRO X との操作性などにおける親和性を高めるために、共通の画面を使用しています。

本章で説明する項目は以下のとおりです。

6.1. モニタリソース一覧

モニタリソースとして定義可能なリソースは以下の通りです。

モニタリソース名

機能

監視タイミング
(太字は既定値)

対象リソース

ディスクモニタリソース

ディスクデバイスの監視を行います。

常時/活性時

全て

IPモニタリソース

ping コマンドを使用して応答の有無により、IPアドレスおよび通信路の監視を行います。

常時/活性時

全て

NIC Link Up/Downモニタリソース

NICのLink状態を取得し、LinkのUp/Downの監視を行います。

常時/活性時

全て

PIDモニタリソース

活性に成功したEXECリソースを監視します。

活性時(固定)

exec

ユーザ空間モニタリソース

ユーザ空間のストールを異常として判断します。

常時(固定)

-

マルチターゲットモニタリソース

複数のモニタリソースの状態の組み合わせで監視を行います。

活性時(固定)

全て

ソフトRAIDモニタリソース

ソフトRAIDを行っているデバイスを監視します。

常時(固定)

なし

カスタムモニタリソース

任意のスクリプトを実行することで監視を行います。

常時/活性時

全て

ボリュームマネージャモニタリソース

複数のストレージやディスクの監視機構を提供します。

常時/活性時

全て

外部連携モニタリソース

"異常発生通知受信時に実行する異常時動作の設定"と"異常発生通知の Cluster WebUI 表示" を実現します。

常時 (固定)

なし

プロセス名モニタリソース

任意のプロセス名のプロセスを監視します。

常時/活性時

全て

DB2モニタリソース

IBM DB2データベースへの監視機構を提供します。

活性時(固定)

全て

FTPモニタリソース

FTPサーバへの監視機構を提供します。

常時/活性時

全て

HTTPモニタリソース

HTTPサーバへの監視機構を提供します。

常時/活性時

全て

IMAP4モニタリソース

IMAPサーバへの監視機構を提供します。

常時/活性時

全て

MySQLモニタリソース

MySQLデータベースへの監視機構を提供します。

活性時 (固定)

全て

NFSモニタリソース

NFSのファイルサーバへの監視機構を提供します。

常時/活性時

全て

ODBCモニタリソース

ODBCデータベースへの監視機構を提供します。

活性時(固定)

全て

Oracleモニタリソース

Oracleデータベースへの監視機構を提供します。

活性時(固定)

全て

POP3モニタリソース

POPサーバへの監視機構を提供します。

常時/活性時

全て

PostgreSQLモニタリソース

PostgreSQLデータベースへの監視機構を提供します。

活性時(固定)

全て

Sambaモニタリソース

sambaファイルサーバへの監視機構を提供します。

常時/活性時

全て

SMTPモニタリソース

SMTPサーバへの監視機構を提供します。

常時/活性時

全て

SQL Serverモニタリソース

SQL Serverデータベースへの監視機構を提供します。

活性時(固定)

全て

Tuxedoモニタリソース

Tuxedoアプリケーションサーバへの監視機構を提供します。

常時/活性時

全て

WebLogicモニタリソース

WebLogicアプリケーションサーバへの監視機構を提供します。

常時/活性時

全て

WebSphereモニタリソース

WebSphereアプリケーションサーバへの監視機構を提供します。

常時/活性時

全て

WebOTXモニタリソース

WebOTXアプリケーションサーバへの監視機構を提供します。

常時/活性時

全て

JVMモニタリソース

Java VMの監視を行います。

常時/活性時

exec

システムモニタリソース

システムリソースの監視を行います。

常時 (固定)

全て

プロセスリソースモニタリソース

プロセスリソースの監視を行います。

常時 (固定)

全て

6.1.1. モニタリソースの監視開始後のステータス

モニタリソースの監視開始後、監視開始準備のために一時的にステータスが警告となることがあります。
モニタステータスが警告となる可能性があるのは、下記のモニタリソースです。
  • 外部連携モニタリソース

  • カスタムモニタリソース (監視タイプが [非同期] の場合のみ)

  • DB2モニタリソース

  • システムモニタリソース

  • プロセスリソースモニタリソース

  • JVMモニタリソース

  • MySQLモニタリソース

  • ODBCモニタリソース

  • Oracleモニタリソース

  • PostgreSQLモニタリソース

  • プロセス名モニタリソース

  • SQL Serverモニタリソース

6.1.2. モニタリソースの監視タイミング

モニタリソースによる監視は、常時監視と活性時監視の 2 つのタイプがあります。 モニタリソースによって設定可能な監視タイミングが異なります。

  1. 常時
    モニタリソースは常に監視を行います。
  2. 活性時
    特定のグループリソースが活性状態の間、監視を実行します。グループリソースが非活性状態の間は監視を実行しません。
クラスタ起動からクラスタ停止までのうち、常時監視の区間と活性時監視の区間

図 6.1 モニタリソースの常時監視と活性時監視

6.1.3. モニタリソースの一時停止/再開

モニタリソースは一時的に監視を停止したり再開したりすることが可能です。 監視の一時停止/再開の方法は以下の 2 つの方法があります。

  • Cluster WebUI による操作

  • clpmonctrl コマンドによる操作
    clpmonctrl コマンドでは、コマンドの実行サーバ上のモニタリソースの制御のみ可能です

モニタリソースには、一時停止/再開の制御が可能なものと不可能なものがあります。 モニタリソースによる制御の可否は下記を参照してください。

モニタリソース

制御可否

ディスクモニタリソース

可能

IPモニタリソース

可能

ユーザ空間モニタリソース

可能

NIC Link Up/Downモニタリソース

可能

PIDモニタリソース

可能

マルチターゲットモニタリソース

可能

カスタムモニタリソース

可能

ボリュームマネージャモニタリソース

可能

ソフトRAIDモニタリソース

可能

プロセス名モニタリソース

可能

DB2モニタリソース

可能

FTPモニタリソース

可能

HTTPモニタリソース

可能

IMAP4モニタリソース

可能

MySQLモニタリソース

可能

NFSモニタリソース

可能

ODBCモニタリソース

可能

Oracleモニタリソース

可能

POP3モニタリソース

可能

PostgreSQLモニタリソース

可能

Sambaモニタリソース

可能

SMTPモニタリソース

可能

SQL Serverモニタリソース

可能

Tuxedoモニタリソース

可能

WebLogicモニタリソース

可能

WebSphereモニタリソース

可能

WebOTXモニタリソース

可能

外部連携モニタリソース

可能

JVMモニタリソース

可能

システムモニタリソース

可能

プロセスリソースモニタリソース

可能

Cluster WebUI では、制御が不可能なモニタリソースの右クリックメニューが無効になります。 clpmonctrl コマンドでは、制御可能なモニタリソースのみの制御が行われます。制御が不可能なモニタリソースは警告メッセージが表示され制御は行われません。

モニタリソースが一時停止状態で下記の操作を行った場合、モニタリソースの一時停止が解除されます。

  • Cluster WebUI で、モニタリソースの「再開」を行った場合

  • clpmonctrl コマンドに -r オプション を指定した場合

  • クラスタを停止した場合

  • クラスタをサスペンドした場合

6.1.4. モニタリソースの擬似障害 発生/解除

モニタリソースは擬似的に障害を発生させることが可能です。また、それを解除することもできます。擬似障害の発生/解除を行う方法は以下の 2 つの方法があります。

  • Cluster WebUI (検証モード) による操作
    Cluster WebUI (検証モード) では、制御が不可能なモニタリソースの右クリックメニューが無効になります。
  • [clpmonctrl] コマンドによる操作
    [clpmonctrl] コマンドでは、コマンドを実行するサーバ上のモニタリソースに対して制御を行います。制御が不可能なモニタリソースに対して実行した場合、コマンドの実行自体は成功しますが、擬似障害を発生させることはできません。

モニタリソースには、擬似障害の発生/解除が可能なものと不可能なものがあります。 『操作ガイド』 の 「CLUSTERPRO X SingleServerSafe コマンドリファレンス」の「モニタリソースを制御する (clpmonctrl コマンド)」を参照してください。

擬似障害発生状態で下記の操作を行った場合、モニタリソースの擬似障害が解除されます。

  • Cluster WebUI (検証モード) で、モニタリソースの「擬似障害解除」を実行した場合

  • Cluster WebUIのモードを、検証モード から 他のモードに変更する際に出力されるダイアログで「はい」を選択した場合

  • clpmonctrl コマンドに -nオプション を指定した場合

  • クラスタを停止した場合

  • クラスタをサスペンドした場合

6.1.5. モニタリソースの監視プライオリティ

OS高負荷時にモニタリソースへの監視を優先的に行うため、nice値を設定することができます。

nice値は 19(優先度低) ~ -20(優先度高) の範囲で指定することが可能です。

  • nice値の優先度を上げることで監視タイムアウトの検出を抑制することが可能です。

6.2. モニタリソースのプロパティ

6.2.1. 情報タブ

名前

モニタリソース名を表示します。

コメント (127 バイト以内)

モニタリソースのコメントを設定します。半角英数字のみ入力可能です。

6.2.2. 監視 (共通) タブ

インターバル(1~999)

監視対象の状態を確認する間隔を設定します。

タイムアウト(5~999 1)

ここで指定した時間内に監視対象の正常状態が検出できない場合に異常と判断します。

1

ユーザ空間モニタリソースで監視方法にipmiを設定している場合は、255 以下の値を設定する必要があります。

タイムアウト発生時に監視プロセスのダンプを採取する

本機能を有効にした場合、モニタリソースがタイムアウトすると、タイムアウトしたモニタリソースのダンプが採取されます。ダンプ情報は最大 5 回採取されます。

タイムアウト発生時にリトライしない

本機能を有効にした場合、モニタリソースがタイムアウトすると即座に回復動作を実行します。

タイムアウト発生時動作

監視リソースタイムアウト発生時の動作を選択します。
また、タイムアウトが発生した場合にはリトライ回数の回数カウンタはリセットされます。
本機能は、[タイムアウト発生時にリトライしない] 機能を有効にしている場合のみ設定可能です。
  • [回復動作を実行する]
    監視リソースがタイムアウトした場合に回復動作を実行します。
  • [回復動作を実行しない]
    監視リソースがタイムアウトした場合に回復動作を実行しません。
  • [keepalive パニックを実行する]
    keepalive パニックを実行します。
  • [sysrq パニックを実行する]
    sysrq パニックを実行します。

注釈

下記のモニタリソースでは、[タイムアウト発生時にリトライしない], [タイムアウト発生時動作] 機能は設定できません。

  • ユーザ空間モニタリソース

  • カスタムモニタリソース (監視タイプが [非同期] の場合のみ)

  • マルチターゲットモニタリソース

  • 外部連携モニタリソース

  • JVM モニタリソース

  • システムモニタリソース

  • プロセスリソースモニタリソース

リトライ回数(0~999)

異常状態を検出後、連続してここで指定した回数の異常を検出したときに異常と判断します。
0を指定すると最初の異常検出で異常と判断します。

監視開始待ち時間(0~9999)

監視を開始するまでの待ち時間を設定します。

監視タイミング

監視のタイミングを設定します。

  • [常時]
    監視を常時行います。
  • [活性時]
    指定したリソースが活性するまで監視を行いません。

対象リソース

活性時監視を行う場合に対象となるリソースを表示します。

参照

対象リソースの選択ダイアログボックスを表示します。LocalServer とクラスタに登録されているグループ名、リソース名がツリー表示されます。対象リソースとして設定するリソースを選択して [OK] をクリックします。

nice 値

プロセスの nice 値を設定します。

監視処理時間メトリクスを送信する

モニタリソースの監視処理時間メトリクスの送信機能を設定します。

  • チェックボックスがオン
    監視処理メトリクスを送信します。
  • チェックボックスがオフ
    監視処理メトリクスを送信しません。

注釈

Amazon CloudWatch連携機能を使用する場合は、本機能を有効にすることで任意のモニタリソースの監視処理時間メトリクスが送信出来ます。
下記のモニタリソースでは、[監視処理時間メトリクスを送信する] 機能は設定できません。
  • ユーザ空間モニタリソース

  • カスタムモニタリソース (監視タイプが [非同期] の場合のみ)

  • 外部連携モニタリソース

  • JVM モニタリソース

  • システムモニタリソース

  • プロセスリソースモニタリソース

6.2.3. 監視(固有) タブ

モニタリソースによっては監視動作時のパラメータを設定する必要があります。パラメータは各リソースの説明に記述しています。

6.2.4. 回復動作タブ

回復対象と異常検出時の動作を設定します。異常検出時にグループの再起動やリソースの再起動、サーバの再起動ができます。ただし、回復対象が非活性状態であれば回復動作は行われません。

回復動作

異常検出時の回復動作を選択します。

  • [回復対象を再起動]
    回復対象として選択されたグループまたはグループリソースを再活性します。再活性が失敗するか、再活性後に同じ異常が検出された場合は、最終動作として選択された動作を実行します。
  • [最終動作のみ実行]
    最終動作として選択された動作を実行します。
  • [カスタム設定]
    回復対象として選択されたグループまたはグループリソースを最大再活性回数まで再活性します。再活性が失敗するか、再活性後に同じ異常が検出される状態が継続し、最大再活性回数に達した場合は、最終動作として選択された動作を実行します。

回復対象

リソースの異常とみなした時に回復を行う対象のオブジェクトが表示されます。

参照

回復対象の選択ダイアログ ボックスを表示します。LocalServer、All Groups とサーバに登録されているグループ名、リソース名がツリー表示されます。回復対象として設定するものを選択して [OK] をクリックします。

回復スクリプト実行回数 (0~99)

異常検出時に [スクリプト設定] で設定されたスクリプトを実行する回数を設定します。0 を設定するとスクリプトを実行しません。

再活性前にスクリプトを実行する

  • チェックボックスがオン
    再活性化を実施する前にスクリプト/コマンドを実行します。スクリプト/コマンドの設定を 行うためには [スクリプト設定] をクリックしてください。
  • チェックボックスがオフ
    スクリプト/コマンドを実行しません。

最大再活性回数 (0~99)

異常検出時に再活性化を行う回数を設定します。0 を設定すると再活性化を行いません。回復対象にグループまたはグループリソースを選択した場合に設定可能です。

フェイルオーバ実行前にスクリプトを実行する

使用しません。

最大フェイルオーバ回数

使用しません。

最終動作前にスクリプトを実行する

最終動作を実行する前にスクリプトを実行するかどうかを指定します。

  • チェックボックスがオン
    最終動作を実施する前にスクリプト/コマンドを実行します。スクリプト/コマンドの設定を行うためには [スクリプト設定] ボタンをクリックしてください。
  • チェックボックスがオフ
    スクリプト/コマンドを実行しません。

[スクリプト設定] をクリックすると、[スクリプトの編集] ダイアログボックスが表示されます。実行するスクリプトまたは実行ファイルを設定して [OK] をクリックします。

スクリプト設定

[スクリプトの編集] ダイアログボックスを表示します。回復スクリプト、回復動作前に実行するスクリプト/コマンドを設定します。

ユーザアプリケーション

スクリプトとしてサーバ上の実行可能ファイル (実行可能なシェルスクリプトファイルや実行ファイル) を使用します。ファイル名にはサーバ上のローカルディスクの絶対パスまたは実行可能ファイル名を設定します。また、絶対パスやファイル名に空欄が含まれる場合は、下記のように、ダブルクォーテーション (") でそれらを囲ってください。

例:

"/tmp/user application/script.sh"

各実行可能ファイルは、Cluster WebUI の構成情報には含まれません。Cluster WebUI で編集やアップロードはできませんので、サーバ上に準備する必要があります。

この製品で作成したスクリプト

スクリプトとして Cluster WebUI で準備したスクリプトファイルを使用します。必要に応じてCluster WebUI でスクリプトファイルを編集できます。スクリプトファイルは、構成情報に含まれます。

ファイル (1023バイト以内)

[ユーザアプリケーション] を選択した場合に、実行するスクリプト(実行可能なシェルスクリプトファイルや実行ファイル)を設定します。

表示

[この製品で作成したスクリプト]を選択した場合に、スクリプトファイルを表示します。

編集

[この製品で作成したスクリプト]を選択した場合に、スクリプトファイルを編集します。変更を反映するには [保存] をクリックしてください。スクリプトファイル名の変更はできません。

置換

[この製品で作成したスクリプト]を選択した場合に、スクリプトファイルの内容を、ファイル選択ダイアログ ボックスで選択したスクリプトファイルの内容に置換します。スクリプトが既に表示中または編集中の場合は置換できません。ここではスクリプトファイルを選択してください。バイナリファイル(アプリケーションなど)は選択しないでください。

タイムアウト (1~9999)

スクリプトの実行完了を待ち合わせる最大時間を指定します。既定値は5秒です。

最終動作

再活性化による回復が失敗した後の回復動作を選択します。
最終動作は以下の動作が選択できます。
  • 何もしない
    何も行いません。

注釈

[何もしない] の設定は

  • 一時的に最終動作を抑止したい場合

  • 異常を検出したときにアラートの表示のみを行いたい場合

  • 実際の最終動作はマルチターゲットモニタリソースで行いたい場合

に使用してください。

  • リソース停止
    回復対象としてグループリソースが選択されている場合、選択したグループリソースとそのグループリソースに依存するグループリソースを停止します。回復対象に "LocalServer" 、"All Groups"、グループが選択されている場合は選択できません。
  • グループ停止
    回復対象としてグループが選択されている場合そのグループを、また回復対象としてグループリソースが選択されている場合そのグループリソースが所属するグループを停止します。"All Groups"が選択されている場合は、モニタリソースが異常を検出したサーバで起動している全てのグループを停止します。
  • クラスタサービス停止
    CLUSTERPRO X SingleServerSafeを停止します。
  • クラスタサービス停止とOSシャットダウン
    CLUSTERPRO X SingleServerSafeを停止し、OSをシャットダウンします。
  • クラスタサービス停止とOS再起動
    CLUSTERPRO X SingleServerSafeを停止し、OSを再起動します。
  • sysrq パニック
    sysrqのパニックを行います。

    注釈

    sysrqパニックに失敗した場合、OSのシャットダウンを行います。

  • keepalive リセット
    clpkhbドライバ、clpkaドライバを使用し、OSをリセットします。

    注釈

    keepalive リセットに失敗した場合、OSのシャットダウンを行います。
    clpkhbドライバ、clpkaドライバが対応していないOS、kernelでは設定しないでください。
  • keepalive パニック
    clpkhbドライバ、clpkaドライバを使用し、OSをパニックします。

    注釈

    keepalive パニックに失敗した場合、OSのシャットダウンを行います。
    clpkhbドライバ、clpkaドライバが対応していないOS、kernelでは設定しないでください。
  • BMC リセット
    ipmi のコマンドを使用し、サーバをハードウェアリセットします。

    注釈

    BMC リセットに失敗した場合、OSのシャットダウンを行います。
    OpenIPMIをインストールしていない、またはipmitool コマンドが動作しないサーバでは設定しないでください。
  • BMC パワーオフ
    ipmiのコマンドを使用し、OS の電源をオフにします。OS の ACPI の設定により OS のシャットダウンが実行される場合があります。

    注釈

    BMC パワーオフに失敗した場合、OS のシャットダウンを行います。
    OpenIPMI をインストールしていない、または ipmitool コマンドが動作しないサーバでは設定しないでください。
  • BMC パワーサイクル
    ipmi のコマンドを使用し、サーバのパワーサイクル(電源オフ/オン)を実行します。OSのACPI の設定により OS のシャットダウンが実行される場合があります。

    注釈

    BMC パワーサイクルに失敗した場合、OSのシャットダウンを行います。
    OpenIPMI をインストールしていない、または ipmitool コマンドが動作しないサーバでは設定しないでください。
  • BMC NMI
    ipmi のコマンドを使用し、サーバへ NMI を発生させます。NMI 発生後の挙動は OS の設定に依存します。

    注釈

    BMC NMI に失敗した場合、OS のシャットダウンを行います。
    OpenIPMI をインストールしていない、または ipmitool コマンドが動作しないサーバでは設定しないでください。

6.3. ディスクモニタリソースの設定

ディスクモニタリソースは、ディスクデバイスの監視を行います。 ディスクモニタリソース (TUR方式) が使用できないディスクでは、READ(O_DIRECT) 方式での監視を推奨します。

6.3.1. 監視(固有) タブ

監視方法

ディスクデバイスを監視するときの監視方法を下記より選択します。

  • TUR

  • TUR(generic)

  • TUR(legacy)

  • READ

  • READ (O_DIRECT)

  • WRITE (FILE)

  • READ (RAW)

監視先 (1023 バイト以内)

  • 監視方法が WRITE (FILE) の場合
    監視用のファイルのパス名を指定します。[/] で始まる必要があります。
    ファイル名は絶対パスで指定してください。既存のファイルのファイル名を指定した場合には上書きされファイルの内容は失われます。
  • 監視方法が READ(O_DIRECT) の場合
    監視用のデバイスファイルもしくはファイルのパス名を指定します。[/] で始まる必要があります。
    デバイスファイル名もしくはファイル名は絶対パスで指定してください。
    ファイル名を指定する場合は、指定するファイルを事前に作成しておく必要があります。
  • 監視方法が READ(RAW) の場合
    監視先は空欄でもかまいません。ただし、監視対象 RAW デバイス名の入力は必須となります。バインドをして監視を行う場合のみ指定します。既に mount しているパーティションデバイスまたは mount する可能性のあるパーティションデバイスをデバイス名に設定して監視することはできません。
    また、既に mount しているパーティションデバイスまたはmountする可能性のあるパーティションデバイスの whole device (ディスク全体を示すデバイス)をデバイス名に設定して監視することもできません。監視専用のパーティションを用意してください。(監視用のパーティションサイズは、10MB 以上を割り当ててください) [/] で始まる必要があります。
  • 監視方法が READ の場合
    ディスクデバイスを監視するときの監視先デバイス名もしくはファイル名を指定します。[/] で始まる必要があります。ファイル名を指定する場合は、指定するファイルを事前に作成しておく必要があります。
  • 監視方法が上記以外の場合
    ディスクデバイスを監視するときの監視先デバイス名を指定します。[/] で始まる必要があります。

監視対象 RAW デバイス名 (1023 バイト以内)

監視方法にREAD(RAW)を選択した場合のみ入力可能となります。

  • 監視方法が READ(RAW) の場合
    raw アクセスするためのデバイス名を入力します。既にサーバプロパティの[ディスク I/F一覧]に登録されている RAW デバイスは登録できません。

I/Oサイズ(1~99999999)

監視処理で行う read または read/write のサイズを指定します。

  • READ(RAW), READ(O_DIRECT) を指定した場合、I/O サイズの入力項目はグレーアウトされます
    対象のデバイスから 1 セクタ分の read を行います。
  • TUR, TUR (generic), TUR (legacy) を指定した場合、本設定項目は無視されます。

ディスクフル検出時動作

ディスクフル(監視するディスクに空き容量がない状態)検出時の動作を下記より選択します。

  • 回復動作を実行する
    ディスクモニタリソースはディスクフル検出時に異常として扱います。
  • 回復動作を実行しない
    ディスクモニタリソースはディスクフル検出時に警告として扱います。
    • READ, READ (RAW), READ (O_DIRECT), TUR, TUR (generic),

    • TUR (legacy) を指定した場合、ディスクフル検出時動作の項目はグレーアウトされます

監視デバイス名にローカルディスクを設定すると、サーバのローカルディスク監視を行うことができます。

  • ローカルディスク[/dev/sdb] を[READ 方式] で監視し、異常検出時に[OS再起動] を行う設定例

    設定項目

    設定値

    備考

    監視デバイス名

    /dev/sdb

    2台目のSCSIディスク

    監視方法

    READ

    READ 方式

    回復対象

    サーバ

    -

    最終動作

    サービス停止とOS再起動

    OS再起動

  • ローカルディスク [/dev/sdb] を [TUR(generic) 方式] で監視し、異常検出時に [何もしない] (Cluster WebUI へアラートの表示のみを行う)場合の設定例

    設定項目

    設定値

    備考

    監視デバイス名

    /dev/sdb

    2台目のSCSIディスク

    監視方法

    TUR(generic)

    SG_IO方式

    最終動作

    何もしない

6.3.2. ディスクモニタリソースによる監視方法

ディスクモニタリソースの監視方法は大きく分けて TUR と READ があります。

  • TURの注意事項

    • SCSI のTest Unit Ready コマンドや SG_IO コマンドをサポートしていないディスク、ディスクインタフェース(HBA) では使用できません。
      ハードウェアがサポートしている場合でも、ドライバがサポートしていない場合があるので、ドライバの仕様も合わせて確認してください。
    • LVM 論理ボリューム (LV) のデバイスでは ioctl が正常に実行できない可能性があるため、LV の監視には READ を使用してください。

    • IDE インターフェイスのディスクの場合には、すべてのTUR方式は使用できません。

    • S-ATA インターフェイスのディスクの場合には、ディスクコントローラのタイプや使用するディストリビューションにより、OS に IDE インターフェイスのディスク (hd) として認識される場合と SCSI インターフェイスのディスク(sd)として認識される場合があります。IDE インターフェイスとして認識される場合には、すべての TUR 方式は使用できません。SCSI インターフェイスとして認識される場合には、TUR(legacy) が使用できます。TUR(generic)は使用できません。

    • Read 方式に比べて OS やディスクへの負荷は小さくなります。

    • Test Unit Ready では、実際のメディアへのI/Oエラーは検出できない場合があります。

    • ディスク上のパーティションを監視対象に設定して使用することはできません。whole device (ディスク全体を示すデバイス) を指定する必要があります。

    • ディスク装置によっては TUR 発行時、装置の状態によって一時的に Unit Attention を返す場合があります。
      Unit Attention が一時的に返却されることは問題ではありませんが、TUR のリトライ回数を 0 回に設定している場合、上記をエラーと判断し、ディスクモニタリソースが異常となります。
      無用な異常検出を防ぐため、リトライ回数は 1 回以上を設定してください。

TUR の監視方法は、下記の 3 つが選択可能です。

  • TUR

    • 指定されたデバイスへ以下の手順で ioctl を発行して、その結果で判断します。ioctl(SG_GET_VERSION_NUM) コマンドを実行します。この ioctl の戻り値とSG ドライバの version を見て判断します。

    • ioctl コマンド成功かつ SG ドライバの version が 3. 0 以上なら SG ドライバを使用したioctl TUR(SG_IO)を実行します。

    • ioctl コマンド失敗または SG ドライバの version が 3.0 未満なら SCSI コマンドとして定義されている ioctl TUR を実行します。

  • TUR(legacy)

    • ioctl(Test Unit Ready) を使って監視を行います。指定されたデバイスへ SCSI コマンドとして定義されている Test Unit Ready(TUR) コマンドを発行してその結果で判断します。

  • TUR(generic)

    • ioctl TUR(SG_IO) を使って監視を行います。指定されたデバイスへ SCSI コマンドとして定義されている ioctl(SG_IO) コマンドを発行してその結果で判断します。SG_IO は SCSI ディスクであっても OS やディストリビューションによって動作しないことがあります。

READの監視方法は、下記のとおりです。

  • READ

    • 指定されたデバイス(ディスクデバイスまたはパーティションデバイス) もしくはファイル上の指定されたサイズを read してその結果 (readできたサイズ) で判断します。

    • 指定されたサイズが read できたことを判断します。read したデータの正当性は判断しません。

    • read するサイズを大きくすると OS やディスクへの負荷が大きくなります。

    • read するサイズについては「 6.3.3. ディスクモニタリソースで READ を選択した場合の I/O サイズ 」を留意して設定してください。

READ(O_DIRECT) の監視方法は、下記のとおりです。

  • READ (O_DIRECT)

    • 指定されたデバイス(ディスクデバイスまたはパーティションデバイス) 上の1セクタ分もしくはファイルを、キャッシュを使用しない (O_DIRECTモード) で read してその結果(readできたサイズ)で判断します。

    • read できたことを判断します。read したデータの正当性は判断しません。

READ (RAW) の監視方法は、下記のとおりです。

  • READ (RAW)

    • 監視方法「READ(O_DIRECT)」と同様に OS のキャッシュを使用しないで指定されたデバイスの read の監視を行います。

    • read できたことを判断します。read したデータの正当性は判断しません。

    • 監視方法「READ(RAW)」を設定する場合、既に mount しているパーティションまたは mount する可能性のあるパーティションの監視はできません。また、既にmount しているパーティションまたは mount する可能性のあるパーティションのwhole device(ディスク全体を示すデバイス) を監視することもできません。監視専用のパーティションを用意してディスクモニタリソースに設定してください。(監視用のパーティションサイズは、10MB 以上を割り当ててください)

WRITE (FILE) の監視方法は、下記のとおりです。

  • WRITE (FILE)

    • 指定されたパス名のファイルを作成、書き込み、削除を行い判断します。

    • 書き込んだデータの正当性は判断しません。

6.3.3. ディスクモニタリソースで READ を選択した場合の I/O サイズ

監視方法で READ を選択した場合の read を行うサイズを指定します。

使用するディスクやインターフェイスにより、様々な read 用のキャッシュが実装されている場合があります。そのため I/O サイズが小さい場合にはキャッシュにヒットしてしまい read のエラーを検出できない場合があります。
READ の I/O のサイズはディスクの障害を発生させて障害の検出ができることを確認して指定してください。
以下の図は 2台のサーバとそれに接続された共有ディスクの例です。
まず、サーバの(SCSI、Fibre Channelなどの)インターフェイスアダプタ(図のHBA)にキャッシュがあります。
Shared diskにはRAID サブシステム上のキャッシュがあります。
また、アレイディスク内部の各ディスクドライブ上にもキャッシュがあります。
サーバとディスク、それぞれの中にあるキャッシュ

図 6.2 様々なキャッシュ

6.4. ディスクモニタリソースで READ(RAW) を選択した場合の設定例

ディスクモニタの設定例

  • Disk モニタリソース (内蔵HDDを「READ(RAW)」で監視)

  • Disk モニタリソース (共有ディスクを「READ(RAW)」で監視)

図はサーバとそれに接続されたディスクの例を表しています。 Server 1の内蔵ディスクにおいて、/dev/sda3をDiskモニタに指定しています。

注釈

OSで使用しているパーティションは指定しないでください(swapも含む)。
既にmountしているパーティション、mountする可能性のあるパーティション、whole deviceも指定しないでください。
Diskモニタリソース専用のパーティションを確保してください。

また外部接続ディスク(Disk)において、/dev/sdb3をDiskモニタに指定しています。

注釈

既にmountしているパーティション、またはmountする可能性のあるパーティションは指定しないでください。
また、既にmountしているパーティション、またはmountする可能性のあるパーティションのwhole deviceも指定しないでください。
Diskモニタリソース専用のパーティションを確保してください。
サーバとディスク、およびディスク内のパーティション

図 6.3 ディスクモニタの設定例

6.5. IP モニタリソースの設定

IP モニタリソースとは、ping コマンドを使用して、IPアドレスの監視を行うモニタリソースです。

6.5.1. 監視(固有) タブ

[IPアドレス一覧] には監視するIPアドレスの一覧が表示されます。

追加

監視する IP アドレスを追加します。IP アドレスの入力ダイアログボックスが表示されます。

IPアドレス(255バイト以内)

監視を行う IP アドレスまたはホスト名を入力して [OK] を選択してください。パブリック LAN に存在する実 IP アドレスまたはホスト名を入力してください。ホスト名を設定する場合は、OS側に名前解決の設定 (/etc/hosts へのエントリの追加など) をしてください。

削除

[IPアドレス一覧] で選択している IP アドレスを監視対象から削除します。

編集

IPアドレスの入力ダイアログボックスが表示されます。[IPアドレス一覧] で選択している IP アドレスが表示されるので、編集して [OK] を選択します。

6.5.2. IP モニタリソースの監視方法

指定したIPアドレスを ping コマンドで監視します。指定したIPアドレスすべての応答がない場合に異常と判断します。

IP アドレスの応答確認には ICMP の packet type 0 (Echo Reply) と 8 (Echo Request) が使用されます。

  • 複数のIPアドレスについてすべてのIPアドレスが異常時に異常と判断したい場合、1 つのIPモニタリソースにすべてのIPアドレスを登録してください。

    以下の図は1つのIPモニタリソースに全てのIPアドレスを登録した場合の例です。 指定したIPアドレスが一つでも正常な場合、IP monitor 1は正常と判断します。

    IPモニタリソースが動作するサーバと、監視対象の3台のサーバ

    図 6.4 1つのIPモニタリソースに全てのIPアドレスを登録(正常)

    以下の図は1つのIPモニタリソースに全てのIPアドレスを登録した場合の例です。 指定したIPアドレスが全て異常な場合、IP monitor 1は異常と判断します。

    IPモニタリソースが動作するサーバと、監視対象の3台のサーバ

    図 6.5 1つのIPモニタリソースに全てのIPアドレスを登録(異常検出)

  • 複数の IP アドレスについてどれか 1 つが異常時に異常と判断したい場合、個々の IPアドレスについて 1 つずつの IP モニタリソースを作成してください。

    図は各IPモニタリソースにIPアドレスを一つずつ登録した場合の例です。 指定したIPアドレスの異常を検出した場合、IPモニタ(図ではIP monitor 1)は異常と判断します。

    IPモニタリソースが動作するサーバと、監視対象の3台のサーバ

    図 6.6 各IPモニタリソースにIPアドレスを一つずつ登録(異常検出)

6.7. PID モニタリソースの設定

活性に成功したEXEC リソースを監視します。プロセス ID の有無を監視することによってプロセス ID の消滅時に異常と判断します。

監視を行う EXEC リソースは「 6.2. モニタリソースのプロパティ 」の [対象リソース] で設定します。EXEC リソースの起動時の設定が [非同期] の場合のみ監視できます。プロセスのストールを検出することは出来ません。

注釈

データベース、samba、apache、sendmail などのストール監視を行うには「CLUSTERPRO 監視オプション」を購入してください。

6.7.1. PID モニタリソースの注意事項

活性に成功したEXECリソースを監視します。EXEC リソースの開始スクリプトの起動時の設定が[非同期]の場合のみ監視できます。

6.8. ユーザ空間モニタリソースの設定

ユーザ空間モニタリソースは、ユーザ空間のストールを異常として判断します。
本リソースは自動的に登録されます。監視方法は softdog のユーザ空間モニタリソースが自動登録されます。

6.8.1. 監視(固有) タブ

ハートビートのインターバル/タイムアウトを使用する

監視のインターバルとタイムアウトを、ハートビートのインターバルとタイムアウトを使用するかどうかを設定します。

  • チェックボックスがオン
    ハートビートのインターバルとタイムアウトを使用します。
  • チェックボックスがオフ
    ハートビートの設定は使用せず、監視タブで設定するインターバルとタイムアウトを使用します。タイムアウトはインターバルより大きい値を設定する必要があります。[監視方法] に ipmi を設定している場合、タイムアウトを 255 以下に設定する必要があります。

監視方法

ユーザ空間モニタリソースの監視方法を以下の中から選択します。既に他のユーザ空間モニタリソースで使用している監視方法は選択できません。

  • softdog
    softdog ドライバを使用します。
  • ipmi
    OpenIPMI を使用します。
  • keepalive
    clpkhb ドライバ、clpka ドライバを使用します。
  • none
    何も使用しません。

タイムアウト発生時動作

最終動作を設定します。

  • RESET
    サーバをリセットします。
  • PANIC
    サーバをパニックさせます。監視方法が keepalive の場合にのみ設定可能です。

ダミーファイルのオープンクローズ

監視を行う際、インターバルごとにダミーファイルのオープン/クローズを行うかどうかを設定します。

  • チェックボックスがオン
    ダミーファイルのオープン/クローズを行います。
  • チェックボックスがオフ
    ダミーファイルのオープン/クローズを行いません。

書き込みを行う

ダミーファイルのオープン/クローズを行う場合に、ダミーファイルに書き込みを行うかどうかを設定します。

  • チェックボックスがオン
    ダミーファイルの書き込みを行います。
  • チェックボックスがオフ
    ダミーファイルの書き込みを行いません。

サイズ(1~9999999)

ダミーファイルに書き込みを行う場合に書き込むサイズを設定します。

ダミースレッドの作成

監視を行う際にダミースレッドの作成を行うかどうかを設定します。

  • チェックボックスがオン
    ダミースレッドの作成を行います。
  • チェックボックスがオフ
    ダミースレッドの作成を行いません。

6.8.2. ユーザ空間モニタリソースが依存するドライバ

監視方式 softdog

softdog

  • 監視方法が softdog の場合、このドライバが必要です。

  • ローダブルモジュール構成にしてください。スタティックドライバでは動作しません。

  • softdog ドライバが使用できない場合、監視を開始することはできません。

監視方式 keepalive

clpka clpkhb

6.8.3. ユーザ空間モニタリソースが依存する rpm

監視方式 ipmi

OpenIPMI

  • 監視方法が ipmi の場合、この rpm をインストールしておく必要があります。

  • この rpm がインストールされていない場合、監視を開始することはできません。

6.8.4. ユーザ空間モニタリソースの監視方法

ユーザ空間モニタリソースの監視方法は以下のとおりです。

監視方法 softdog

監視方法が softdog の場合、OS の softdog ドライバを使用します。

監視方法 ipmi

監視方法が ipmi の場合、OpenIPMI を使用します。
OpenIPMI がインストールされていない場合、インストールする必要があります。

監視方法 keepalive

監視方法が keepalive の場合、clpkhb ドライバと clpka ドライバを使用します。

注釈

clpkhbドライバ, clpkaドライバが動作するディストリビューション、kernelバージョンについては必ず『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「動作可能なディストリビューションと kernel」で確認してください。
ディストリビュータがリリースするセキュリティパッチを既に運用中のサーバへ適用する場合 (kernel バージョンが変わる場合)にも確認してください。

監視方法 none

監視方法 none は、評価用の設定です。ユーザ空間モニタリソースの拡張設定の動作だけを実行します。本番環境では設定しないでください。

6.8.5. ユーザ空間モニタリソースの拡張設定

ユーザ空間モニタリソースを拡張させる設定として、ダミーファイルのオープン/クローズ、ダミーファイルへの書き込み、ダミースレッドの作成があります。各設定に失敗するとタイマの更新を行いません。設定したタイムアウト値またはハートビートタイムアウト時間内に各設定が失敗し続けるとOSをリセットします。

ダミーファイルのオープン/クローズ

監視間隔ごとにダミーファイルの作成、ダミーファイルの open、ダミーファイルの close、ダミーファイルの削除を繰り返します。

  • この拡張機能を設定している場合、ディスクの空き容量がなくなるとダミーファイルのopen に失敗してタイマの更新が行われず、OS をリセットします。

ダミーファイルへの書き込み

監視間隔毎にダミーファイルに設定したサイズを書き込みます。

  • この拡張機能は、ダミーファイルのオープン / クローズが設定されていないと設定できません。

ダミースレッドの作成

監視間隔ごとにダミースレッドを作成します。

6.8.6. ユーザ空間モニタリソースのロジック

監視方法の違いによる処理内容、特徴は以下の通りです。シャットダウン監視では各処理概要のうち1のみの挙動になります。

監視方法 ipmi

  • 処理概要

    以下の2~7 の処理を繰り返します。

    1. IPMIタイマセット

    2. ダミーファイルのopen()

    3. ダミーファイルwrite()

    4. ダミーファイルfdatasync()

    5. ダミーファイルのclose()

    6. ダミースレッド作成

    7. IPMIタイマ更新

    処理概要 2~6 は監視の拡張設定の処理です。各設定を行っていないと処理を行いません。

    • タイムアウトしない(上記 2~7 が問題なく処理される)場合の挙動
      リセットなどのリカバリ処理は実行されません
    • タイムアウトした(上記 2~7 のいずれかが停止または遅延した)場合の挙動
      BMC(サーバ本体のマネージメント機能)によりリセットを発生させます
    • メリット

      • BMC(サーバ本体のマネージメント機能) を使用するため kernel 空間の障害を受けにくく、リセットができる確率が高くなります。
    • デメリット

      • H/W に依存しているため IPMI をサポートしていないサーバ、OpenIPMI が動作しないサーバでは使用できません。

      • ESMPRO/ServerAgent を使用しているサーバでは使用できません。

      • その他サーバベンダが提供するサーバ監視ソフトウェアと共存できない可能性があります。

監視方法 softdog

  • 処理概要

    以下の2~7の処理を繰り返します。

    1. softdogセット

    2. ダミーファイルのopen()

    3. ダミーファイルwrite()

    4. ダミーファイルfdatasync()

    5. ダミーファイルのclose()

    6. ダミースレッド作成

    7. softdogタイマ更新

    処理概要 2~6は監視の拡張設定の処理です。各設定を行っていないと処理を行いません。

    • タイムアウトしない(上記 2~7 が問題なく処理される)場合の挙動
      リセットなどのリカバリ処理は実行されません
    • タイムアウトした(上記 2~7 のいずれかが停止または遅延した)場合の挙動
      softdog.ko によりリセットを発生させます
    • メリット

      • H/W に依存しないため softdog kernel モジュールがあれば使用できます。
        (一部のディストリビューションではデフォルトでsoftdogが用意されていないものもがありますので 設定する前に softdog の有無を確認してください)
    • デメリット

      • softdog が kerne l空間のタイマロジックに依存しているためkernel空間に障害が発生した場合にリセットされない場合があります。

監視方法 keepalive

  • 処理概要

    以下の 2~7 の処理を繰り返します。

    1. keepalive タイマセット

    2. ダミーファイルのopen()

    3. ダミーファイルwrite()

    4. ダミーファイルfdatasync()

    5. ダミーファイルのclose()

    6. ダミースレッド作成

    7. keepalive タイマ更新

    処理概要 2~6 は監視の拡張設定の処理です。各設定を行っていないと処理を行いません。

    • タイムアウトしない(上記 2~7 が問題なく処理される)場合の挙動
      リセットなどのリカバリ処理は実行されません
    • タイムアウトした(上記 2~7 のいずれかが停止または遅延した)場合の挙動

    • アクションの設定にしたがって、clpka.koによりリセットまたはパニックを発生させます

      • メリット

        • アクションとしてパニックが設定できます。

      • デメリット

        • 動作できる(ドライバを提供している)ディストリビューション、アーキテクチャ、カーネルバージョンが制限されます。

        • clpka が kernel 空間のタイマロジックに依存しているためkernel 空間に障害が発生した場合にリセットされない場合があります。

6.8.7. ipmi 動作可否の確認方法

サーバ本体の OpenIPMI の対応状況を確認する方法は、以下の手順で簡易確認することができます。

  1. OpenIPMI の rpm パッケージをインストールする。

  2. /usr/bin/ipmitool を実行する。

  3. 実行結果を確認する。

以下のように表示される場合(/usr/bin/ipmitool bmc watchdog getの実行結果)

(以下は表示例です。H/Wにより表示される値が異なる場合があります。)

Watchdog Timer Use: SMS/OS (0x04)
Watchdog Timer Is: Stopped
Watchdog Timer Actions: No action (0x00)
Pre-timeout interval: 0 seconds
Timer Expiration Flags: 0x00
Initial Countdown: 300 sec
Present Countdown: 0 sec

OpenIPMI は使用できます。監視方法に ipmi を選択することが可能です。

6.8.8. ユーザ空間モニタリソースの注意事項

全監視方法での共通の注意事項

  • Cluster WebUI で設定情報を作成すると監視方法 softdog のユーザ空間モニタリソースが自動で作成されます。

  • 監視方法の異なるユーザ空間モニタリソースを追加することができます。自動的に作成された監視方法 softdog のユーザ空間モニタリソースは削除することもできます。

  • OS の softdog ドライバが存在しない、または CLUSTERPRO の clpkhb ドライバ、clpka ドライバが存在しない、OpenIPMI の rpm がインストールされていないなどの理由によりユーザ空間モニタリソースの活性に失敗した場合、Cluster WebUI のアラートログに "Monitor userw failed." というメッセージが表示されます。Cluster WebUI、clpstat コマンドでの表示ではリソースステータスは [正常] が表示され、サーバのステータスは [停止済] が表示されます。

ipmiによる監視の注意事項

  • ipmi に関する注意事項はCLUSTERPRO X の『リファレンスガイド』の「モニタリソースの詳細」 -「モニタリソースとは?」 - 「使用している ipmi コマンド」を参照してください。

ESMPRO/ServerAgent などサーバベンダが提供するサーバ監視ソフトウェアを使用する場合には、監視方法に IPMI を選択しないでください。 これらのサーバ監視ソフトウェアと OpenIPMI は共にサーバ上の BMC(Baseboard Management Controller) をするため、競合が発生して正しく監視が行うことができなくなります。

6.9. カスタムモニタリソースの設定

カスタムモニタリソースは、任意のスクリプトを実行することによりシステムモニタを行うモニタリソースです。

6.9.1. 監視(固有) タブ

ユーザアプリケーション

スクリプトとしてサーバ上の実行可能ファイル (実行可能なシェルスクリプトファイルや実行ファイル)を使用します。各実行可能ファイル名は、サーバ上のローカルディスクの絶対パスで設定します。
各実行可能ファイルは、Cluster WebUI の構成情報には含まれません。Cluster WebUI で編集やアップロードはできませんので、サーバ上に準備する必要があります。

この製品で作成したスクリプト

スクリプトとしてCluster WebUI で準備したスクリプトファイルを使用します。必要に応じてCluster WebUI でスクリプトファイルを編集できます。スクリプトファイルは、構成情報に含まれます。

ファイル(1023バイト以内)

[ユーザアプリケーション] を選択した場合に、実行するスクリプト(実行可能なシェルスクリプトファイルや実行ファイル)を、サーバ上のローカルディスクの絶対パスで設定します。

表示

[この製品で作成したスクリプト] を選択した場合に、スクリプトファイルを表示します。

編集

[この製品で作成したスクリプト] を選択した場合に、スクリプトファイルを編集します。変更を反映するには [保存] をクリックしてください。スクリプトファイル名の変更はできません。

置換

[この製品で作成したスクリプト] を選択した場合に、スクリプトファイルの内容を、ファイル選択ダイアログ ボックスで選択したスクリプトファイルの内容に置換します。スクリプトが表示中または編集中の場合は置換できません。ここではスクリプトファイルを選択してください。バイナリファイル (アプリケーションなど) は選択しないでください。

監視タイプ

監視の方法を選択します。

  • 同期(既定値)
    定期的にスクリプトを実行し、そのエラーコードにより異常の有無を判断します。
  • 非同期
    監視開始時にスクリプトを実行し、そのプロセスが消失した場合に異常と判断します。

アプリケーション/スクリプトの監視開始を一定時間待ち合わせる (0~9999)

監視タイプが [非同期] の場合にアプリケーション/スクリプトを起動してから監視を開始するまでの待ち時間を設定します。この待ち時間は[監視 (共通)] タブで設定したタイムアウトの値より小さい値を設定する必要があります。

注釈

本設定は次回モニタ起動時に有効になります。

既定値 : 0

ログ出力先(1023バイト以内)

スクリプト内で出力するログの出力先を設定します。
[ローテートする] のチェックボックスがオフの場合は無制限に出力されますのでファイルシステムの空き容量に注意してください。
[ローテートする] のチェックボックスがオンの場合は、出力されるログファイルは、ローテートします。また、以下の注意事項があります。
[ログの出力先] には 1009 バイト以内でログのパスを記述してください。1010 バイトを超えた場合、ログの出力が行えません。
ログファイルの名前の長さは 31 バイト以内で記述してください。32 バイト以上の場合、ログの出力が行えません。
複数のカスタムモニタリソースでログローテートを行う場合、パス名が異なってもログファイルの名前が同じ場合、(ex. /home/foo01/log/genw.log, /home/foo02/log/genw.log) ローテートサイズが正しく反映されないことがあります。

ローテートする

スクリプトや実行可能ファイルの実行ログを、オフの場合は無制限のファイルサイズで、オンの場合はローテートして出力します。

ローテートサイズ (1~999999999)

[ローテートする]チェックボックスがオンの場合に、ローテートするサイズを指定します。
ローテート出力されるログファイルの構成は、以下のとおりです。

ファイル名

内容

[ログ出力先]指定のファイル名

最新のログです。

[ログ出力先]指定のファイル名.pre

ローテートされた以前のログです。

正常な戻り値(1023バイト以内)

監視タイプが[同期]の場合にスクリプトのエラーコードがどのような値の場合に正常と判断するかを設定します。複数の値がある場合は、0,2,3 というようにカンマで区切るか、 0-3 のようにハイフンで値の範囲を指定します。

既定値 : 0

クラスタ停止時に活性時監視の停止を待ち合わせる

クラスタ停止時にカスタムモニタリソースの停止を待ち合わせます。監視タイミングに [活性時] を設定している場合のみ有効となります。

6.9.2. カスタムモニタリソースの注意事項

監視タイプが [非同期] の場合、監視リトライ回数を 1 回以上に設定すると、正常に監視を 行うことができません。監視タイプを [非同期] に設定する場合は、監視リトライ回数を 0 回に設定してください。
スクリプトのログローテート機能を有効にした場合、ログ出力を仲介するプロセス(仲介プロセス)が生成されます。仲介プロセスは、「開始・停止スクリプト」および「開始・停止スクリプトから標準出力・標準エラー出力のいずれかまたは両方を継承した子孫プロセス」からのログ出力が全て停止 (ファイルディスクリプタがクローズ) するまで動作を継続します。子孫プロセスの出力をログから除外する場合は、スクリプトからのプロセス生成時に標準出力および標準エラー出力をリダイレクトしてください。

6.9.3. カスタムモニタリソースの監視方法

カスタムモニタリソースは、任意のスクリプトによりシステム監視を行います。
監視タイプが[同期]の場合、スクリプトを定期的に実行し、そのエラーコードにより異常の有無を判別します。
監視タイプが[非同期]の場合、スクリプトを監視開始時に実行し、このスクリプトのプロセスが消失した場合に異常と判断します。

6.10. ボリュームマネージャモニタリソースの設定

ボリュームマネージャモニタリソースは、ボリュームマネージャにより管理されている論理ディスクの監視を行うモニタリソースです。

6.10.1. 監視(固有) タブ

ボリュームマネージャ

監視対象の論理ディスクを管理しているボリュームマネージャの種類を設定します。対応済みのボリュームマネージャは下記です。

  • lvm (LVM ボリュームグループ)

  • zfspool (ZFS ストレージプール)

ターゲット名 (1023 バイト以内)

監視対象の名前を設定します。ボリュームマネージャが [lvm] の場合、複数ボリュームをまとめて制御することができます。複数ボリュームを制御する場合は、ボリュームの名前を半角スペースで区切って設定します。

6.10.2. ボリュームマネージャモニタリソースの注意事項

ボリュームマネージャモニタリソースには既定値が設定されているため、必要があれば適切な値に変更してください。

6.10.3. ボリュームマネージャモニタリソースの監視方法

ボリュームマネージャモニタリソースは、監視する論理ディスクを管理するボリュームマネージャの種類によって監視方法が異なります。
対応済みのボリュームマネージャは下記です。
  • lvm (LVM ボリュームグループ)

  • zfspool (ZFS ストレージプール)

6.11. マルチターゲットモニタリソースの設定

マルチターゲットモニタリソースは、複数のモニタリソースの監視を行います。

6.11.1. 監視(固有) タブ

モニタリソースをグループ化して、そのグループの状態を監視します。[モニタリソース一覧] はモニタリソースを最大 64 個登録できます。
本リソースの [モニタリソース一覧] に唯一設定されているモニタリソースが削除された場合、本リソースは自動的に削除されます。

追加

選択しているモニタリソースを[モニタリソース一覧] に追加します。

削除

選択しているモニタリソースを[モニタリソース一覧] から削除します。

調整

[マルチターゲットモニタリソース調整プロパティ] ダイアログボックスを表示します。マルチターゲットモニタリソースの詳細設定を行います。

マルチターゲットモニタリソース調整プロパティ

パラメータタブ

パラメータに関する詳細設定が表示されます。

異常しきい値

マルチターゲットモニタが異常とする条件を選択します。

  • メンバ数に合わせる
    マルチターゲットモニタの配下に指定したモニタリソースが全て異常となったとき、または異常と停止済が混在しているときにマルチターゲットモニタが異常になります。
    マルチターゲットモニタの配下に指定したモニタリソースの全てが停止済の場合には、正常になります。
  • 数を指定する
    マルチターゲットモニタの配下に指定したモニタリソースのうち、異常しきい値に設定した数が異常または停止済となったときにマルチターゲットモニタが異常になります。
    マルチターゲットモニタの配下に指定したモニタリソースのうち、何個のモニタリソースが異常または停止済となったときにマルチターゲットモニタを異常とするかの個数を設定します。
    異常しきい値の選択が [数を指定する] のときに設定できます。

警告しきい値

  • チェックボックスがオン
    マルチターゲットモニタの配下に指定したモニタリソースのうち、何個のモニタリソースが異常または停止済となったときにマルチターゲットモニタを警告とするかの個数を設定します。
  • チェックボックスがオフ
    マルチターゲットモニタは警告のアラートを表示しません。

既定値

既定値に戻すときに使用します。[既定値] をクリックすると全ての項目に既定値が設定されます。

6.11.2. マルチターゲットモニタリソースの注意事項

  • マルチターゲットモニタリソースは、登録されているモニタリソースのステータス 停止済み(offline)を異常として扱います。そのため、活性時監視のモニタリソースを登録した場合、モニタリソースが異常を検出していない状態でマルチターゲットモニタリソースが異常を検出してしまうことがあります。活性時監視のモニタリソースを登録しないでください。

6.11.3. マルチターゲットモニタリソースのステータス

マルチターゲットモニタリソースのステータスは登録されているモニタリソースのステータスによって判断します。
マルチターゲットモニタリソースが下記のように設定されている場合、
登録されているモニタリソース数 2
異常しきい値 2
警告しきい値 1
マルチターゲットモニタリソースのステータスは以下のようになります。
マルチターゲット
モニタリソースステータス
モニタリソース1 ステータス
正常
(normal)
モニタリソース1 ステータス
異常
(error)
モニタリソース1 ステータス
停止済
(offline)
モニタリソース2 ステータス
正常
(normal)
正常
(normal)
警告
(caution)
警告
(caution)
モニタリソース2 ステータス
異常
(error)
警告
(caution)
異常
(error)
異常
(error)
モニタリソース2 ステータス
停止済
(offline)
警告
(caution)
異常
(error)
正常
(normal)
  • マルチターゲットモニタリソースは、登録されているモニタリソースのステータスを監視しています。
    ステータスが異常(error)であるモニタリソースの数が異常しきい値以上になった場合、マルチターゲットモニタリソースは異常(error)を検出します。
    ステータスが異常(error)であるモニタリソース数が警告しきい値を超えた場合、マルチターゲットモニタリソースのstatusは警告(caution)となります。
    登録されている全てのモニタリソースのステータスが停止済み(offline)の場合、マルチターゲットモニタリソースのステータスは正常(normal)となります。
    登録されている全てのモニタリソースのステータスが停止済み(offline)の場合を除いて、マルチターゲットモニタリソースは登録されているモニタリソースのステータス 停止済み(offline)を異常(error)と判断します。
  • 登録されているモニタリソースのステータスが異常(error)となっても、そのモニタリソースの異常時アクションは実行されません。
    マルチターゲットモニタリソースが異常(error)になった場合のみ、マルチターゲットモニタリソースの異常時アクションが実行されます。

6.12. マルチターゲットモニタリソースの設定例

  • Disk パス二重化ドライバの使用例
    ディスクデバイス (/dev/sdb, /dev/sdcなど) が同時に異常となった場合にのみ、異常(error) とする必要があります。
    以下の図は、2つのHBAとDiskパス二重化ドライバを使ってパスを二重化した構成を表しています。
    片側のHBAの障害活性時には、Diskパス二重化ドライバがパスの縮退または切り替えを行います。
    Diskパス二重化ドライバ、内蔵HDD、2つのHBAとdiskw

    図 6.9 Diskパス二重化ドライバの使用例

    • マルチターゲットモニタリソース (mtw1) に登録するモニタリソース

      • diskw1

      • diskw2

    • マルチターゲットモニタリソース (mtw1) の異常しきい値、警告しきい値

      • 異常しきい値 2

      • 警告しきい値 0

    • マルチターゲットモニタリソース (mtw1) に登録するモニタリソースの詳細設定

      • ディスクモニタリソース (diskw1)
        監視デバイス名 /dev/sdb
        再活性しきい値 0
        フェイルオーバしきい値 0
        最終動作 何もしない
      • ディスクモニタリソース (diskw2)
        監視デバイス名 /dev/sdc
        再活性しきい値 0
        フェイルオーバしきい値 0
        最終動作 何もしない
    • 上記の設定の場合、マルチターゲットモニタリソースのモニタリソースに登録されているdiskw1 と diskw2 のどちらかが異常を検出しても、異常となったモニタリソースの異常時アクションを行いません。

    • diskw1 と diskw2 が共に異常となった場合、2 つのモニタリソースのステータスが異常(error) と停止済み (offline) になった場合、マルチターゲットモニタリソースに設定された異常時アクションを実行します。

6.13. ソフト RAID モニタリソースの設定

ソフト RAID モニタリソースは、ソフト RAID を行っているデバイスを監視するモニタリソースです。

6.13.1. ソフト RAID モニタリソースの監視方法

ソフト RAID モニタリソースは、md ドライバを利用してソフト RAID を行っているデバイスを監視します。片方の DISK が異常になって、ソフト RAID が縮退している場合に WARNING を通知します。

注釈

両方のディスクが異常になった場合は、異常を検出できませんので、縮退の通知時にDISK の復旧操作を行ってください。

6.13.2. 監視(固有) タブ

監視デバイス名(1023バイト以内)

監視を行うmdデバイス名を設定してください。

6.14. 外部連携モニタリソースの設定

外部連携モニタリソースは受動的なモニタです。自身では監視処理を行いません。
CLUSTERPRO の外部から発行された異常発生通知を受信した場合に、外部連携モニタリソースのステータスの変更、異常発生時の回復動作を行うモニタリソースです。

6.14.1. 監視(固有) タブ

カテゴリとキーワードには、clprexec コマンドの引数 -k で渡すキーワードを設定します。キーワードは省略可能です。

カテゴリ (32バイト以内)

clprexec コマンドの引数 -k で指定するカテゴリを指定します。
リストボックスでの既定文字列の選択または任意の文字列の指定が可能です。

キーワード (1023バイト以内)

clprexec コマンドの引数 -k で指定するキーワードを指定します。

6.14.2. 回復動作タブ

回復対象と異常検出時の動作を設定します。外部連携モニタリソースの場合、異常検出時の動作は、[回復対象を再起動]、[回復対象に対してフェイルオーバ実行]、または、[最終動作を実行] のいずれか 1 つを選択します。ただし、回復対象が非活性状態であれば回復動作は行われません。

回復動作

モニタ異常検出時に行う動作を選択します。

  • 回復スクリプトを実行
    モニタ異常検出時に、回復スクリプトを実行します。
  • 回復対象を再起動
    モニタ異常検出時に、回復対象に選択したグループまたはグループリソースの再起動を行います。
  • 最終動作を実行
    モニタ異常検出時に、最終動作に選択した動作を行います。

回復動作前にスクリプトを実行する

回復動作を実行する前にスクリプトを実行するかどうかを指定します。

  • チェックボックスがオン
    回復動作を実施する前にスクリプト/コマンドを実行します。スクリプト/コマンドの設定を 行うためには [スクリプト設定] をクリックしてください。
  • チェックボックスがオフ
    スクリプト/コマンドを実行しません。

※ 上記以外の設定項目については、「6. モニタリソースの詳細」 - 「6.2. モニタリソースのプロパティ」 - 「6.2.4. 回復動作タブ」を参照してください。

6.14.3. 外部連携モニタリソースの監視方法

  • 外部から異常発生通知を受信した場合、通知されたカテゴリとキーワード(キーワードは省略可能)が設定されている外部連携モニタリソースの異常発生時の回復動作を行います。通知されたカテゴリ、キーワードが設定されている外部連携モニタリソースが複数存在する場合は、各モニタリソースの回復動作を行います。

以下の図は外部連携モニタリソースを使用する構成の例です。 clprexecコマンドから異常発生通知を受けたServer2の外部連携モニタリソースは、自身のステータス変更と異常検出時の回復動作を実行します。

clprexecコマンドが実行されたServer 1、外部連携モニタリソースが動作するServer 2

図 6.10 外部連携モニタリソースを使用する構成

6.14.4. 外部連携モニタリソースに関する注意事項

  • 外部連携モニタリソースが一時停止状態で外部からの異常発生通知を受信した場合、異常時動作は実行されません。

  • 外部から異常発生通知を受信した場合、外部連携モニタリソースのステータスは"異常"になります。"異常"となった外部連携モニタリソースのステータスは、自動では"正常"に戻りません。ステータスを"正常"に戻したい場合は、clprexec コマンドを使用してください。clprexec コマンドについては『操作ガイド』の「CLUSTERPRO X SingleServerSafe コマンドリファレンス」を参照してください。

  • 外部から異常発生通知を受信して外部連携モニタリソースのステータスが"異常"となっている状態で異常発生通知を受信した場合、異常発生時の回復動作は実行されません。

6.15. プロセス名モニタリソースの設定

プロセス名モニタリソースは、任意のプロセス名のプロセスを監視するモニタリソースです。

6.15.1. 監視(固有) タブ

プロセス名 (1023 バイト以内)

監視対象プロセスのプロセス名を設定します。プロセス名は ps(1) コマンドの出力結果などから確認します。
また、次の 3 つのパターンでプロセス名のワイルドカード指定が可能です。このパターン以外の指定はできません。
  • 【前方一致】  <プロセス名に含まれる文字列>*

  • 【後方一致】  *<プロセス名に含まれる文字列>

  • 【部分一致】  *<プロセス名に含まれる文字列>*

プロセス数下限値 (1~999)

監視対象プロセスの監視個数を設定します。プロセス名に設定した監視対象プロセスの個数が設定値を下回った場合に異常と判断します。

6.15.2. プロセス名モニタリソースの注意事項

プロセス数下限値に 1 を設定した場合に監視対象に指定したプロセス名のプロセスが複数存在すると、次の条件で監視対象プロセスを一つ選択し監視します。

  1. プロセス間に親子関係がある場合は、親プロセスを監視します。

  2. プロセス間に親子関係がなければ、プロセスの起動時刻の最も古いものを監視します。

  3. プロセス間に親子関係がなく、プロセスの起動時刻も同じであれば、もっともプロセスIDの小さいものを監視します。

同一名のプロセスが複数存在する場合にプロセスの起動個数によって監視を行う際には、プロセス数下限値に監視する個数を設定します。同一名のプロセスが設定された個数を下回ると異常と判断します。プロセス数下限値に指定できる個数は 1 から 999 個までです。プロセス数下限値に1を設定した場合は、監視対象プロセスを一つ選択して監視します。

監視対象プロセス名に指定できるプロセス名は 1023 バイトまでです。1023 バイトを超えるプロセス名を持つプロセスを監視対象として指定する場合は、ワイルドカード(*)を使って指定します。

監視対象プロセスのプロセス名が 1023 バイトより長い場合、プロセス名として認識できるのはプロセス名の先頭から 1023 バイトまでです。ワイルドカード(*)を使って指定する場合は、1023 バイトまでに含まれる文字列を指定してください。

監視対象のプロセス名が長い場合、ログ等に出力されるプロセス名情報は後半を省略して表示されます。

プロセス名の中に「"」(ダブルコーテーション)や「,」(カンマ)が含まれるプロセスを監視している場合、アラートメッセージにプロセス名が正しく表示できない場合があります。

監視対象プロセス名は、実際に動作しているプロセスのプロセス名を ps(1) コマンド等で確認し設定してください。

実行結果の例

# ps -eaf
UID        PID  PPID  C STIME TTY          TIME CMD
root         1     0  0 Sep12 ?        00:00:00 init [5]
    :
root      5314     1  0 Sep12 ?        00:00:00 /usr/sbin/acpid
root      5325     1  0 Sep12 ?        00:00:00 /usr/sbin/sshd
htt       5481     1  0 Sep12 ?        00:00:00 /usr/sbin/htt -retryonerror 0

上記のコマンド実行結果から /usr/sbin/htt を監視する場合、 /usr/sbin/htt -retryonerror 0 を監視対象プロセス名に指定します。

監視対象プロセス名に指定したプロセス名はプロセスの引数もプロセス名の一部として監視対象のプロセスを特定します。監視対象プロセス名を指定する場合は、引数を含めたプロセス名を指定してください。引数を含めずプロセス名のみ監視したい場合は、ワイルドカード(*)を使い、引数を含めない前方一致または部分一致で指定してください。

6.15.3. プロセス名モニタリソースの監視方法

指定されたプロセス名のプロセスを監視します。プロセス数下限値に 1 を設定した場合、プロセス名からプロセス ID を特定し、そのプロセス ID の消滅時に異常と判断します。プロセスのストールを検出することはできません。

プロセス数下限値に 1 より大きい値を設定した場合、指定されたプロセス名のプロセスを個数によって監視します。プロセス名から監視対象プロセスの個数を算出し、下限値を下回った場合に異常と判断します。プロセスのストールを検出することはできません。

6.16. DB2 モニタリソースの設定

DB2 モニタリソースは、サーバ上で動作する DB2 のデータベースを監視するモニタリソースです。

6.16.1. 監視(固有) タブ

監視レベル

選択肢の中から1つを選択します。必ず設定してください。

  • レベル 1 (selectでの監視)
    監視テーブルに対して参照のみを行う監視です。監視テーブルに対して実行する SQL文は( select )です。
  • レベル 2 (update/selectでの監視)
    監視テーブルに対して更新も行う監視です。監視テーブルに対して実行する SQL 文は( update / select )です。
    監視開始時に監視テーブルを自動で作成した場合、監視テーブルに対して実行する SQL 文は( create / insert )です。
  • レベル 3 (毎回create/dropも行う)
    監視テーブルに対しての更新に加え監視テーブルの作成・削除も毎回行います。監視テーブルに対して実行する SQL 文は( create / insert / select / drop )です。

既定値 : レベル2(update/selectでの監視)

データベース名 (255バイト以内)

監視するデータベース名を設定します。必ず設定してください。

既定値 : なし

インスタンス名 (255バイト以内)

監視するデータベースのインスタンス名を設定します。必ず設定してください。

既定値 : db2inst1

ユーザ名 (255バイト以内)

データベースにログインする際のユーザ名を設定します。必ず設定してください。
指定したデータベースにアクセス可能な DB2 ユーザを指定してください。

既定値 : db2inst1

パスワード (255バイト以内)

データベースにログインする際のパスワードを設定します。必ず設定してください。

既定値 : なし

監視テーブル名 (255バイト以内)

データベース上に作成する監視用テーブルの名前を設定します。必ず設定してください。
テーブルの作成・削除を行いますので、運用に使用しているテーブル名と重ならないように注意してください。また、SQL 文の予約語と重ならないようにしてください。
データベースの仕様により監視テーブル名に設定できない文字があります。詳細はデータベースの仕様を確認してください。

既定値 : db2watch

文字コード

DB2 のキャラクタ・セットを設定します。必ず設定してください。

既定値 : なし

ライブラリパス (1023バイト以内)

DB2 のライブラリパスを設定します。必ず設定してください。

既定値 : /opt/ibm/db2/V11.1/lib64/libdb2.so

6.16.2. DB2 モニタリソースの注意事項

動作確認済みの DB2 のバージョンについては『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「監視オプションの動作確認済アプリケーション情報」を参照してください。

本モニタリソースは、DB2 の CLI のライブラリを利用して、DB2 の監視を行っています。本モニタリソースが異常になる場合は、指定した DB2 の CLI のライブラリパスが存在することを確認してください。

データベースのコードページと本モニタリソースの「文字コード」の設定が異なると、本モニタリソースは、DB2 のデータベースに接続することができません。必要に応じて、適切な文字コードの設定を行ってください。 データベースのコードページの確認は、「db2 get db cfg for データベース名」などで行ってください。詳細は、DB2 のマニュアルを参照してください。

パラメータで指定したデータベース名・インスタンス名・ユーザ名・パスワードなどの値が、監視を行う DB2 の環境と異なる場合、DB2 の監視を行うことができません。各エラー内容を示すメッセージが表示されますので、環境を確認してください。

次項の「 6.16.3. DB2 モニタリソースの監視方法 」で説明する監視レベルについて、以下の点にご注意ください。
「レベル1」で監視開始時に監視テーブルが無い場合、監視エラーになります。下記の監視テーブルの作成を行ってください。
「レベル2」で監視開始時に監視テーブルが無い場合、CLUSTERPROが監視テーブルを自動で作成します。このときCluster WebUI のアラートログに監視テーブルがない旨のメッセージが表示されます。
「レベル3」での監視は毎回監視テーブルの作成・削除を行うため「レベル1」「レベル2」より監視の負荷が高くなります。

選択する監視レベル

監視テーブルの事前作成

レベル1(selectでの監視)

必要あり

レベル2(update/selectでの監視)

必要なし

レベル3(毎回create/dropも行う)

必要なし

監視テーブルの作成は以下の手順で行えます。

SQL 文で作成する場合(以下の例は監視テーブル名を db2watch とする場合)

sql> create table <ユーザ名>.db2watch (num int not null primary key)
sql> insert into db2watch values(0)
sql> commit

CLUSTERPRO のコマンドを利用する場合

前提条件として、モニタリソースの設定が完了している必要があります。

clp_db2w --createtable -n <DB2モニタリソース名>

作成した監視テーブルを手動で削除する場合、下記のコマンドを実行してください:

clp_db2w --deletetable -n <DB2モニタリソース名>

6.16.3. DB2 モニタリソースの監視方法

DB2 モニタリソースは、以下の監視レベルから選択した監視レベルに応じた監視を行います。

  • レベル 1 (selectでの監視)

    監視テーブルに対して参照のみを行う監視です。監視テーブルに対して実行する SQL 文は( select )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

  • レベル 2 (update/selectでの監視)

    監視テーブルに対して更新も行う監視です。SQL 文の実行により最大 10 桁の数値データの書き込みと読み込みを実行します。監視テーブルに対して実行する SQL 文は( update / select )です。
    監視開始時に監視テーブルを自動で作成した場合、監視テーブルに対して実行する SQL 文は( create / insert )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

    2. 書き込んだデータと読み込んだデータが一致していない場合

  • レベル 3 (毎回create/dropも行う)

    監視テーブルに対しての更新に加え監視テーブルの作成・削除も毎回行います。SQL 文の実行により最大 10 桁の数値データの書き込みと読み込みを実行します。監視テーブルに対して実行する SQL 文は( create / insert / select / drop )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

    2. 書き込んだデータと読み込んだデータが一致していない場合

6.17. FTP モニタリソースの設定

FTP モニタリソースは、サーバ上で動作する FTP サービス監視するモニタリソースです。FTP プロトコルを監視するものであり、特定のアプリケーションの監視ではありません。そのため、FTP プロトコルを実装するさまざまなアプリケーションの監視を行うことができます。

6.17.1. 監視(固有) タブ

IP アドレス (79バイト以内)

監視する FTP サーバの IP アドレスを設定します。必ず設定してください。

通常は自サーバ上で動作する FTP サーバに接続しますので、ループバックアドレス(127.0.0.1)を設定しますが、FTP サーバの設定で接続可能なアドレスを制限している場合は、接続可能なアドレス(フローティング IP アドレス等)を設定します。

既定値 : 127.0.0.1

ポート番号 (1~65535)

監視する FTP のポート番号を設定します。必ず設定してください。

既定値 : 21

ユーザ名(255バイト以内)

FTP にログインする際のユーザ名を設定します。

既定値 : なし

パスワード(255バイト以内)

FTP にログインする際のパスワードを設定します。

既定値 : なし

プロトコル

FTP サーバとの通信に使用するプロトコルを設定します。通常は FTP を選択しますが、FTP over SSL/TLS で接続する必要がある場合は FTPS を選択します。

既定値 : FTP

注釈

FTPS を利用するためには OpenSSL ライブラリが必要です

6.17.2. FTP モニタリソースの注意事項

監視の対象リソースには、FTP を起動する exec リソースなどを指定してください。対象リソースの活性後、監視を開始しますが、対象リソースの活性直後に FTP がすぐに動作できない場合などは、[監視開始待ち時間]で調整してください。

監視動作ごとに FTP サービス自体が動作ログなどを出力することがありますが、その制御は、FTP 側の設定で適宜行ってください。

FTP サーバの FTP メッセージ(バナー、ウェルカムメッセージなど)を既定から変更すると、監視異常とみなす場合があります。

6.17.3. FTP モニタリソースの監視方法

FTP モニタリソースは、以下の監視を行います。
FTP サーバに接続してファイル一覧取得コマンドを実行します。
監視の結果、以下の場合に異常とみなします。
  1. FTP サービスヘの接続に失敗した場合

  2. FTP コマンドに対する応答で異常が通知された場合

6.18. HTTP モニタリソースの設定

HTTP モニタリソースは、サーバ上で動作する HTTP デーモンを監視するモニタリソースです。

6.18.1. 監視(固有) タブ

接続先(255バイト以内)

監視する HTTP サーバ名を設定します。必ず設定してください。

通常は自サーバ上で動作する HTTP サーバに接続しますので、ループバックアドレス(127.0.0.1) を設定しますが、HTTP サーバの設定で接続可能なアドレスを制限している場合は、接続可能なアドレスを設定します。

既定値 : localhost

ポート番号(1~65535)

HTTP サーバに接続する際のポート番号を設定します。必ず設定してください。

既定値 : 80 (HTTPの場合) 443 (HTTPSの場合)

Request URI(255バイト以内)

Request URI(例:"/index.html") を設定します。

既定値 : なし

プロトコル

HTTP サーバとの通信に使用するプロトコルを設定します。通常は HTTP を選択しますが、HTTP over SSLで接続する必要がある場合は HTTPS を選択します。

既定値 : HTTP

注釈

HTTPS を利用するためには OpenSSL ライブラリが必要です。

リクエスト種別

HTTP サーバに接続する際の HTTP リクエストの種類を設定します。必ず設定してください。

既定値 : HEAD

認証方式

HTTP サーバに接続する際の認証方式を設定します。

既定値 : 認証なし

ユーザ名(255バイト以内)

HTTP にログインする際のユーザ名を設定します。

既定値 : なし

パスワード(255バイト以内)

HTTP にログインする際のパスワードを設定します。

既定値 : なし

6.18.2. HTTP モニタリソースの注意事項

動作確認済みの HTTP のバージョンについては、『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「監視オプションの動作確認済アプリケーション情報」を参照してください。

HTTP モニタリソースはクライアント認証に未対応です。

HTTP モニタリソースの DIGEST 認証で使用可能なアルゴリズムは MD5 です。

6.18.3. HTTP モニタリソースの監視方法

HTTP モニタリソースは、以下の監視を行います。
サーバ上の HTTP デーモンに接続し、HTTP リクエストの発行により、HTTP デーモンの監視を実行します。
監視の結果、以下の場合に異常とみなします。
  1. HTTP デーモンへの接続で異常が通知された場合

  2. HTTP リクエストの発行に対する応答メッセージが "HTTP/" で始まっていない場合

  3. HTTP リクエストの発行に対する応答のステータスコードが400、500番台の場合 (Request URI に既定値以外の URI を指定した場合)

6.19. IMAP4 モニタリソースの設定

IMAP4 モニタリソースは、サーバ上で動作する IMAP4 のサービスを監視するモニタリソースです。IMAP4 プロトコルを監視するものであり、特定のアプリケーションの監視ではありません。そのため、IMAP4 プロトコルを実装するさまざまなアプリケーションの監視を行うことができます。

6.19.1. 監視(固有) タブ

IPアドレス (79バイト以内)

監視する IMAP4 サーバの IP アドレスを設定します。必ず設定してください。

通常は自サーバ上で動作する IMAP4 サーバに接続しますので、ループバックアドレス(127.0.0.1)を設定しますが、IMAP4 サーバの設定で接続可能なアドレスを制限している場合は、接続可能なアドレスを設定します。

既定値 : 127.0.0.1

ポート番号 (1~65535)

監視する IMAP4 のポート番号を設定します。必ず設定してください。

既定値 : 143

ユーザ名(255バイト以内)

IMAP4 にログインする際のユーザ名を設定します。

既定値 : なし

パスワード(189バイト以内)

IMAP4 にログインする際のパスワードを設定します。

既定値 : なし

認証方式

IMAP4 にログインするときの認証方式を選択します。使用している IMAP4 の設定に合わせる必要があります。

  • AUTHENTICATE LOGIN (既定値)
    AUTHENTICATE LOGINコマンドを使用した暗号化認証方式です。
  • LOGIN
    LOGIN コマンドを使用した平文方式です。

6.19.2. IMAP4 モニタリソースの注意事項

監視の対象リソースには、IMAP4 サーバを起動する exec リソースなどを指定してください。対象リソースの活性後、監視を開始しますが、対象リソースの活性直後に IMAP4 サーバがすぐに動作できない場合などは、[監視開始待ち時間] で調整してください。

監視動作ごとに IMAP4 サーバ自体が動作ログなどを出力することがありますが、その制御は、IMAP4 サーバ側の設定で適宜行ってください。

6.19.3. IMAP4 モニタリソースの監視方法

IMAP4 モニタリソースは、以下の監視を行います。
IMAP4 サーバに接続して動作確認コマンドを実行します。
監視の結果、以下の場合に異常とみなします。
  1. IMAP4 サーバヘの接続に失敗した場合

  2. コマンドに対する応答で異常が通知された場合

6.20. MySQL モニタリソースの設定

MySQL モニタリソースは、サーバ上で動作する MySQL のデータベースを監視するモニタリソースです。

6.20.1. 監視(固有) タブ

監視レベル

選択肢の中から1つを選択します。必ず設定してください。

  • レベル 1 (selectでの監視)
    監視テーブルに対して参照のみを行う監視です。監視テーブルに対して実行するSQL文は( select )です。
  • レベル 2 (update / selectでの監視)
    監視テーブルに対して更新も行う監視です。監視テーブルに対して実行するSQL文は( update / select )です。
    監視開始時に監視テーブルを自動で作成した場合、監視テーブルに対して実行するSQL文は( create / insert )です。
  • レベル 3 (毎回create / dropも行う)
    監視テーブルに対しての更新に加え監視テーブルの作成・削除も毎回行います。監視テーブルに対して実行するSQL文は( create / insert / select / drop )です。

既定値 : レベル 2 (update/selectでの監視)

データベース名 (255バイト以内)

監視するデータベース名を設定します。必ず設定してください。

既定値 : なし

IPアドレス (79バイト以内)

接続するサーバのIPアドレスを設定します。必ず設定してください。

既定値 : 127.0.0.1

ポート番号 (1~65535)

接続する際のポート番号を設定します。必ず設定してください。

既定値 : 3306

ユーザ名 (255バイト以内)

データベースにログインする際のユーザ名を設定します。必ず設定してください。

指定したデータベースにアクセス可能な MySQL ユーザを指定してください。

既定値 : なし

パスワード (255バイト以内)

データベースにログインする際のパスワードを設定します。

既定値 : なし

監視テーブル名 (255バイト以内)

データベース上に作成する監視用テーブルの名前を設定します。必ず設定してください。

テーブルの作成・削除を行いますので、運用に使用しているテーブル名と重ならないように注意してください。また、SQL 文の予約語と重ならないようにしてください。 データベースの仕様により監視テーブル名に設定できない文字があります。詳細はデータベースの仕様を確認してください。

既定値 : mysqlwatch

ストレージエンジン

監視用Table の作成用ストレージエンジンを設定します。必ず設定してください。

既定値 : InnoDB

ライブラリパス (1023バイト以内)

MySQL のライブラリパスを設定します。必ず設定してください。

既定値 : /usr/lib64/mysql/libmysqlclient.so.20

6.20.2. MySQLモニタリソースの注意事項

動作確認済みの MySQL のバージョンについては、『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「監視オプションの動作確認済アプリケーション情報」を参照してください。

本モニタリソースは、MySQL の libmysqlclient のライブラリを利用して、MySQL の監視を行っています。 本モニタリソースが異常になる場合は、MySQL のライブラリのインストールディレクトリにlibmysqlclient.so.xx が存在することを確認してください。

パラメータ指定値が、監視を行う MySQLの環境と異なる場合、Cluster WebUI のアラートログに、エラー内容を示すメッセージが表示されますので、環境を確認してください。

次項の「6.20.3. MySQL モニタリソースの監視方法」で説明する監視レベルについて、以下の点にご注意ください。
「レベル1」で監視開始時に監視テーブルが無い場合、監視エラーになります。下記の監視テーブルの作成を行ってください。
「レベル2」で監視開始時に監視テーブルが無い場合、CLUSTERPRO が監視テーブルを自動で作成します。このとき Cluster WebUI のアラートログに監視テーブルがない旨のメッセージが表示されます。
「レベル3」での監視は毎回監視テーブルの作成・削除を行うため「レベル1」「レベル2」より監視の負荷が高くなります。

選択する監視レベル

監視テーブルの事前作成

レベル1 (selectでの監視)

必要あり

レベル2 (update / selectでの監視)

必要なし

レベル3 (毎回create / dropも行う)

必要なし

監視テーブルの作成は以下の手順で行えます。

SQL文で作成する場合(以下の例は監視テーブル名をmysqlwatchとする場合)

sql> create table mysqlwatch (num int not null primary key) ENGINE=<エンジン>;
sql> insert into mysqlwatch values(0);
sql> commit;

CLUSTERPROのコマンドを利用する場合

前提条件として、モニタリソースの設定が完了している必要があります。

clp_mysqlw --createtable -n <MySQLモニタリソース名>

作成した監視テーブルを手動で削除する場合、下記のコマンドを実行してください:

clp_mysqlw --deletetable -n <MySQLモニタリソース名>

6.20.3. MySQL モニタリソースの監視方法

MySQL モニタリソースは、以下の監視レベルから選択した監視レベルに応じた監視を行います。

  • レベル 1 (selectでの監視)
    監視テーブルに対して参照のみを行う監視です。監視テーブルに対して実行するSQL文は( select )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

  • レベル 2 (update/selectでの監視)
    監視テーブルに対して更新も行う監視です。SQL 文の実行により最大 10 桁の数値データの書き込みと読み込みを実行します。監視テーブルに対して実行する SQL 文は( update / select )です。
    監視開始時に監視テーブルを自動で作成した場合、監視テーブルに対して実行するSQL文は( create / insert )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

    2. 書き込んだデータと読み込んだデータが一致していない場合

  • レベル 3 (毎回 create / drop も行う)
    監視テーブルに対しての更新に加え監視テーブルの作成・削除も毎回行います。SQL 文の実行により最大 10 桁の数値データの書き込みと読み込みを実行します。監視テーブルに対して実行する SQL 文は( create / insert / select / drop )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

    2. 書き込んだデータと読み込んだデータが一致していない場合

6.21. NFS モニタリソースの設定

NFSモニタリソースは、サーバ上で動作するNFSのファイルサーバを監視するモニタリソースです。

6.21.1. 監視(固有) タブ

共有ディレクトリ (1023バイト以内)

ファイル共有するディレクトリを設定します。必ず設定してください。

既定値 : なし

NFS サーバ(255バイト以内)

NFS 監視を行うサーバの IP アドレスを設定します。必ず設定してください。

既定値 : 127.0.0.1

NFS バージョン

NFS 監視を行う NFS のバージョンを選択肢の中から1つ選択します。必ず設定してください。RHEL 7 では NFS バージョンv2 はサポートされていません。

  • v2
    NFSバージョンv2を監視します。
  • v3
    NFSバージョンv3を監視します。
  • v4
    NFSバージョンv4を監視します。

既定値 : v4

6.21.2. NFS モニタリソースの動作環境

NFS モニタリソースを利用するためには、以下のサービスが起動している必要があります。

  • nfs

  • rpcbind

  • nfslock (NFS v4では不要)

6.21.3. NFS モニタリソースの注意事項

動作確認済みの NFS のバージョンについては、『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「監視オプションの動作確認済アプリケーション情報」を参照してください。

監視する共有ディレクトリについては、自サーバから接続できるように exports ファイルを設定してください。

[監視(固有)] タブ - [NFSバージョン] で指定したバージョンの nfsd およびその nfsd に対応する mountd の消滅を検出すると異常とみなします。nfsd に対応する mountd は以下の通りです。

nfsdバージョン

mountdバージョン

v2(udp)

v1(tcp)あるいはv2(tcp)

v3(udp)

v3(tcp)

v4(tcp)

-

6.21.4. NFS モニタリソースの監視方法

NFS モニタリソースは、以下の監視を行います。
NFS サーバに接続して [NFS] テストコマンドを実行します。
監視の結果、以下の場合に異常とみなします。
  1. NFS サービスへの要求に対する応答結果が異常な場合

  2. mountd が消滅した場合(NFS v4を除く)

  3. nfsd が消滅した場合

  4. rpcbind サービスが停止した場合

  5. export されている領域が消滅した場合(NFS v4を除く)

6.22. ODBC モニタリソースの設定

ODBC モニタリソースは、サーバ上で動作する ODBC のデータベースを監視するモニタリソースです。

6.22.1. 監視(固有) タブ

監視レベル

選択肢の中から 1つを選択します。必ず設定してください。

  • レベル 1 (selectでの監視)
    監視テーブルに対して参照のみを行う監視です。監視テーブルに対して実行するSQL文は( select )です。
  • レベル 2 (update/selectでの監視)
    監視テーブルに対して更新も行う監視です。監視テーブルに対して実行するSQL文は( update / select )です。
    監視開始時に監視テーブルを自動で作成した場合、監視テーブルに対して実行するSQL文は( create / insert )です。
  • レベル 3 (毎回create/dropも行う)
    監視テーブルに対しての更新に加え監視テーブルの作成・削除も毎回行います。監視テーブルに対して実行するSQL文は( create / insert / select / drop )です。

既定値 : レベル2(update/selectでの監視)

データソース名 (255 バイト以内)

監視するデータソースを設定します。必ず設定してください。

既定値 : なし

ユーザ名 (255 バイト以内)

データベースにログインする際のユーザ名を設定します。 odbc.iniでユーザ名を設定している場合は、指定する必要はありません。

既定値 : なし

パスワード (255 バイト以内)

データベースにログインする際のパスワードを設定します。

既定値 : なし

監視テーブル名 (255 バイト以内)

データベース上に作成する監視用テーブルの名前を設定します。必ず設定してください。
テーブルの作成・削除を行いますので、運用に使用しているテーブル名と重ならないように注意してください。また、SQL 文の予約語と重ならないようにしてください。
データベースの仕様により監視テーブル名に設定できない文字があります。詳細はデータベースの仕様を確認してください。

既定値 : odbcwatch

メッセージ文字コード

データベースのメッセージの文字コードを設定します。

既定値 : UTF-8

6.22.2. ODBC モニタリソースの注意事項

監視処理は unixODBC ドライバマネージャを利用しているため、あらかじめ監視するデータベースの ODBC ドライバをインストールと odbc.ini へデータソースの設定を行ってください。

パラメータ指定値が、監視を行うデータベースの環境と異なる場合、Cluster WebUI のアラートログにエラー内容を示すメッセージが表示されますので、環境を確認してください。

次項の「ODBCモニタリソースの監視方法」で説明する監視レベルについて、以下の点にご注意ください。
「レベル1」で監視開始時に監視テーブルが無い場合、監視エラーになります。下記の監視テーブルの作成を行ってください。
「レベル2」で監視開始時に監視テーブルが無い場合、CLUSTERPROが監視テーブルを自動で作成します。このときCluster WebUI のアラートログに監視テーブルがない旨のメッセージが表示されます。
「レベル3」での監視は毎回監視テーブルの作成・削除を行うため「レベル1」「レベル2」より監視の負荷が高くなります。

選択する監視レベル

監視テーブルの事前作成

レベル1 (selectでの監視)

必要あり

レベル2 (update/selectでの監視)

必要なし

レベル3 (毎回create/dropも行う)

必要なし

監視テーブルの作成は以下の手順で行えます。
監視テーブル名は英数字、一部記号(アンダースコア等)が指定できます。

(以下の例は監視テーブル名を odbcwatch とする場合)

sql> create table odbcwatch (num int not null primary key);
sql> insert into odbcwatch values(0);
sql> commit;

CLUSTERPRO のコマンドを利用する場合

前提条件として、モニタリソースの設定が完了している必要があります。

clp_odbcw --createtable -n <ODBCモニタリソース名>

作成した監視テーブルを手動で削除する場合、下記のコマンドを実行してください:

clp_odbcw --deletetable -n <ODBCモニタリソース名>

6.22.3. ODBC モニタリソースの監視方法

ODBCモニタリソースは、以下の監視レベルから選択した監視レベルに応じた監視を行います。

  • レベル 1 (selectでの監視)
    監視テーブルに対して参照のみを行う監視です。監視テーブルに対して実行するSQL文は( select )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続やSQL文の発行に対する応答で異常が通知された場合

  • レベル 2 (update/selectでの監視)
    監視テーブルに対して更新も行う監視です。SQL文の実行により最大10桁の数値データの書き込みと読み込みを実行します。監視テーブルに対して実行するSQL文は( update / select )です。
    監視開始時に監視テーブルを自動で作成した場合、監視テーブルに対して実行するSQL文は( create / insert )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

    2. 書き込んだデータと読み込んだデータが一致していない場合

  • レベル 3 (毎回create/dropも行う)
    監視テーブルに対しての更新に加え監視テーブルの作成・削除も毎回行います。SQL 文の実行により最大 10 桁の数値データの書き込みと読み込みを実行します。監視テーブルに対して実行する SQ L文は( create / insert / select / drop )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

    2. 書き込んだデータと読み込んだデータが一致していない場合

6.23. Oracle モニタリソースの設定

Oracle モニタリソースは、サーバ上で動作する Oracle のデータベースを監視するモニタリソースです。

6.23.1. 監視(固有) タブ

監視方式

監視対象とする Oracle の機能を選択します。

  • リスナーとインスタンスを監視(既定値)
    監視レベルに設定されたレベルに応じ、データベースへの接続、参照、更新の動作を監視します。
  • リスナーのみ監視
    リスナーが動作しているかを Oracle のコマンド( tnsping )を実行し監視します。モニタリソースプロパティで ORACLE_HOME を設定しておく必要があります。
    ORACLE_HOME が設定されていない場合、接続文字列に指定されている先に対して接続処理の動作のみ監視します。接続異常時にリスナーのサービス再起動による復旧を試みる場合に使用します。
    本設定を選択した場合、監視レベルの設定は無視されます。
  • インスタンスのみ監視
    データベースに対しリスナーを経由せず直接接続(BEQ接続)を行い、監視レベルに設定されたレベルに応じ、データベースへの接続、参照、更新の動作を監視します。モニタリソースプロパティで ORACLE_HOME を設定しておく必要があります。この方式はリスナーを経由せずインスタンスを直接監視し復旧動作を設定するために使用します。
    監視対象が Oracle12c のマルチテナント構成のデータベースの場合、BEQ 接続での監視はできません。
    ORACLE_HOME が設定されていない場合、接続文字列に指定されている先に対して接続を行い、接続処理で異常があった場合は無視します。この方式は、[リスナーのみ監視]方式の Oracle モニタリソースと併用して、接続処理以外の異常に対する復旧動作を設定するために使用します。

監視レベル

選択肢の中から 1 つを選択します。監視方式を「リスナーのみ監視」としている場合には本設定は無視されます。

  • レベル 0 (データベースステータス)
    Oracle の管理テーブル (V$INSTANCE表) を参照し DB の状態 (インスタンスの状態)を確認します。監視テーブルに対しての SQL 文実行は行わない簡易的な監視です。監視テーブルに対しての SQL 文実行は行わない簡易的な監視です。
  • レベル 1 (selectでの監視)
    監視テーブルに対して参照のみを行う監視です。監視テーブルに対して実行する SQL文は( select )です。
  • レベル 2 (update/selectでの監視)
    監視テーブルに対して更新も行う監視です。監視テーブルに対して実行する SQL 文は( update / select )です。
    監視開始時に監視テーブルを自動で作成した場合、監視テーブルに対して実行する SQL 文は( create / insert )です。
  • レベル 3 (毎回create / dropも行う)
    監視テーブルに対しての更新に加え監視テーブルの作成・削除も毎回行います。監視テーブルに対して実行するSQL文は( create / insert / select / drop )です。

既定値 : レベル 2 (update / selectでの監視)

接続文字列 (255バイト以内)

監視するデータベースに対応する接続文字列を設定します。必ず設定してください。
監視方式を「インスタンスのみの監視」とした場合には ORACLE_SID を設定します。

監視方式

ORACLE_HOME

接続文字列

監視レベル

リスナーとインスタンスを監視

入力不要

接続文字列を指定

設定に応じたレベルの監視

リスナーのみ監視

入力した場合、Oracleのコマンドを使用した監視

接続文字列を指定

レベル設定は無視される

未入力の場合、リスナーを経由したインスタンスへの接続確認

接続文字列を指定

レベル設定は無視される

インスタンスのみ監視

入力した場合、BEQ接続によるインスタンスの確認

ORACLE_SIDを指定する

設定に応じたレベルの監視

未入力の場合、リスナーを経由したインスタンスの確認となる

接続文字列を指定

設定に応じたレベルの監視

既定値 : 接続文字列の既定値はなし

ユーザ名(255バイト以内)

データベースにログインする際のユーザ名を設定します。必ず設定してください。
指定したデータベースにアクセス可能なOracleユーザを指定してください。

既定値 :sys

パスワード(255バイト以内)

データベースにログインする際のパスワードを設定します。

既定値 : なし

認証方式

データベースの認証方式を設定します。

既定値 : SYSDBA

監視テーブル名 (255バイト以内)

データベース上に作成する監視用テーブルの名前を設定します。必ず設定してください。
テーブルの作成・削除を行いますので、運用に使用しているテーブル名と重ならないように注意してください。また、SQL 文の予約語と重ならないようにしてください。
データベースの仕様により監視テーブル名に設定できない文字があります。詳細はデータベースの仕様を確認してください。

既定値 : orawatch

ORACLE_HOME (255バイト以内)

ORACLE_HOME に設定しているパス名を指定します。[/] で始まる必要があります。監視方式で「リスナーのみ監視」「インスタンスのみ監視」を選択したときに使用されます。

既定値 : なし

文字コード

Oracle のキャラクタ・セットを設定します。必ず設定してください。

既定値 : JAPANESE_JAPAN.JA16EUC

ライブラリパス (1023バイト以内)

Oracle Call Interface(OCI)用のライブラリパスを設定します。必ず設定してください。

既定値 : /u01/app/oracle/product/12.2.0/dbhome_1/lib/libclntsh.so.12.1

障害発生時にアプリケーションの詳細情報を採取する

本機能を有効にした場合、Oracleモニタリソースが異常を検出すると、Oracleの詳細情報が採取されます。詳細情報は最大5回採取されます。

注釈

採取中にクラスタ停止などにより、oracleサービスを停止させた場合、正しい情報が取得できない可能性があります。

既定値 : 無効

採取タイムアウト

詳細情報採取時のタイムアウト値を設定します。

既定値 : 600

Oracle の初期化中またはシャットダウン中をエラーにする

本機能を有効にした場合、Oracle の初期化中またはシャットダウン中の状態を検出すると、直ちに監視エラーになります。 Oracle Clusterware 等の連携で Oracle が運用中に自動再起動される場合、本機能を無効にしてください。Oracle の初期化中またはシャットダウン中の状態でも監視正常になります。 ただし 1 時間以上 Oracle の初期化中またはシャットダウン中の状態が継続すると監視エラーになります。

既定値 : 無効

6.23.2. Oracle モニタリソースの注意事項

動作確認済みの Oracle のバージョンについては、『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「監視オプションの動作確認済アプリケーション情報」を参照してください。

本モニタリソースは、Oracle のインターフェイス (Oracle Call Interface) を利用して、Oracleの監視を行っています。そのため、監視を行うサーバ上に、インターフェイス用のライブラリ(libclntsh.so) がインストールされている必要があります。

パラメータで指定した接続文字列・ユーザ名・パスワードなどの値が、監視を行う Oracle の環境と異なる場合、Oracle の監視を行うことができません。各エラー内容を示すメッセージが表示されますので、環境を確認してください。

パラメータのユーザ名に指定するユーザについて、デフォルトでは sys となっていますが、別途監視用ユーザを作成する場合、各監視レベルにおいて以下のアクセス権付与が必要です。(sysdba権限を与えない場合)

監視レベル

必要な権限

レベル0(データベースステータス)

V$INSTANCEへのSELECT権限

レベル1(selectでの監視)

監視テーブルへのSELECT権限

レベル2(update/selectでの監視)

CREATE TABLE/DROP ANY TABLE/監視テーブルへのINSERT権限/監視テーブルへのUPDATE権限/監視テーブルへのSELECT権限

レベル3(毎回create/dropも行う)

CREATE TABLE/DROP ANY TABLE/監視テーブルへのINSERT権限/監視テーブルへのUPDATE権限/監視テーブルへのSELECT権限

管理者ユーザの認証方式が初期化パラメータ・ファイルでREMOTE_LOGIN_PASSWORDFILE を NONE に設定した OS 認証のみである場合、パラメータのユーザ名には SYSDBA 権限のないデータベースユーザ名を指定して下さい。
SYSDBA 権限のあるデータベースユーザを指定した場合、本モニタリソース起動時にエラーとなり監視を行うことができません。

ユーザ名に sys を指定すると Oracle の監査ログが出力されることがあります。監査ログを大量に出力したくない場合、 sys 以外のユーザ名を指定してください。

データベース作成時のキャラクタ・セットは、OS でサポートされているキャラクタ・セットに合わせてください。本モニタリソースの「文字コード」は、Oracle からのエラーメッセージが発生したときに、CLUSTERPRO のCluster WebUI のアラートログや OS の messages(syslog) に表示させる言語を選択してください。
ただし、データベース接続時のエラー (ユーザ名不正など) については、上記の対応を行っても正しく表示されないことがあります。
NLS パラメータ、NLS_LANG の設定、詳細な内容については、Oracle 社のマニュアル「グローバリゼーション・サポート・ガイド」を参照してください。

「文字コード」の設定は Oracle 自体の動作には影響を与えません。

CLUSTERPRO が OS の messages(syslog) へ 1 バイト文字以外 (ANK文字以外) をエントリするときには常に EUC コードでエントリします。従ってご使用のディストリビューションによっては messages(syslog) の文字コードが EUC でないため文字化けが発生し正しく表示されないことがあります。
(Cluster WebUI のアラートログについては問題ありません。)

文字化けを発生させたくない場合には「文字コード」の設定にAMERICAN_AMERICA.US7ASCIIまたはAMERICAN_AMERICA.UTF8 (ANK文字を使用する言語)を選択してください。

設定例

  • 日本語で表示させたい場合
    JAPANESE_JAPAN で始まる文字セットを選択してください。
  • 英語で表示させたい場合
    AMERICAN_AMERICA で始まる文字セットを選択してください。
次項の「Oracleモニタリソースの監視方法」で説明する監視レベルについて、以下の点にご注意ください。
「レベル1」で監視開始時に監視テーブルが無い場合、監視エラーになります。下記の監視テーブルの作成を行ってください。
「レベル2」で監視開始時に監視テーブルが無い場合、CLUSTERPROが監視テーブルを自動で作成します。このとき Cluster WebUI のアラートログに監視テーブルがない旨のメッセージが表示されます。
「レベル3」での監視は毎回監視テーブルの作成・削除を行うため「レベル1」「レベル2」より監視の負荷が高くなります。またOracleのリソースの使用量が増え続けるため、定期的にOracleインスタンスを再起動する運用以外での「レベル3」の監視は推奨しません。

選択する監視レベル

監視テーブルの事前作成

レベル0 (データベースステータス)

必要なし

レベル1 (selectでの監視)

必要あり

レベル2 (update/selectでの監視)

必要なし

レベル3 (毎回create/dropも行う)

必要なし

監視テーブルの作成は以下の手順で行えます。

SQL 文で作成する場合(以下の例は監視テーブル名をorawatchとする場合)

sql> create table orawatch (num number(11,0) primary key);
sql> insert into orawatch values(0);
sql> commit;

※パラメータのユーザ名に指定するユーザのスキーマに作成してください。

CLUSTERPRO のコマンドを利用する場合

前提条件として、モニタリソースの設定が完了している必要があります。

clp_oraclew --createtable -n <Oracleモニタリソース名>

※パラメータのユーザ名に指定するユーザがsys以外でsysdba権限を付与しないユーザの場合はCREATE TABLE権限が必要です。

作成した監視テーブルを手動で削除する場合、下記のコマンドを実行してください:

clp_oraclew --deletetable -n <Oracleモニタリソース名>

6.23.3. Oracle モニタリソースの監視方法

Oracle モニタリソースは、以下の監視レベルから選択した監視レベルに応じた監視を行います。

  • レベル 0 (データベースステータス)
    Oracle の管理テーブル(V$INSTANCE表)を参照し DB の状態(インスタンスの状態)を確認します。監視テーブルに対しての SQL 文実行は行わない簡易的な監視です。
    監視の結果以下の場合に異常とみなします。
    1. Oracle の管理テーブル( V$INSTANCE 表) のステータス( status )が未起動状態( MOUNTED,STARTED )の場合

    2. Oracle の管理テーブル( V$INSTANCE 表)のデータベースステータス( database_status )が未起動( SUSPENDED,INSTANCE RECOVERY )の場合

  • レベル 1 (selectでの監視)
    監視テーブルに対して参照のみを行う監視です。監視テーブルに対して実行するSQL文は( select )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

  • レベル 2 (update/selectでの監視)
    監視テーブルに対して更新も行う監視です。SQL 文の実行により最大 11 桁の数値データの書き込みと読み込みを実行します。監視テーブルに対して実行するSQL文は( update / select )です。
    監視開始時に監視テーブルを自動で作成した場合、監視テーブルに対して実行する SQL 文は( create / insert )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

    2. 書き込んだデータと読み込んだデータが一致していない場合

  • レベル 3 (毎回create/dropも行う)
    監視テーブルに対しての更新に加え監視テーブルの作成・削除も毎回行います。SQL文の実行により最大 11 桁の数値データの書き込みと読み込みを実行します。監視テーブルに対して実行する SQL 文は( create / insert / select / drop )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

    2. 書き込んだデータと読み込んだデータが一致していない場合

6.24. POP3 モニタリソースの設定

POP3 モニタリソースは、サーバ上で動作する POP3 のサービスを監視するモニタリソースです。POP3 プロトコルを監視するものであり、特定のアプリケーションの監視ではありません。そのため、POP3 プロトコルを実装するさまざまなアプリケーションの監視を行うことができます。

6.24.1. 監視(固有) タブ

IP アドレス (79バイト以内)

監視する POP3 サーバの IP アドレスを設定します。必ず設定してください。

通常は自サーバ上で動作する POP3 サーバに接続しますので、ループバックアドレス(127.0.0.1)を設定しますが、POP3 サーバの設定で接続可能なアドレスを制限している場合は、接続可能なアドレス(フローティング IP アドレス等)を設定します。

既定値 : 127.0.0.1

ポート番号 (1~65535)

監視する POP3 のポート番号を設定します。必ず設定してください。

既定値 : 110

ユーザ名 (255バイト以内)

POP3にログインする際のユーザ名を設定します。

既定値 : なし

パスワード (255バイト以内)

POP3 にログインする際のパスワードを設定します。

既定値 : なし

認証方式

POP3 にログインするときの認証方式を選択します。使用している POP3 の設定に合わせる必要があります。

  • APOP (既定値)
    APOPコマンドを使用した暗号化認証方式です。
  • USER/PASS
    USER/PASSコマンドを使用した平文方式です。

6.24.2. POP3 モニタリソースの注意事項

監視の対象リソースには、POP3 サーバを起動する exec リソースなどを指定してください。対象リソースの活性後、監視を開始しますが、対象リソースの活性直後に POP3 がすぐに動作できない場合などは、[監視開始待ち時間]で調整してください。

監視動作ごとに POP3 自体が動作ログなどを出力することがありますが、その制御は、POP3 側の設定で適宜行ってください。

6.24.3. POP3 モニタリソースの監視方法

POP3 モニタリソースは、以下の監視を行います。
POP3 サーバに接続して動作確認コマンドを実行します。
監視の結果、以下の場合に異常とみなします。
  1. POP3 サーバヘの接続に失敗した場合

  2. コマンドに対する応答で異常が通知された場合

6.25. PostgreSQL モニタリソースの設定

PostgreSQL モニタリソースは、サーバ上で動作する PostgreSQL のデータベースを監視するモニタリソースです。

6.25.1. 監視(固有) タブ

監視レベル

選択肢の中から 1 つを選択します。必ず設定してください。

  • レベル 1 (selectでの監視)
    監視テーブルに対して参照のみを行う監視です。監視テーブルに対して実行する SQL 文は( select )です。
  • レベル 2 (update/selectでの監視)
    監視テーブルに対して更新も行う監視です。監視テーブルに対して実行する SQL 文は( update / select / reindex / vacuum )です。
    監視開始時に監視テーブルを自動で作成した場合、監視テーブルに対して実行するSQL文は( create / insert )です。
  • レベル 3 (毎回create / dropも行う)
    監視テーブルに対しての更新に加え監視テーブルの作成・削除も毎回行います。監視テーブルに対して実行する SQL 文は( create / insert / select / reindex / drop / vacuum )です。

既定値 : レベル 2 (update/selectでの監視)

データベース名 (255バイト以内)

監視するデータベース名を設定します。必ず設定してください。

既定値 : なし

IP アドレス (79バイト以内)

接続するサーバの IP アドレスを設定します。必ず設定してください。

既定値 : 127.0.0.1

ポート番号 (1~65535)

接続する際のポート番号を設定します。必ず設定してください。

既定値 : 5432

ユーザ名(255バイト以内)

データベースにログインする際のユーザ名を設定します。必ず設定してください。
指定したデータベースにアクセス可能なPostgreSQLユーザを指定してください。

既定値 : postgres

パスワード(255バイト以内)

データベースにログインする際のパスワードを設定します。

既定値 : なし

監視テーブル名(255バイト以内)

データベース上に作成する監視用テーブルの名前を設定します。必ず設定してください。
テーブルの作成・削除を行いますので、運用に使用しているテーブル名と重ならないように注意してください。
また、SQL文の予約語と重ならないようにしてください。
データベースの仕様により監視テーブル名に設定できない文字があります。詳細はデータベースの仕様を確認してください。

既定値 : psqlwatch

ライブラリパス(1023バイト以内)

PostgreSQLのライブラリパスを設定します。必ず設定してください。

既定値 : /opt/PostgreSQL/10/lib/libpq.so.5.10

PostgreSQLの初期化中またはシャットダウン中をエラーにする

本機能を有効にした場合、PostgreSQL の初期化中またはシャットダウン中の状態を検出すると、直ちに監視エラーになります。本機能を無効にした場合、PostgreSQL の初期化中またはシャットダウン中の状態でも監視正常になります。ただし1時間以上PostgreSQLの初期化中またはシャットダウン中の状態が継続すると監視エラーになります。

既定値 : 有効

6.25.2. PostgreSQL モニタリソースの注意事項

動作確認済みの PostgreSQL のバージョンについては、『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「監視オプションの動作確認済アプリケーション情報」を参照してください。

本モニタリソースは、PostgreSQLのlibpqのライブラリを利用して、PostgreSQLの監視を行っています。 本モニタリソースが異常になる場合は、PostgreSQLのlibpqライブラリが存在するパスへアプリケーションのライブラリパスを設定してください。

パラメータ指定値が、監視を行うPostgreSQLの環境と異なる場合、Cluster WebUI のアラートログにエラー内容を示すメッセージが表示されますので、環境を確認してください。

クライアント認証について、本モニタリソースではpg_hba.confファイルに設定可能な以下の認証方式が動作確認済みとなっています。 trust、md5、password

本モニタリソースを利用すると PostgreSQL 側のログに下記のようなメッセージが出力されます。監視処理に伴って出力されるメッセージで、問題はありません。

YYYY-MM-DD hh:mm:ss JST moodle moodle LOG: statement: DROP TABLE psqlwatch
YYYY-MM-DD hh:mm:ss JST moodle moodle ERROR: table "psqlwatch" does not exist
YYYY-MM-DD hh:mm:ss JST moodle moodle STATEMENT: DROP TABLE psqlwatch
YYYY-MM-DD hh:mm:ss JST moodle moodle LOG: statement: CREATE TABLE psqlwatch (num INTEGER NOT NULL PRIMARY KEY)
YYYY-MM-DD hh:mm:ss JST moodle moodle NOTICE: CREATE TABLE / PRIMARY KEY will create implicit index "psqlwatch_pkey" for table "psql watch"
YYYY-MM-DD hh:mm:ss JST moodle moodle LOG: statement: DROP TABLE psqlwatch
次項の「PostgreSQLモニタリソースの監視方法」で説明する監視レベルについて、以下の点にご注意ください。
「レベル1」で監視開始時に監視テーブルが無い場合、監視エラーになります。下記の監視テーブルの作成を行ってください。
「レベル2」で監視開始時に監視テーブルが無い場合、CLUSTERPROが監視テーブルを自動で作成します。このとき Cluster WebUI のアラートログに監視テーブルがない旨のメッセージが表示されます。
「レベル3」での監視は毎回監視テーブルの作成・削除を行うため「レベル1」「レベル2」より監視の負荷が高くなります。

選択する監視レベル

監視テーブルの事前作成

レベル1(selectでの監視)

必要あり

レベル2(update/selectでの監視)

必要なし

レベル3(毎回create/dropも行う)

必要なし

監視テーブルの作成は以下の手順で行えます。

SQL文で作成する場合(以下の例は監視テーブル名をpsqlwatchとする場合)

sql> CREATE TABLE psqlwatch (num INTEGER NOT NULL PRIMARY KEY);
sql> INSERT INTO psqlwatch VALUES(0) ;
sql> COMMIT;

CLUSTERPROのコマンドを利用する場合

前提条件として、モニタリソースの設定が完了している必要があります。

clp_psqlw --createtable -n <PostgreSQLモニタリソース名>

作成した監視テーブルを手動で削除する場合、下記のコマンドを実行してください:

clp_psqlw --deletetable -n <PostgreSQLモニタリソース名>

6.25.3. PostgreSQL モニタリソースの監視方法

PostgreSQLモニタリソースは、以下の監視レベルから選択した監視レベルに応じた監視を行います。

  • レベル 1 (selectでの監視)
    監視テーブルに対して参照のみを行う監視です。監視テーブルに対して実行するSQL文は( select )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続やSQL文の発行に対する応答で異常が通知された場合

  • レベル 2 (update / selectでの監視)
    監視テーブルに対して更新も行う監視です。SQL文の実行により最大10桁の数値データの書き込みと読み込みを実行します。監視テーブルに対して実行するSQL文は( update / select / reindex / vacuum )です。
    監視開始時に監視テーブルを自動で作成した場合、監視テーブルに対して実行するSQL文は( create / insert )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続やSQL文の発行に対する応答で異常が通知された場合

    2. 書き込んだデータと読み込んだデータが一致していない場合

  • レベル 3 (毎回create / dropも行う)
    監視テーブルに対しての更新に加え監視テーブルの作成・削除も毎回行います。SQL文の実行により最大10桁の数値データの書き込みと読み込みを実行します。監視テーブルに対して実行するSQL文は( create / insert / select / reindex / drop / vacuum )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続やSQL文の発行に対する応答で異常が通知された場合

    2. 書き込んだデータと読み込んだデータが一致していない場合

6.26. Samba モニタリソースの設定

Samba モニタリソースは、サーバ上で動作する samba のファイルサーバを監視するモニタリソースです。

6.26.1. 監視(固有) タブ

共有名 (255バイト以内)

監視を行う samba サーバの共有名を設定します。必ず設定してください。

既定値 : なし

IPアドレス (79バイト以内)

samba サーバの IP アドレスを設定します。必ず設定してください。

既定値 : 127.0.0.1

ポート番号 (1~65535)

sambaデーモンが使用しているポート番号を設定します。必ず設定してください。libsmbclient のバージョンが 3 以下の場合(例.RHEL 6 に同梱の libsmbclient.so)、[ポート番号]は139もしくは445しか指定できません。smb.conf の smb ports も同じ値を指定してください。

既定値 : 139

ユーザ名(255バイト以内)

samba サービスにログインする際のユーザ名を設定します。必ず設定してください。

既定値 : なし

パスワード(255バイト以内)

samba サービスにログインする際のパスワードを設定します。

既定値 : なし

6.26.2. Samba モニタリソースの注意事項

動作確認済みの samba のバージョンについては、『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「監視オプションの動作確認済アプリケーション情報」を参照してください。

本モニタリソースが異常になる場合は、パラメータの設定値と samba の環境が一致していない可能性がありますので、環境を確認してください。

監視する共有名については、自サーバから接続できるように smb.conf を設定してください。また、smb.conf ファイルの security パラメータが share の場合は、ゲスト接続を有効にしてください。

ファイル共有、プリンタ共有以外の samba の機能に関しては監視を行いません。

samba の認証モードが Domain もしくは Server の場合、監視サーバ上で smbmount を実行すると、本モニタリソースのパラメータで指定したユーザ名で mount されることがあります。

6.26.3. Samba モニタリソースの監視方法

Samba モニタリソースは、内部バージョン 4.1.0-1 より共有ライブラリの libsmbclient.so.0 を利用しています。
Samba モニタリソースは、以下の監視を行います。
samba サーバに接続して samba サーバのリソースに対する tree connection の確立を確認します。
監視の結果、以下の場合に異常とみなします。
  1. samba サービスへの要求に対する応答内容が不正な場合

6.27. SMTP モニタリソースの設定

SMTP モニタリソースは、サーバ上で動作する SMTP デーモンを監視するモニタリソースです。

6.27.1. 監視(固有) タブ

IPアドレス(79バイト以内)

監視するSMTPサーバのIPアドレスを設定します。必ず設定してください。

既定値 : 127.0.0.1

ポート番号(1~65535)

SMTPサーバに接続する際のポート番号を設定します。必ず設定してください。

既定値 : 25

6.27.2. SMTP モニタリソースの注意事項

動作確認済みの SMTP のバージョンについては、『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「監視オプションの動作確認済アプリケーション情報」を参照してください。

ロードアベレージが、sendmail.def ファイルで設定されている RefuseLA の値よりも超えた状態が一定時間続くと、本モニタリソースで異常とみなすことがあります。

6.27.3. SMTP モニタリソースの監視方法

SMTP モニタリソースは、以下の監視を行います。
サーバ上の SMTP デーモンに接続し、NOOP コマンドの発行により、SMTP デーモンの監視を実行します。
監視の結果、以下の場合に異常とみなします。
  1. SMTPデーモンへの接続や NOOPコマンドの発行に対する応答で異常が通知された場合

6.28. SQL Server モニタリソースの設定

SQL Server モニタリソースは、サーバ上で動作する SQL Server のデータベースを監視するモニタ リソースです。

6.28.1. 監視(固有) タブ

監視レベル

選択肢の中から1つを選択します。必ず設定してください。

  • レベル 0 (データベースステータス)
    SQL Serverの管理テーブルを参照しDBの状態を確認します。監視テーブルに対してSQL文の発行は行わない簡易的な監視です。
  • レベル 1 (selectでの監視)
    監視テーブルに対して参照のみを行う監視です。監視テーブルに対して実行するSQL文は( select )です。
  • レベル 2 (update/selectでの監視)
    監視テーブルに対して更新も行う監視です。監視テーブルに対して実行するSQL文は( update / select )です。
    監視開始時に監視テーブルを自動で作成した場合、監視テーブルに対して実行するSQL文は( create / insert )です。
  • レベル 3 (毎回create/dropも行う)
    監視テーブルに対しての更新に加え監視テーブルの作成・削除も毎回行います。監視テーブルに対して実行するSQL文は( create / insert / select / drop )です。

既定値 : レベル 2 (update/selectでの監視)

データベース名 (255 バイト以内)

監視するデータベース名を設定します。必ず設定してください。

既定値 : なし

サーバ名 (255 バイト以内)

監視するデータベースのサーバ名を設定します。必ず設定してください。

既定値 : localhost

ユーザ名 (255 バイト以内)

データベースにログインする際のユーザ名を設定します。必ず設定してください。
指定したデータベースにアクセス可能な SQL Server ユーザを指定してください。

既定値 : SA

パスワード (255 バイト以内)

データベースにログインする際のパスワードを設定します。

既定値 : なし

監視テーブル名 (255 バイト以内)

データベース上に作成する監視用テーブルの名前を設定します。必ず設定してください。

テーブルの作成・削除を行いますので、運用に使用しているテーブル名と重ならないように注意してください。また、SQL 文の予約語と重ならないようにしてください。 データベースの仕様により監視テーブル名に設定できない文字があります。詳細はデータベースの仕様を確認してください。

既定値 : sqlwatch

ODBC ドライバ名 (255 バイト以内)

SQL Server の ODBC ドライバ名を設定します。必ず設定してください。

既定値 : ODBC Driver 13 for SQL Server

6.28.2. SQL Server モニタリソースの注意事項

動作確認済みの SQL Server のバージョンについては、『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「監視オプションの動作確認済アプリケーション情報」を参照してください。

本モニタリソースは、Microsoft ODBC Driver for SQL Server を使用して、SQL Server の監視を行っています。

パラメータ指定値が、監視を行う SQL Server の環境と異なる場合、Cluster WebUI のアラートログにエラー内容を示すメッセージが表示されますので、環境を確認してください。

次項の「SQL Serverモニタリソースの監視方法」で説明する監視レベルについて、以下の点にご注意ください。
「レベル1」で監視開始時に監視テーブルが無い場合、監視エラーになります。下記の監視テーブルの作成を行ってください。
「レベル2」で監視開始時に監視テーブルが無い場合、CLUSTERPROが監視テーブルを自動で作成します。このときCluster WebUI のアラートログに監視テーブルがない旨のメッセージが表示されます。
「レベル3」での監視は毎回監視テーブルの作成・削除を行うため「レベル1」「レベル2」より監視の負荷が高くなります。

選択する監視レベル

監視テーブルの事前作成

レベル0(データベースステータス)

必要なし

レベル1(selectでの監視)

必要あり

レベル2(update/selectでの監視)

必要なし

レベル3(毎回create/dropも行う)

必要なし

監視テーブルの作成は以下の手順で行えます。 監視テーブル名は英数字、一部記号 (アンダースコア等) が指定できます。

SQL 文で作成する場合 (以下の例は監視テーブル名を sqlwatch とする場合)

  • SET IMPLICIT_TRANSACTIONSがオフの場合

    sql> CREATE TABLE sqlwatch (num INT NOT NULL PRIMARY KEY)
    sql> GO
    sql> INSERT INTO sqlwatch VALUES(0)
    sql> GO
    
  • SET IMPLICIT_TRANSACTIONS がオンの場合

    sql> CREATE TABLE sqlwatch (num INT NOT NULL PRIMARY KEY)
    sql> GO
    sql> INSERT INTO sqlwatch VALUES(0)
    sql> GO
    sql> COMMIT
    sql> GO
    

CLUSTERPRO のコマンドを利用する場合

前提条件として、モニタリソースの設定が完了している必要があります。

clp_sqlserverw --createtable -n <SQL Serverモニタリソース名>

作成した監視テーブルを手動で削除する場合、下記のコマンドを実行してください:

clp_sqlserverw --deletetable -n <SQL Serverモニタリソース名>

6.28.3. SQL Server モニタリソースの監視方法

SQL Server モニタリソースは、以下の監視レベルから選択した監視レベルに応じた監視を行います。

  • レベル 0 (データベースステータス)
    SQL Server の管理テーブルを参照し DB の状態を確認します。監視テーブルに対してSQL 文の発行は行わない簡易的な監視です。
    監視の結果以下の場合に異常とみなします。
    1. データベースのステータスがオンラインでない場合

  • レベル 1 (selectでの監視)
    監視テーブルに対して参照のみを行う監視です。監視テーブルに対して実行する SQL 文は( select )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

  • レベル 2 (update/selectでの監視)
    監視テーブルに対して更新も行う監視です。SQL 文の実行により最大 10 桁の数値データの書き込みと読み込みを実行します。監視テーブルに対して実行する SQL 文は( update / select )です。
    監視開始時に監視テーブルを自動で作成した場合、監視テーブルに対して実行する SQL 文は( create / insert )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

    2. 書き込んだデータと読み込んだデータが一致していない場合

  • レベル 3 (毎回create/dropも行う)
    監視テーブルに対しての更新に加え監視テーブルの作成・削除も毎回行います。SQL 文の実行により最大 10 桁の数値データの書き込みと読み込みを実行します。監視テーブルに対して実行する SQL 文は( create / insert / select / drop )です。
    監視の結果以下の場合に異常とみなします。
    1. データベースへの接続や SQL 文の発行に対する応答で異常が通知された場合

    2. 書き込んだデータと読み込んだデータが一致していない場合

6.29. Tuxedo モニタリソースの設定

Tuxedo モニタリソースは、サーバ上で動作する Tuxedo を監視するモニタリソースです。

6.29.1. 監視(固有) タブ

アプリケーションサーバ名(255バイト以内)

監視するアプリケーションサーバ名を設定します。必ず設定してください。

既定値 : BBL

TUXCONFIGファイル(1023バイト以内)

Tuxedo の配置ファイル名を設定します。必ず設定してください。

既定値 : なし

ライブラリパス(1023バイト以内)

Tuxedo のライブラリパスを設定します。必ず設定してください。

既定値 : /home/Oracle/tuxedo/tuxedo12.1.3.0.0/lib/libtux.so

6.29.2. Tuxedo モニタリソースの注意事項

動作確認済みの Tuxedo のバージョンについては、『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「監視オプションの動作確認済アプリケーション情報」を参照してください。

Tuxedo のライブラリ (libtux.soなど) が存在しない場合、監視を行うことができません。

6.29.3. Tuxedo モニタリソースの監視方法

Tuxedo モニタリソースは、以下の監視を行います。
Tuxedo の API を利用して、アプリケーションサーバの監視を実行します。
監視の結果、以下の場合に異常とみなします。
  1. アプリケーションサーバへの接続や状態取得に対する応答で異常が通知された場合

6.30. WebLogic モニタリソースの設定

WebLogic モニタリソースは、サーバ上で動作する WebLogic を監視するモニタリソースです。

6.30.1. 監視(固有) タブ

IPアドレス(79バイト以内)

監視するサーバのIPアドレスを設定します。必ず設定してください。

既定値 : 127.0.0.1

ポート番号(1~65535)

サーバに接続する際のポート番号を設定します。必ず設定してください。

既定値 : 7002

監視方式

サーバの監視方式を設定します。必ず設定してください。

既定値 : RESTful API

プロトコル

監視するサーバのプロトコルを設定します。[監視方式]に RESTful API を選択した場合に必ず選択してください。

既定値 : HTTP

注釈

RHEL8 の環境では HTTP を設定してください。

ユーザ名 (255 バイト以内)

WebLogic のユーザ名を設定します。[監視方式]に RESTful API を選択した場合に必ず入力してください。

既定値 : weblogic

パスワード (255 バイト以内)

WebLogic のパスワードを設定します。[監視方式]に RESTful API を選択した場合に必要に応じて入力してください。

既定値 : なし

アカウントの隠蔽

ユーザ名とパスワードを直接指定する場合は「しない」を、ファイル内に記述する場合は「する」を指定してください。必ず設定してください。

既定値 : しない

コンフィグファイル (1023バイト以内)

ユーザ情報を保持しているファイル名を設定します。アカウントの隠蔽「する」の場合、必ず設定してください。

既定値 : なし

キーファイル名 (1023バイト以内)

コンフィグファイルパスにアクセスするためのパスワードを保存しているファイル名を、フルパスで設定します。アカウントの隠蔽「する」の場合、必ず設定してください。

既定値 : なし

ユーザ名 (255バイト以内)

WebLogic のユーザ名を設定します。アカウントの隠蔽「しない」の場合、必ず設定してください。

既定値 :weblogic

パスワード (255バイト以内)

WebLogic のパスワードを設定します。

既定値 : なし

認証方式

アプリケーションサーバに接続する際の認証方式を設定します。必ず設定してください。
SSL 通信を用いた監視を行いたい場合、[認証方式] に[DemoTrust]または[CustomTrust]を指定してください。
[DemoTrust]、[CustomTrust] のいずれを選択するかは、WebLogic Administraion Console 上の設定により異なります。
WebLogic Administraion Console の[キーストア]が[デモ・アイデンティティとデモ信頼]の場合、[DemoTrust]を指定してください。この場合、[キーストアファイル] の設定は不要です。
WebLogic Administraion Console の[キーストア]が[カスタム・アイデンティティとカスタム信頼]の場合、[CustomTrust]を指定してください。この場合、[キーストアファイル] の設定が必要です

既定値 : DemoTrust

キーストアファイル (1023バイト以内)

SSL認証時の認証ファイルを設定します。認証方式が「CustomTrust」の場合、必ず設定してください。WebLogic Administraion Console 上の[カスタム・アイデンティティ・キーストア]で指定しているファイルを設定してください。

既定値 : なし

ドメイン環境ファイル (1023バイト以内)

WebLogicのドメイン環境ファイル名を設定します。必ず設定してください。

既定値 : /home/Oracle/product/Oracle_Home/user_projects/domains/base_domain/bin/setDomainEnv.sh

追加コマンドオプション (1023 バイト以内)

[webLogic.WLST] コマンドへ渡すオプションを変更する場合に設定します。

既定値 : -Dwlst.offline.log=disable -Duser.language=en_US

6.30.2. WebLogic モニタリソースの注意事項

動作確認済みのWebLogicのバージョンについては、『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「監視オプションの動作確認済アプリケーション情報」を参照してください。

本モニタリソースで 監視方式 に [WLST] を選択した場合は、監視を行うためにJAVA環境が必要です。アプリケーションサーバシステムはJAVAの機能を利用しているため、JAVAのストールなどが発生した場合も異常とみなすことがあります。

WebLogic 起動時にすぐに動作できない場合は異常とみなしてしまうため、[監視開始待ち時間] で調整してください。もしくは、WebLogic を先に起動するようにしてください(例:監視の対象リソースに、WebLogic を起動するEXECリソースを指定)。

RHEL8 環境では監視方式に [RESTful API] を選択した場合は、プロトコルに [HTTP] を設定してください。

6.30.3. WebLogic モニタリソースの監視方法

WebLogic モニタリソースは、以下の監視を行います。

  • 監視方式:RESTful API を選択した場合

    WebLogicでは WebLogic RESTful 管理サービス という RESTful API が用意されています。

    このRESTful API を通して アプリケーションサーバの監視を実行します。

    監視の結果、以下の応答で異常が通知された場合に異常とみなします。

    1. RESTful API の応答で異常が通知された場合

    注釈

    監視方式:WLST と比較して、監視時のアプリケーションサーバのCPU負荷を低減できます。

  • 監視方式:WLST を選択した場合

    [weblogic.WLST] コマンドを利用して connect を行うことで、アプリケーションサーバの監視を実行します。

    監視の結果、以下の場合に異常とみなします。

    1. connect の応答で異常が通知された場合

    [認証方式] により以下の動作となります。

    • DemoTrust: WebLogic のデモ用認証ファイルを使用した SSL 認証方式

    • CustomTrust: ユーザ作成認証ファイルを使用した SSL 認証方式

    • Not Use SSL: SSL認証を行わない

6.31. WebSphere モニタリソースの設定

WebSphere モニタリソースは、サーバ上で動作する WebSphere を監視するモニタリソースです。

6.31.1. 監視(固有) タブ

アプリケーションサーバ名 (255バイト以内)

監視するアプリケーションサーバ名を設定します。必ず設定してください。

既定値 : server1

プロファイル名 (1023バイト以内)

監視するアプリケーションサーバのプロファイル名を設定します。必ず設定してください。

既定値 : default

ユーザ名 (255バイト以内)

WebSphere のユーザ名を設定します。必ず設定してください。

既定値 :なし

パスワード(255バイト以内)

WebSphere のパスワードを設定します。

既定値 : なし

インストールパス(1023バイト以内)

WebSphere のインストールパスを設定します。必ず設定してください。

既定値 : /opt/IBM/WebSphere/AppServer

6.31.2. WebSphere モニタリソースの注意事項

動作確認済みの WebSphere のバージョンについては、『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「監視オプションの動作確認済アプリケーション情報」を参照してください。

本モニタリソースで監視を行うためにはJAVA 環境が必要です。アプリケーションサーバシステムは JAVA の機能を利用しているため、JAVA のストールなどが発生した場合も異常とみなすことがあります。

6.31.3. WebSphere モニタリソースの監視方法

WebSphere モニタリソースは、以下の監視を行います。
WebSphere の serverStatus.sh コマンドを利用して、アプリケーションサーバの監視を実行します。
監視の結果、以下の場合に異常とみなします。
  1. 取得したアプリケーションサーバの状態で異常が通知された場合

6.32. WebOTX モニタリソースの設定

WebOTX モニタリソースは、サーバ上で動作する WebOTX を監視するモニタリソースです。

6.32.1. 監視(固有) タブ

接続先 (255バイト以内)

監視するサーバのサーバ名を設定します。必ず設定してください。

既定値 : localhost

ポート番号 (1~65535)

サーバに接続する際のポート番号を設定します。必ず設定してください。

WebOTX ユーザドメインを監視する場合、WebOTX ドメインの管理ポート番号を設定してください。管理ポート番号とは、ドメイン作成時に <ドメイン名>.properties の domain.admin.port にて設定したポート番号です。<ドメイン名>.properties の詳細については WebOTX のドキュメントを参照してください。

既定値 : 6212

ユーザ名(255バイト以内)

WebOTXのユーザ名を設定します。必ず設定してください。
WebOTX ユーザドメインを監視する場合、WebOTX ドメインのログインユーザ名を設定してください。

既定値 :なし

パスワード(255バイト以内)

WebOTXのパスワードを設定します。

既定値 : なし

インストールパス(1023バイト以内)

WebOTXのインストールパスを設定します。必ず設定してください。

既定値 : /opt/WebOTX

6.32.2. WebOTX モニタリソースの注意事項

動作確認済みの WebOTX のバージョンについては、『インストールガイド』の「CLUSTERPRO X SingleServerSafe について」の「監視オプションの動作確認済アプリケーション情報」を参照してください。

本モニタリソースで監視を行うためにはJAVA 環境が必要です。アプリケーションサーバシステムは JAVA の機能を利用しているため、JAVA のストールなどが発生した場合も異常とみなすことがあります。

6.32.3. WebOTX モニタリソースの監視方法

WebOTX モニタリソースは、以下の監視を行います。
WebOTX の otxadmin.sh コマンドを利用して、アプリケーションサーバの監視を実行します。
監視の結果、以下の場合に異常とみなします。
  1. 取得したアプリケーションサーバの状態で異常が通知された場合

6.33. JVM モニタリソースの設定

JVM モニタリソースは、サーバ上で動作する Java VM やアプリケーションサーバが使用するリソースの利用情報を監視するモニタリソースです。

6.33.1. 監視(固有) タブ

監視対象

監視対象をリストから選択します。WebSAM SVF for PDF、WebSAM Report Director Enterprise、WebSAM Universal Connect/X を監視する場合は、[WebSAM SVF]を選択してください。自製のJavaアプリケーションを監視する場合は、[Javaアプリケーション]を選択してください。

JBoss Enterprise Application Platform のスタンドアローンモードを監視する場合は[JBoss]、JBoss Enterprise Application Platform のドメインモードを監視する場合は「JBoss ドメインモード」を選択してください。

既定値 : なし

JVM 種別

監視対象のアプリケーションが動作する Java VM をリストから選択します。

Java 8 および OpenJDK 8 以降の場合は、[Oracle Java(usage monitoring)] を選択してください。Java 8 では以下の仕様変更がありました。

  • 非ヒープ領域における各メモリの最大値が取得できなくなりました。

  • Perm Gen は Metaspace に変更されました。

  • Compressed Class Space が追加されました。

そのため、Java 8では[メモリ]タブの監視項目は以下に変更となります。

  • 使用率監視は使用量監視に変更となります。

  • [Perm Gen]、Perm Gen[shared-ro]、Perm Gen[shared-rw]は監視できません。チェックボックスはオフにしてください。

  • [Metaspace]、[Compressed Class Space]を監視可能です。

Java 9 では以下の仕様変更がありました。

  • Code Cache が分割されました。

そのため、Java 9 では [メモリ] タブの監視項目は以下に変更となります。

  • [Code Cache] は監視できません。チェックボックスはオフにしてください。

  • [CodeHeap non-nmethods]、[CodeHeap profiled]、[CodeHeap non-profiled]を監視可能です。

監視対象別では以下を指定可能です。

  • 監視対象が [WebLogic Server] の場合
    [Oracle Java]、[Oracle Java(usage monitoring)]、[Oracle JRockit] が選択可能です。
  • 監視対象が [Tomcat] の場合
    [Oracle Java]、[Oracle Java(usage monitoring)]、[OpenJDK] が選択可能です。
  • 監視対象が[WebLogic Server] [Tomcat] 以外の場合
    [Oracle Java]、[Oracle Java(usage monitoring)] が選択可能です。

既定値 : なし

識別名(255バイト以内)

識別名とは、JVM モニタリソースの JVM 運用ログに監視対象の情報を出力する際に、別の JVM モニタリソースと識別するために設定します。そのため、JVM モニタリソース間で一意の文字列を設定してください。必ず設定してください。

  • 監視対象が「WebLogic Server」の場合
    6.33.18. WebLogic Server を監視するには 」の 2 を参照して、監視対象のサーバインスタンス名を設定してください。
  • 監視対象が「WebOTX プロセスグループ」の場合
    プロセスグループ名を設定してください。
  • 監視対象が「WebOTX ドメインエージェント」の場合
    ドメイン名を設定してください。
  • 監視対象が「JBoss」「JBoss ドメインモード」の場合
    6.33.23. JBoss を監視するには 」を参照して設定してください。
  • 監視対象が「Tomcat」の場合
    6.33.24. Tomcat を監視するには 」を参照して設定してください。
  • 監視対象が「WebOTX ESB」の場合
    「WebOTX プロセスグループ」の場合と同じです。
  • 監視対象が「WebSAM SVF」の場合
    6.33.25. SVF を監視するには 」を参照して設定してください。
  • 監視対象が「Javaアプリケーション」の場合
    監視対象のJava VM プロセスを一意に識別可能な文字列を指定してください。

既定値 : なし

接続ポート番号(1024~65535)

JVMモニタリソースが、監視対象Java VMとJMX接続を行う際に使用するポート番号を設定します。JVMモニタリソースは監視対象Java VMに JMX接続を行うことにより情報を取得します。そのためJVMモニタリソースを登録する場合は、監視対象Java VMにJMX接続用ポートを開放する設定を行う必要があります。必ず設定してください。42424~61000は推奨しません。

  • 監視対象が「WebLogic Server」の場合
    接続ポート番号は「 6.33.18. WebLogic Server を監視するには 」の6を参照して設定してください。
  • 監視対象が「WebOTX プロセスグループ」の場合
  • 監視対象が「WebOTX ドメインエージェント」の場合
    "(WebOTXインストールパス)/<ドメイン名>.properties"の"domain.admin.port"を設定してください。
  • 監視対象が「JBoss」の場合
    6.33.23. JBoss を監視するには 」を参照して設定してください。
  • 監視対象が「JBoss ドメインモード」の場合
    設定不要です。
  • 監視対象が「Tomcat」の場合
    6.33.24. Tomcat を監視するには 」を参照して設定してください。
  • 監視対象が「WebOTX ESB」の場合
    「WebOTX プロセスグループ」の場合と同じです。
  • 監視対象が「WebSAM SVF」の場合
    6.33.25. SVF を監視するには 」を参照して設定してください。
  • 監視対象が「Javaアプリケーション」の場合
    接続ポート番号は監視対象であるJavaアプリケーションに確認の上、設定してください。

既定値 : なし

プロセス名 (1024バイト以内)

プロセス名とは、JVMモニタリソースが、監視対象Java VMとJMX接続を行う際に別の JVMモニタリソースと識別するために設定します。そのため、JVMモニタリソース間で一意の文字列を設定してください。

  • 監視対象が「JBoss ドメインモード」以外の場合
    接続ポート番号] により監視対象Java VMが識別可能なため、設定不要です。内部バージョン 3.3.5-1 までは仮想メモリ使用量を取得する際やJVM 運用ログに監視対象の情報を出力する際にも本パラメータを使用し識別していたため、指定が必要でした。しかし、内部バージョン 4.0.0-1 以降は [仮想メモリ使用量を監視する] が削除となったため、設定できません。
  • 監視対象が「JBoss ドメインモード」の場合
    6.33.23. JBoss を監視するには 」を参照して設定してください。

既定値 : なし

ユーザ名 (255バイト以内)

監視対象のJava VMに接続する管理ユーザ名を設定します。

  • 監視対象に[WebOTXドメインエージェント]を選択した場合
    "/opt/WebOTX/<ドメイン名>.properties"の"domain.admin.user"の値を設定してください。
  • 監視対象が[WebOTXドメインエージェント]以外の場合
    設定できません。

既定値 :なし

パスワード (255バイト以内)

監視対象のJava VMに接続する管理ユーザのパスワードを設定します。

  • 監視対象に[WebOTXドメインエージェント]を選択した場合
    "/opt/WebOTX/<ドメイン名>.properties"の"domain.admin.passwd"の値を設定してください。
  • 監視対象が[WebOTXドメインエージェント]以外の場合
    設定できません。

既定値 : なし

コマンド (255バイト以内)

監視対象のJava VM異常検出時に、実行するコマンドを設定します。異常の原因別に実行するコマンドおよび引数の指定が可能です。絶対パスで指定してください。また、実行ファイル名は二重引用符("")で括ってください。例)"/usr/local/bin/command" arg1 arg2 ここでは監視対象Java VMに接続できない場合や使用リソース量の取得における異常検出時に、実行するコマンドを設定します。 「 6.33.17. 異常検出時に障害原因別にコマンドを実行するには 」も参照してください。

既定値 : なし

さらに[調整]ボタンを選択すると以下の内容がポップアップダイアログに表示されます。以下の説明に従い詳細設定を行います。

6.33.2. メモリタブ([JVM種別]で[Oracle Java]、[OpenJDK] 選択時)

ヒープ使用率を監視する

監視対象のJava VMが使用するJavaヒープ領域の使用率の監視設定をします。

  • チェックボックスがオン(既定値)
    監視します。
  • チェックボックスがオフ
    監視しません。

領域全体 (1~100)

監視対象のJava VMが使用するJavaヒープ領域の使用率のしきい値を設定します。

既定値 : 80[%]

Eden Space (1~100)

監視対象のJava VMが使用するJava Eden Spaceの使用率のしきい値を設定します。GC方式としてG1 GCを指定している場合、G1 Eden Spaceと読み替えてください。

既定値 : 100[%]

Survivor Space (1~100)

監視対象のJava VMが使用するJava Survivor Spaceの使用率のしきい値を設定します。GC方式としてG1 GCを指定している場合、G1 Survivor Spaceと読み替えてください。

既定値 : 100[%]

Tenured Gen (1~100)

監視対象のJava VMが使用するJava Tenured(Old) Gen領域の使用率のしきい値を設定します。GC方式としてG1 GCを指定している場合、G1 Old Genと読み替えてください。

既定値 : 80[%]

非ヒープ使用率を監視する

監視対象のJava VMが使用するJava非ヒープ領域の使用率の監視設定をします。

  • チェックボックスがオン(既定値)
    監視します。
  • チェックボックスがオフ
    監視しません。

領域全体 (1~100)

監視対象のJava VMが使用するJava非ヒープ領域の使用率のしきい値を設定します。

既定値 : 80[%]

Code Cache (1~100)

監視対象のJava VMが使用するJava Code Cache領域の使用率のしきい値を設定します。

既定値 : 100[%]

Perm Gen (1~100)

監視対象のJava VMが使用するJava Perm Gen領域の使用率のしきい値を設定します。

既定値 : 80[%]

Perm Gen[shared-ro] (1~100)

監視対象のJava VMが使用するJava Perm Gen [shared-ro]領域の使用率のしきい値を設定します。
Java Perm Gen [shared-ro]領域は監視対象Java VMの起動オプションに -client -Xshare:on -XX:+UseSerialGCを付与して起動している場合に使用される領域です。

既定値 : 80[%]

Perm Gen[shared-rw] (1~100)

監視対象のJava VMが使用するJava Perm Gen [shared-rw]領域の使用率のしきい値を設定します。
Java Perm Gen [shared-rw]領域は監視対象Java VMの起動オプションに -client -Xshare:on -XX:+UseSerialGCを付与して起動している場合に使用される領域です。

既定値 : 80[%]

コマンド (255バイト以内)

監視対象のJava VM異常検出時に、実行するコマンドを設定します。異常の原因別に実行するコマンドおよび引数の指定が可能です。絶対パスで指定してください。また、実行ファイル名は二重引用符("")で括ってください。例)"/usr/local/bin/command" arg1 arg2
ここでは監視対象Java VMのJavaヒープ領域、Java非ヒープ領域における異常検出時に、実行するコマンドを設定します。

既定値 : なし

既定値

[既定値]ボタンをクリックすると全ての項目に既定値が設定されます。

6.33.3. メモリタブ([JVM種別]で[Oracle Java(usage monitoring)] 選択時)

ヒープ使用量を監視する

監視対象のJava VMが使用するJavaヒープ領域の使用量の監視設定をします。

  • チェックボックスがオン
    監視します。
  • チェックボックスがオフ(既定値)
    監視しません。

領域全体 (0~102400)

監視対象のJava VMが使用するJavaヒープ領域の使用量のしきい値を設定します。0の場合、監視しません。

既定値 : 0[MB]

Eden Space (0~102400)

監視対象のJava VMが使用するJava Eden Spaceの使用量のしきい値を設定します。0の場合、監視しません。GC方式としてG1 GCを指定している場合、G1 Eden Spaceと読み替えてください。

既定値 : 0[MB]

Survivor Space (0~102400)

監視対象のJava VMが使用するJava Survivor Spaceの使用量のしきい値を設定します。0の場合、監視しません。GC方式としてG1 GCを指定している場合、G1 Survivor Spaceと読み替えてください。

既定値 : 0[MB]

Tenured Gen (0~102400)

監視対象のJava VMが使用するJava Tenured(Old) Gen領域の使用量のしきい値を設定します。0の場合、監視しません。GC方式としてG1 GCを指定している場合、G1 Old Genと読み替えてください。

既定値 : 0[MB]

非ヒープ使用量を監視する

監視対象のJava VMが使用するJava非ヒープ領域の使用量の監視設定をします。

  • チェックボックスがオン
    監視します。
  • チェックボックスがオフ(既定値)
    監視しません。

領域全体 (0~102400)

監視対象のJava VMが使用するJava非ヒープ領域の使用量のしきい値を設定します。0の場合、監視しません。

既定値 : 0[MB]

Code Cache (0~102400)

監視対象のJava VMが使用するJava Code Cache領域の使用量のしきい値を設定します。0の場合、監視しません。

既定値 : 0[MB]

CodeHeap non-nmethods (0~102400)

監視対象のJava VMが使用するJava CodeHeap non-nmethods領域の使用量のしきい値を設定します。0の場合、監視しません。

既定値 : 0[MB]

CodeHeap profiled (0~102400)

監視対象のJava VMが使用するJava CodeHeap profiled nmethods領域の使用量のしきい値を設定します。0の場合、監視しません。

既定値 : 0[MB]

CodeHeap non-profiled (0~102400)

監視対象のJava VMが使用するJava CodeHeap non-profiled nmethods領域の使用量のしきい値を設定します。0の場合、監視しません。

既定値 : 0[MB]

Compressed Class Space (0~102400)

監視対象のJava VMが使用するCompressed Class Space領域の使用量のしきい値を設定します。0の場合、監視しません。

既定値 : 0[MB]

Metaspace (0~102400)

監視対象のJava VMが使用するMetaspace領域の使用量のしきい値を設定します。0の場合、監視しません。

既定値 : 0[MB]

コマンド (255バイト以内)

監視対象のJava VM異常検出時に、実行するコマンドを設定します。異常の原因別に実行するコマンドおよび引数の指定が可能です。絶対パスで指定してください。また、実行ファイル名は二重引用符("")で括ってください。例)"/usr/local/bin/command" arg1 arg2
ここでは監視対象Java VMのJavaヒープ領域、Java非ヒープ領域における異常検出時に、実行するコマンドを設定します。

既定値 : なし

既定値

[既定値]ボタンをクリックすると全ての項目に既定値が設定されます。

6.33.4. メモリタブ(Oracle JRockit選択時)

[JVM種別] で [JRockit] 選択時のみ表示されます。

ヒープ使用率を監視する

監視対象の Java VM が使用する Jav ヒープ領域の使用率の監視設定をします。

  • チェックボックスがオン(既定値)
    監視します。
  • チェックボックスがオフ
    監視しません。

領域全体 (1~100)

監視対象のJava VMが使用するJavaヒープ領域の使用率のしきい値を設定します。

既定値 : 80[%]

Nursery Space (1~100)

監視対象のJRockit JVMが使用するJava Nursery Spaceの使用率のしきい値を設定します。

既定値 : 80[%]

Old Space (1~100)

監視対象のJRockit JVMが使用するJava Old Spaceの使用率のしきい値を設定します。

既定値 : 80[%]

非ヒープ使用率を監視する

監視対象のJava VMが使用するJava非ヒープ領域の使用率の監視設定をします。

  • チェックボックスがオン(既定値)
    監視します。
  • チェックボックスがオフ
    監視しません。

領域全体 (1~100)

監視対象のJava VMが使用するJavaヒープ領域の使用率のしきい値を設定します。

既定値 : 80[%]

Class Memory (1~100)

監視対象のJRockit JVMが使用するJava Class Memory の使用率のしきい値を設定します。

既定値 : 100[%]

コマンド (255バイト以内)

監視対象の Java VM 異常検出時に、実行するコマンドを設定します。異常の原因別に実行するコマンドおよび引数の指定が可能です。絶対パスで指定してください。また、実行ファイル名は二重引用符("")で括ってください。例)"/usr/local/bin/command" arg1 arg2 ここでは監視対象 Java VM の Java ヒープ領域、Java 非ヒープ領域における異常検出時に、実行するコマンドを設定します。 「 6.33.17. 異常検出時に障害原因別にコマンドを実行するには 」も参照してください。

既定値 : なし

既定値

[既定値]ボタンをクリックすると全ての項目に既定値が設定されます。

6.33.5. スレッドタブ

動作中のスレッド数を監視する (1~65535)

監視対象の Java VM で現在動作中のスレッド上限数のしきい値を設定します。

既定値 : 65535[スレッド]

コマンド (255バイト以内)

監視対象のJava VM異常検出時に、実行するコマンドを設定します。異常の原因別に実行するコマンドおよび引数の指定が可能です。絶対パスで指定してください。また、実行ファイル名は二重引用符("")で括ってください。例)"/usr/local/bin/command" arg1 arg2 ここでは監視対象 Java VM で現在動作中のスレッド数における異常検出時に、実行するコマンドを設定します。 「 6.33.17. 異常検出時に障害原因別にコマンドを実行するには 」も参照してください。

既定値 : なし

既定値

[既定値]ボタンをクリックすると全ての項目に既定値が設定されます。

6.33.6. GC タブ

Full GC実行時間を監視する(1~65535)

監視対象のJava VMにおいて、前回計測以降のFull GC実行時間のしきい値を設定します。Full GC実行時間とは、前回計測以降のFull GC発生回数で割った平均値です。

前回計測以降のFull GC実行時間 3000ミリ秒、Full GC発生回数3回の場合を異常と判定したい場合、1000ミリ秒以下を設定してください。

既定値 : 65535[ミリ秒]

Full GC発生回数を監視する(1~65535)

監視対象のJava VMにおいて、前回計測以降のFull GC発生回数のしきい値を設定します。

既定値 : 1(回)

コマンド(255バイト以内)

監視対象のJava VM異常検出時に、実行するコマンドを設定します。異常の原因別に実行するコマンドおよび引数の指定が可能です。絶対パスで指定してください。また、実行ファイル名は二重引用符("")で括ってください。例)"/usr/local/bin/command" arg1 arg2 ここでは監視対象Java VMのFull GC実行時間やFull GC発生回数における異常検出時に、実行するコマンドを設定します。 「 6.33.17. 異常検出時に障害原因別にコマンドを実行するには 」も参照してください。

既定値 : なし

既定値

[既定値]ボタンをクリックすると全ての項目に既定値が設定されます。

6.33.7. WebLogic タブ

[監視対象] で [WebLogic Server] 選択時のみ表示されます。

ワークマネージャのリクエストを監視する

WebLogic Server でワークマネージャの待機リクエスト状態の監視設定をします。

  • チェックボックスがオン
    監視します。
  • チェックボックスがオフ(既定値)
    監視しません。

監視対象ワークマネージャ

監視対象のWebLogic Serverに対して監視したいアプリケーションのワークマネージャ名を設定します。ワークマネージャ監視を実施する場合、必ず設定してください。

App1[WM1,WM2,…];App2[WM1,WM2,…];…

AppWM にて指定可能な文字はASCII文字です。(Shift_JIS コード0x005C と0x00A1~0x00DF を除く)

アプリケーション アーカイブのバージョンを持つアプリケーションを指定する場合、App には「アプリケーション名#バージョン」を指定してください。

アプリケーション名に"["や"]"が付いている場合、"["や"]"の直前に「¥¥」を追加してください。

(例) アプリケーション名がapp[2]の場合、app¥¥[2¥¥]

既定値 : なし

リクエスト数 (1~65535)

監視対象の WebLogic Serverのワークマネージャにおいて、待機リクエスト数のしきい値を設定します。

既定値 : 65535

平均値 (1~65535)

監視対象のWebLogic Serverのワークマネージャにおいて、待機リクエスト数の平均値のしきい値を設定します。

既定値 : 65535

前回計測値からの増加率 (1~1024)

監視対象のWebLogic Serverのワークマネージャにおいて、待機リクエスト数の前回計測以降の増分に対するしきい値を設定します。

既定値 : 80[%]

スレッドプールのリクエストを監視する

監視対象の WebLogic Server のスレッドプールにおいて、待機リクエスト数 、実行リクエスト数の監視設定をします。リクエスト数とは、WebLogic Server 内部で処理待ちや実行した HTTP リクエスト数や、EJB の呼び出しや WebLogic Server 内部で行われる処理のリクエスト数を含みます。ただし、増加しても異常な状態とは判断できません。JVM 統計ログの採取をする場合に指定してください。

  • チェックボックスがオン(既定値)
    監視します。
  • チェックボックスがオフ
    監視しません。

待機リクエスト リクエスト数 (1~65535)

待機リクエスト数のしきい値を設定します。

既定値 : 65535

待機リクエスト 平均値 (1~65535)

待機リクエスト数の平均値のしきい値を設定します。

既定値 : 65535

待機リクエスト 前回計測値からの増加率(1~1024)

待機リクエスト数の前回計測以降の増分に対するしきい値を設定します。

既定値 : 80[%]

実行リクエスト リクエスト数 (1~65535)

単位時間あたりに実行したリクエスト数のしきい値を設定します。

既定値 : 65535

実行リクエスト 平均値 (1~65535)

単位時間あたりに実行したリクエスト数の平均値のしきい値を設定します。

既定値 : 65535

実行リクエスト 前回計測値からの増加率 (1~1024)

単位時間あたりに実行したリクエスト数の前回計測以降の増分に対するしきい値を設定します。

既定値 : 80[%]

コマンド (255バイト以内)

監視対象のJava VM異常検出時に、実行するコマンドを設定します。異常の原因別に実行するコマンドおよび引数の指定が可能です。絶対パスで指定してください。また、実行ファイル名は二重引用符("")で括ってください。例)"/usr/local/bin/command" arg1 arg2 ここではWebLogic Serverのワークマネージャのリクエストやスレッドプールのリクエストにおける異常検出時に、実行するコマンドを設定します。 「 6.33.17. 異常検出時に障害原因別にコマンドを実行するには 」も参照してください。

既定値 : なし

既定値

[既定値]ボタンをクリックすると全ての項目に既定値が設定されます。

6.33.8. JVM モニタリソースの注意事項

JVMモニタリソースを作成する前に [クラスタのプロパティ] の [JVM監視] タブの [Javaインストールパス] を前もって設定しておく必要があります。

監視対象のリソースには、WebLogic Server や WebOTX など Java VM 上で動作するアプリケーションサーバを指定してください。JVM モニタリソースの活性後、Java Resource Agent は監視を開始しますが、JVM モニタリソースの活性直後に監視対象(WebLogic ServerやWebOTX) がすぐに動作できない場合は、[監視開始待ち時間]で調整してください。

[監視(共通)] - [リトライ回数] の設定は無効です。異常の検出を遅らせたい場合は、[クラスタ]プロパティ - [JVM監視] タブ - [リソース計測設定] - [共通] - [リトライ回数] の設定を変更してください。

6.33.9. JVM モニタリソースの監視方法

JVM モニタリソースは、以下の監視を行います。
JMX(Java Management Extensions) を利用して、アプリケーションサーバの監視を実行します。
監視の結果、以下の場合に異常とみなします。
  • 監視対象の Java VM やアプリケーションサーバに接続できない場合

  • 取得した Java VM やアプリケーションサーバのリソース使用量がお客様定義のしきい値を規定回数(異常判定しきい値)連続して超えた場合

監視の結果、以下の場合に異常から正常へ復帰したとみなします。

  • 回復動作後の監視を再開時にしきい値を下回った場合

注釈

Cluster WebUI の[クラスタログ収集]では、監視対象(WebLogic ServerやWebOTX)の設定ファイルおよびログファイルは収集されません。

図はJVMモニタリソースによる監視動作を表しています。
a)で監視対象のJava VMの監視を開始します。Java VMの監視にはJMX(Java Management Extensions)を利用します。Java Resource AgentがJMXを通じてJava VMに対して定期的に使用リソース量を取得することでJava VMの状態をチェックします。
状態が正常から異常へ変化した場合、b)でJava VMの異常を検出したことをCluster WebUIに表示します。状態とアラートを確認することができます。さらにc)で、障害があったことをsyslogやJVM運用ログへ通知します。アラートサービスをご利用の場合、Eメール通報も可能です。
a)の後、状態が異常から正常に変化した場合、d)でJava VMの正常復帰を検出したことをCluster WebUIに表示します。さらにe)で正常復旧した旨をsyslogやJVM運用ログへ通知します。
_images/img_l_how-jvm-monitor-resources-perform-monitoring-10.png

図 6.11 JVMモニタリソースによる監視フロー

基本的なしきい値超過時の動作は以下の通りです。

図の横軸は時間の経過を表しており、縦軸は監視のしきい値を超えた(Exceeded)か超えていない(Not exceeded)かを表しています。
ここで、監視時のしきい値を超える状態が異常判定しきい値回(図では5回)以上連続すると、異常と判断します。
異常状態と判断後、異常判定しきい値回連続してしきい値を下回った場合、正常状態と判断します。
_images/img_how-jvm-monitor-resources-perform-monitoring-20.png

図 6.12 しきい値超過時の動作

異常が継続する場合は以下の通りです

しきい値の超過が異常判定しきい値回連続して発生した場合、異常状態と判断します。
異常状態と判断後、再度異常判定しきい値回連続してしきい値を超過していても、Cluster WebUIには再度アラートは表示されません。
_images/img_how-jvm-monitor-resources-perform-monitoring-30.png

図 6.13 異常継続時の動作

Full GC(Garbage Collection) を監視する場合を例に説明します。

図の横軸は時間の経過を表しています。 そして、図の上段は各監視タイミングでGCの発生を検出したか否かを示し、下段はそれぞれの時点で Full GC検出が何回連続しているかを示しています。 JVMモニタリソースは、異常判定しきい値回連続して Full GCが発生すると、モニタ異常を検出します。 異常判定しきい値を5回に設定しているので、 Full GC検出が 5回に達した時点でモニタ異常を検出します。

Full GCはシステムに与える影響が大きいため、異常判定しきい値は1回に設定することを推奨します。

_images/img_how-jvm-monitor-resources-perform-monitoring-40.png

図 6.14 監視イメージ(異常判定しきい値を5回に設定した場合)

6.33.10. JVM 統計ログとは

JVM モニタリソースが収集する監視対象 Java VM の統計情報を保存したファイルが、JVM 統計ログです。ファイル形式は lcsv 形式です。作成場所は以下のとおりです。

<CLUSTERPROインストールパス>/log/ha/jra/*.stat

下記の「監視項目」とは、JVM モニタリソースの[プロパティ]-[監視(固有)] タブ内の設定項目を表します。

それぞれの監視項目について、[監視する]をチェックし、かつ閾値を設定した場合に統計情報を採取し、JVM 統計ログに情報を出力します。[監視する]をチェックしない場合、および[監視する]をチェックしたが閾値を設定しない場合は、JVM 統計ログには情報は出力されません。

監視項目と該当する JVM 統計ログは以下の通りです。

監視項目

該当するJVM統計ログ

[メモリ]タブ-[ヒープ使用率を監視する]
[メモリ]タブ-[非ヒープ使用率を監視する]
[メモリ]タブ-[ヒープ使用量を監視する]
[メモリ]タブ-[非ヒープ使用量を監視する]

jramemory.stat

[スレッド]タブ-[動作中のスレッド数を監視する]

jrathread.stat

[GC]タブ-[Full GC 実行時間を監視する]
[GC]タブ-[Full GC 発生回数を監視する]

jragc.stat

[WebLogic]タブ-[ワークマネージャのリクエストを監視する]
[WebLogic]タブ-[スレッドプールのリクエストを監視する]
上記のいずれかがチェックされている場合、wlworkmanager.statとwlthreadpool.statの両方出力します。
wlworkmanager.stat
wlthreadpool.stat

6.33.11. 監視対象 Java VM の Java メモリ領域の使用量を確認する(jramemory.stat)

監視対象 Java VM の Java メモリ領域の使用量を記録するログファイルです。ファイル名はログ出力設定のローテーション方式により以下のいずれかになります。

  • [クラスタのプロパティ] - [JVM監視] タブ - [ログ出力設定] - [ローテーション方式] - [ファイルサイズ]を選択した場合:jramemory<0から始まる整数>.stat

  • [クラスタのプロパティ] - [JVM監視] タブ - [ログ出力設定] - [ローテーション方式] - [時間]を選択した場合:jramemory<YYYYMMDDhhmm>.stat

フォーマットは以下の通りです。

No

フォーマット

説明

1

yyyy/mm/dd hh:mm:ss.SSS

ログを記録した日時を示します。

2

半角英数字記号

監視対象Java VMの名称を示します。JVMモニタリソースの[プロパティ]-[監視固有]タブ-[識別名]で設定した値です。

3

半角英数字記号

Javaメモリプールの名称です。詳細は「6.33.16. Java メモリプール名について」を参照してください。

4

半角英数字記号

Javaメモリプールのタイプです。
Heap、Non-Heap

5

半角数字

Java VMが起動時にOSに要求するメモリ量です。単位はバイトです。(init)
監視対象Java VMの起動時、以下のJava VM起動時オプションでサイズの指定が可能です。
・HEAP:-Xms
・NON_HEAP パーマネント領域(Perm Gen):-XX:PermSize
・NON_HEAP コードキャッシュ領域(Code Cache):-XX:InitialCodeCacheSize

6

半角数字

Java VMが現在使用しているメモリ量です。単位はバイトです。(used)

7

半角数字

Java VMが現在使用することを保証しているメモリ量です。単位はバイトです。(committed)
メモリの使用状況により増減しますが、必ずused以上、max以下になります。

8

半角数字

Java VMが使用できる最大メモリ量です。単位はバイトです。(max)
以下のJava VM起動時オプションでサイズの指定が可能です。
・HEAP:-Xmx
・NON_HEAP パーマネント領域(Perm Gen):-XX:MaxPermSize
・NON_HEAP コードキャッシュ領域(Code Cache):-XX:ReservedCodeCacheSize

例)
java -XX:MaxPermSize=128m -XX:ReservedCodeCacheSize=128m javaAP
上記例ではNON_HEAPのmaxは 128m+128m=256m になります。

(注意)
-Xms と-Xmxに同じ値を指定すると、(init)>(max)となることがあります。これはHEAPのmaxが、-Xmx の指定によって確保される領域サイズからSurvivor Spaceのサイズの半分を除いたサイズを示すためです。

9

半角数字

計測対象のJava VMが起動してから使用したメモリ量のピーク値です。Javaメモリプールの名称がHEAP、NON_HEAPの場合、Java VMが現在使用しているメモリ量(used)と同じになります。単位はバイトです。

10

半角数字

[JVM種別]で[Oracle Java(usage monitoring)]選択時は無視してください。

[JVM種別]で[Oracle Java(usage monitoring)]以外を選択時、Javaメモリプールのタイプ(No.4のフィールド)がHEAPの場合、max(No.8のフィールド)×しきい値(%)のメモリ量です。単位はバイトです。JavaメモリプールのタイプがHEAP以外の場合、0固定です。

6.33.12. 監視対象 Java VM のスレッド稼働状況を確認する (jrathread.stat)

監視対象Java VMのスレッド稼働状況を記録するログファイルです。ファイル名はログ出力設定のローテーション方式により以下のいずれかになります。

  • [クラスタのプロパティ] - [JVM監視] タブ - [ログ出力設定] - [ローテーション方式] - [ファイルサイズ]を選択した場合:jrathread<0から始まる整数>.stat

  • [クラスタのプロパティ] - [JVM監視] タブ - [ログ出力設定] - [ローテーション方式] - [時間]を選択した場合:jrathread<YYYYMMDDhhmm>.stat

フォーマットは以下の通りです。

No

フォーマット

説明

1

yyyy/mm/dd hh:mm:ss.SSS

ログを記録した日時を示します。

2

半角英数字記号

監視対象 Java VM の名称を示します。JVM モニタリソースの[プロパティ]-[監視固有]タブ-[識別名]で設定した値です。

3

半角英数字記号

監視対象 Java VM で現在実行中のスレッド数を示します。

4

[半角数字: 半角数字:...]

監視対象 Java VM でデッドロックしているスレッドIDを示します。デッドロック数分IDを繰り返します。

5

半角英数字記号

監視対象 Java VM でデッドロックしているスレッドの詳細情報を示します。スレッド数分、以下の形式で繰り返します。
スレッド名, スレッドID, スレッド状態, UserTime, CpuTime, WaitedCount, WaitedTime, isInNative, isSuspended <改行>
stacktrace<改行>
:
stacktrace<改行>
stacktrace=ClassName, FileName, LineNumber, MethodName, isNativeMethod

6.33.13. 監視対象 Java VMのGC 稼働状況を確認する (jragc.stat)

監視対象 Java VM の GC 稼働状況を記録するログファイルです。ファイル名はログ出力設定のローテーション方式により以下のいずれかになります。

  • [クラスタのプロパティ] - [JVM監視] タブ - [ログ出力設定] - [ローテーション方式] - [ファイルサイズ]を選択した場合:jragc<0から始まる整数>.stat

  • [クラスタのプロパティ] - [JVM監視] タブ - [ログ出力設定] - [ローテーション方式] - [時間] を選択した場合:jragc<YYYYMMDDhhmm>.stat

JVM モニタリソースではコピー GC とFull GC の 2 種類の GC の情報を出力しています。
JVM モニタリソースでは、Oracle Java の場合は以下の GC について、Full GC として発生回数の増分をカウントしています。
  • MarksweepCompact

  • MarkSweepCompact

  • PS Marksweep

  • ConcurrentMarkSweep

フォーマットは以下の通りです。

No

フォーマット

説明

1

yyyy/mm/dd hh:mm:ss.SSS

ログを記録した日時を示します。

2

半角英数字記号

監視対象Java VMの名称を示します。JVMモニタリソースの[プロパティ]-[監視固有]タブ-[識別名]で設定した値です。

3

半角英数字記号

監視対象Java VM のGC名称を示します。

監視対象Java VMがOracle Javaの場合
以下があります。
Copy
MarksweepCompact
MarkSweepCompact
PS Scavenge
PS Marksweep
ParNew
ConcurrentMarkSweep

監視対象Java VMがOracle JRockitの場合
以下があります。
Garbage collection optimized for throughput Old Collector
Garbage collection optimized for short pausetimes Old Collector
Garbage collection optimized for deterministic pausetimes Old Collector
Static Collector
Static Old Collector
Garbage collection optimized for throughput Young Collector

4

半角数字

監視対象Java VMの起動直後から計測時点までのGC発生回数を示します。JVMモニタリソースが監視を開始する前に発生したGCの発生回数も値に含みます。

5

半角数字

監視対象Java VMの起動直後から計測時点までのGC総実行時間を示します。単位はミリ秒です。JVMモニタリソースが監視を開始する前に発生したGCの実行時間も値に含みます。

6.33.14. WebLogic Server のワークマネージャの稼働状況を確認する(wlworkmanager.stat)

WebLogic Serverのワークマネージャの稼働状況を記録するログファイルです。ファイル名はログ出力設定のローテーション方式により以下のいずれかになります。

  • [クラスタのプロパティ] - [JVM監視] タブ - [ログ出力設定] - [ローテーション方式] - [ファイルサイズ]を選択した場合:wlworkmanager<0から始まる整数>.stat

  • [クラスタのプロパティ] - [JVM監視] タブ - [ログ出力設定] - [ローテーション方式] - [時間]を選択した場合:wlworkmanager<YYYYMMDDhhmm>.stat

フォーマットは以下の通りです。

No

フォーマット

説明

1

yyyy/mm/dd hh:mm:ss.SSS

ログを記録した日時を示します。

2

半角英数字記号

監視対象Java VMの名称を示します。JVMモニタリソースの[プロパティ]-[監視固有]タブ-[識別名]で設定した値です。

3

半角英数字記号

アプリケーション名を示します。

4

半角英数字記号

ワークマネージャ名を示します。

5

半角数字

実行したリクエストの数を示します。

6

半角数字

待機しているリクエストの数を示します。

6.33.15. WebLogic Server のスレッドプールの稼働状況を確認する(wlthreadpool.stat)

WebLogic Server のスレッドプールの稼働状況を記録するログファイルです。ファイル名はログ出力設定のローテーション方式により以下のいずれかになります。

  • [クラスタのプロパティ] - [JVM監視] タブ - [ログ出力設定] - [ローテーション方式] - [ファイルサイズ]を選択した場合:wlthreadpool<0から始まる整数>.stat

  • [クラスタのプロパティ] - [JVM監視] タブ - [ログ出力設定] - [ローテーション方式] - [時間]を選択した場合:wlthreadpool<YYYYMMDDhhmm>.stat

フォーマットは以下の通りです。

No

フォーマット

説明

1

yyyy/mm/dd hh:mm:ss.SSS

ログを記録した日時を示します。

2

半角英数字記号

監視対象Java VMの名称を示します。JVMモニタリソースの[プロパティ]-[監視固有]タブ-[識別名]で設定した値です。

3

半角数字

実行したリクエストの総数を示します。

4

半角数字

処理待ちとなっているリクエスト数を示します。

5

半角数字

単位時間(秒)あたりのリクエスト処理数を示します。

6

半角数字

アプリケーションを実行するためのスレッドのトータル数を示します。

7

半角数字

アイドル状態となっているスレッドの数を示します。

8

半角数字

実行中のスレッド数を示します。

9

半角数字

スタンバイ状態となっているスレッド数を示します。

6.33.16. Java メモリプール名について

JVM 運用ログに出力するメッセージ中の memory_name として出力する Java メモリプール名、および JVM 統計ログ jramemory.stat 中に出力する Java メモリプール名について説明します。

Java メモリプール名として出力する文字列は、JVM モニタリソースで決定しているのではなく、監視対象 Java VM から受け取った文字列を出力しています。

また、Java VM としては仕様を公開していないため、Java VM のバージョンアップにより、予告なく変更される可能性があります。

そのため、メッセージ中の Java メモリプール名をメッセージ監視することは推奨いたしません。

下記の監視項目とは JVM モニタリソースの[プロパティ]-[監視(固有)] タブ-[メモリ]タブ内の設定項目を表します。

以下に記載している Java メモリプール名は Oracle Java 、JRockit において実機確認した結果です。

[JVM種別] に [Oracle Java] を選択、かつ監視対象 Java VM の起動オプションに「-XX:+UseSerialGC」が付加されている場合、jramemory.stat における No3 の Java メモリプール名は以下の通りです。

監視項目

memory_nameとして出力する文字列

[ヒープ使用率を監視する]-[領域全体]

HEAP

[ヒープ使用率を監視する]-[Eden Space]

Eden Space

[ヒープ使用率を監視する]-[Survivor Space]

Survivor Space

[ヒープ使用率を監視する]-[Tenured Gen]

Tenured Gen

[非ヒープ使用率を監視する]-[領域全体]

NON_HEAP

[非ヒープ使用率を監視する]-[Code Cache]

Code Cache

[非ヒープ使用率を監視する]-[Perm Gen]

Perm Gen

[非ヒープ使用率を監視する]-[Perm Gen[shared-ro]]

Perm Gen [shared-ro]

[非ヒープ使用率を監視する]-[Perm Gen[shared-rw]]

Perm Gen [shared-rw]

[JVM種別] に [Oracle Java] を選択、かつ監視対象 Java VM の起動オプションに「-XX:+UseParallelGC」、「-XX:+UseParallelOldGC」が付加されている場合、jramemory.statにおけるNo3のJavaメモリプール名は以下の通りです。

監視項目

memory_nameとして出力する文字列

[ヒープ使用率を監視する]-[領域全体]

HEAP

[ヒープ使用率を監視する]-[Eden Space]

PS Eden Space

[ヒープ使用率を監視する]-[Survivor Space]

PS Survivor Space

[ヒープ使用率を監視する]-[Tenured Gen]

PS Old Gen

[非ヒープ使用率を監視する]-[領域全体]

NON_HEAP

[非ヒープ使用率を監視する]-[Code Cache]

Code Cache

[非ヒープ使用率を監視する]-[Perm Gen]

PS Perm Gen

[非ヒープ使用率を監視する]-[Perm Gen[shared-ro]]

Perm Gen [shared-ro]

[非ヒープ使用率を監視する]-[Perm Gen[shared-rw]]

Perm Gen [shared-rw]

[JVM種別]に[Oracle Java]を選択、かつ監視対象Java VMの起動オプションに「-XX:+UseConcMarkSweepGC」が付加されている場合、jramemory.statにおけるNo3のJavaメモリプール名は以下の通りです。

監視項目

memory_nameとして出力する文字列

[ヒープ使用率を監視する]-[領域全体]

HEAP

[ヒープ使用率を監視する]-[Eden Space]

Par Eden Space

[ヒープ使用率を監視する]-[Survivor Space]

Par Survivor Space

[ヒープ使用率を監視する]-[Tenured Gen]

CMS Old Gen

[非ヒープ使用率を監視する]-[領域全体]

NON_HEAP

[非ヒープ使用率を監視する]-[Code Cache]

Code Cache

[非ヒープ使用率を監視する]-[Perm Gen]

CMS Perm Gen

[非ヒープ使用率を監視する]-[Perm Gen[shared-ro]]

Perm Gen [shared-ro]

[非ヒープ使用率を監視する]-[Perm Gen[shared-rw]]

Perm Gen [shared-rw]

[JVM種別]に[Oracle Java(usage monitoring)]を選択、かつ監視対象Java VMの起動オプションに「-XX:+UseSerialGC」が付加されている場合、jramemory.statにおけるNo3のJavaメモリプール名は以下の通りです。

監視項目

memory_nameとして出力する文字列

[ヒープ使用量を監視する]-[領域全体]

HEAP

[ヒープ使用量を監視する]-[Eden Space]

Eden Space

[ヒープ使用量を監視する]-[Survivor Space]

Survivor Space

[ヒープ使用量を監視する]-[Tenured Gen]

Tenured Gen

[非ヒープ使用量を監視する]-[領域全体]

NON_HEAP

[非ヒープ使用量を監視する]-[Code Cache]

Code Cache(Java 9以降の場合、出力なし)

[非ヒープ使用量を監視する]-[Metaspace]

Metaspace

[非ヒープ使用量を監視する]-[CodeHeap non-nmethods]

CodeHeap non-nmethods

[非ヒープ使用量を監視する]-[CodeHeap profiled]

CodeHeap profiled nmethods

[非ヒープ使用量を監視する]-[CodeHeap non-profiled]

CodeHeap non-profiled nmethods

[非ヒープ使用量を監視する]-[Compressed Class Space]

Compressed Class Space

[JVM種別] に [Oracle Java(usage monitoring)] を選択、かつ監視対象 Java VM の起動オプションに「-XX:+UseParallelGC」、「-XX:+UseParallelOldGC」が付加されている場合、jramemory.stat における No3 の Java メモリプール名は以下の通りです。

監視項目

memory_nameとして出力する文字列

[ヒープ使用量を監視する]-[領域全体]

HEAP

[ヒープ使用量を監視する]-[Eden Space]

PS Eden Space

[ヒープ使用量を監視する]-[Survivor Space]

PS Survivor Space

[ヒープ使用量を監視する]-[Tenured Gen]

PS Old Gen

[非ヒープ使用量を監視する]-[領域全体]

NON_HEAP

[非ヒープ使用量を監視する]-[Code Cache]

Code Cache(Java 9以降の場合、出力なし)

[非ヒープ使用量を監視する]-[Metaspace]

Metaspace

[非ヒープ使用量を監視する]-[CodeHeap non-nmethods]

CodeHeap non-nmethods

[非ヒープ使用量を監視する]-[CodeHeap profiled]

CodeHeap profiled nmethods

[非ヒープ使用量を監視する]-[CodeHeap non-profiled]

CodeHeap non-profiled nmethods

[非ヒープ使用量を監視する]-[Compressed Class Space]

Compressed Class Space

[JVM種別] に [Oracle Java(usage monitoring)] を選択、かつ監視対象 Java VM の起動オプションに「-XX:+UseConcMarkSweepGC」が付加されている場合、jramemory.stat における No3 の Java メモリプール名は以下の通りです。

監視項目

memory_nameとして出力する文字列

[ヒープ使用量を監視する]-[領域全体]

HEAP

[ヒープ使用量を監視する]-[Eden Space]

Par Eden Space

[ヒープ使用量を監視する]-[Survivor Space]

Par Survivor Space

[ヒープ使用量を監視する]-[Tenured Gen]

CMS Old Gen

[非ヒープ使用量を監視する]-[領域全体]

NON_HEAP

[非ヒープ使用量を監視する]-[Code Cache]

Code Cache(Java 9以降の場合、出力なし)

[非ヒープ使用量を監視する]-[Metaspace]

Metaspace

[非ヒープ使用量を監視する]-[CodeHeap non-nmethods]

CodeHeap non-nmethods

[非ヒープ使用量を監視する]-[CodeHeap profiled]

CodeHeap profiled nmethods

[非ヒープ使用量を監視する]-[CodeHeap non-profiled]

CodeHeap non-profiled nmethods

[非ヒープ使用量を監視する]-[Compressed Class Space]

Compressed Class Space

[JVM種別]に[Oracle Java(usage monitoring)]を選択、かつ監視対象Java VMの起動オプションに「-XX:+UseParNewGC」が付加されている場合、jramemory.statにおけるNo3のJavaメモリプール名は以下の通りです。Java 9以降の場合、「-XX:+UseParNewGC」を付加すると、監視対象Java VMは起動しません。

監視項目

memory_nameとして出力する文字列

[ヒープ使用量を監視する]-[領域全体]

HEAP

[ヒープ使用量を監視する]-[Eden Space]

Par Eden Space

[ヒープ使用量を監視する]-[Survivor Space]

Par Survivor Space

[ヒープ使用量を監視する]-[Tenured Gen]

Tenured Gen

[非ヒープ使用量を監視する]-[領域全体]

NON_HEAP

[非ヒープ使用量を監視する]-[Code Cache]

Code Cache

[非ヒープ使用量を監視する]-[Metaspace]

Metaspace

[非ヒープ使用量を監視する]-[CodeHeap non-nmethods]

CodeHeap non-nmethods

[非ヒープ使用量を監視する]-[CodeHeap profiled]

CodeHeap profiled nmethods

[非ヒープ使用量を監視する]-[CodeHeap non-profiled]

CodeHeap non-profiled nmethods

[非ヒープ使用量を監視する]-[Compressed Class Space]

Compressed Class Space

[JVM種別]に[Oracle Java(usage monitoring)]を選択、かつ監視対象Java VMの起動オプションに「-XX::+UseG1GC」が付加されている場合、jramemory.statにおけるNo3のJavaメモリプール名は以下の通りです。

監視項目

memory_nameとして出力する文字列

[ヒープ使用量を監視する]-[領域全体]

HEAP

[ヒープ使用量を監視する]-[Eden Space]

G1 Eden Space

[ヒープ使用量を監視する]-[Survivor Space]

G1 Survivor Space

[ヒープ使用量を監視する]-[Tenured Gen(Old Gen)]

G1 Old Gen

[非ヒープ使用量を監視する]-[領域全体]

NON_HEAP

[非ヒープ使用量を監視する]-[Code Cache]

Code Cache(Java 9以降の場合、出力なし)

[非ヒープ使用量を監視する]-[Metaspace]

Metaspace

[非ヒープ使用量を監視する]-[CodeHeap non-nmethods]

CodeHeap non-nmethods

[非ヒープ使用量を監視する]-[CodeHeap profiled]

CodeHeap profiled nmethods

[非ヒープ使用量を監視する]-[CodeHeap non-profiled]

CodeHeap non-profiled nmethods

[非ヒープ使用量を監視する]-[Compressed Class Space]

Compressed Class Space

監視対象Java VMがOracle JRockitの場合([JVM 種別]で[JRockit]選択時)、jramemory.statにおけるNo3のJavaメモリプール名は以下の通りです。

監視項目

memory_nameとして出力する文字列

[ヒープ使用率を監視する]-[領域全体]

HEAP memory

[ヒープ使用率を監視する]-[Nursery Space]

Nursery

[ヒープ使用率を監視する]-[Old Space]

Old Space

[非ヒープ使用率を監視する]-[領域全体]

NON_HEAP

[非ヒープ使用率を監視する]-[Class Memory]

Class Memory

JVM統計ログjramemory.statにおけるJavaメモリプール名と、Java VMメモリ空間の関係は以下の通りです。

  • Oracle Java 7の場合

    _images/img_java-memory-pool-name-10.png

    図 6.15 Java VMメモリ空間(Oracle Java 7)

    図中のNo

    監視項目

    jramemory.statのJavaメモリプール名

    (1)

    [ヒープ使用率を監視する]-[領域全体]

    HEAP

    (2)

    [ヒープ使用率を監視する]-[Eden Space]

    EdenSpace
    PS Eden Space
    Par Eden Space

    (3)+(4)

    [ヒープ使用率を監視する]-[Survivor Space]

    Survivor Space
    PS Survivor Space
    Par Survivor Space

    (5)

    [ヒープ使用率を監視する]-[Tenured Gen]

    Tenured Gen
    PS Old Gen
    CMS Old Gen

    (6)

    [非ヒープ使用率を監視する]-[Perm Gen]
    [非ヒープ使用率を監視する]-[Perm Gen[shared-ro]]
    [非ヒープ使用率を監視する]-[Perm Gen[shared-rw]]
    Perm Gen
    Perm Gen [shared-ro]
    Perm Gen [shared-rw]
    PS Perm Gen
    CMS Perm Gen

    (7)

    [非ヒープ使用率を監視する]-[Code Cache]

    Code Cache

    (8)

    -

    -

    (6)+(7)

    [非ヒープ使用率を監視する]-[領域全体]

    NON_HEAP
    ※スタックトレースは含みません
  • Oracle Java 8/Oracle Java 9/Oracle Java 11の場合

    _images/img_java-memory-pool-name-20.png

    図 6.16 Java VMメモリ空間(Oracle Java 8/Oracle Java 9/Oracle Java 11)

    図中のNo

    監視項目

    jramemory.statのJavaメモリプール名

    (1)

    [ヒープ使用量を監視する]-[領域全体]

    HEAP

    (2)

    [ヒープ使用量を監視する]-[Eden Space]

    EdenSpace
    PS Eden Space
    Par Eden Space
    G1 Eden Space

    (3)+(4)

    [ヒープ使用量を監視する]-[Survivor Space]

    Survivor Space
    PS Survivor Space
    Par Survivor Space
    G1 Survivor Space

    (5)

    [ヒープ使用量を監視する]-[Tenured Gen]

    Tenured Gen
    PS Old Gen
    CMS Old Gen
    G1 Old Gen

    (6)

    [非ヒープ使用量を監視する]-[Code Cache]

    Code Cache(Java 9以降の場合、出力なし)

    (6)

    [非ヒープ使用量を監視する]-[CodeHeap non-nmethods]

    CodeHeap non-nmethods(Java 9以降の場合のみ出力)

    (6)

    [非ヒープ使用量を監視する]-[CodeHeap profiled]

    CodeHeap profiled nmethods(Java 9以降の場合のみ出力)

    (6)

    [非ヒープ使用量を監視する]-[CodeHeap non-profiled]

    CodeHeap non-profiled nmethods(Java 9以降の場合のみ出力)

    (7)

    [非ヒープ使用量を監視する]-[Metaspace]

    Metaspace

    (8)

    [非ヒープ使用量を監視する]-[Compressed Class Space]

    Compressed Class Space

    (6)+(7)+(8)

    [非ヒープ使用量を監視する]-[領域全体]

    NON_HEAP

  • Oracle JRockitの場合

    _images/img_java-memory-pool-name-30.png

    図 6.17 Java VMメモリ空間(Oracle JRockit)

    図中のNo

    監視項目

    jramemory.statのJavaメモリプール名

    (1)

    [ヒープ使用率を監視する]-[領域全体]

    HEAP memory

    (2)

    [ヒープ使用率を監視する]-[Nursery Space]

    Nursery

    (3) 2

    [ヒープ使用率を監視する]-[Old Space]

    Old Space

    -

    [非ヒープ使用率を監視する]-[領域全体]

    NON_HEAP

    -

    [非ヒープ使用率を監視する]-[Class Memory]

    Class Memory

    2

    jramemory.stat のJavaメモリプール名"Old Space"については、HEAP内のold領域の値ではなく、"HEAP memory"全体と同値となります。(3)のみの計測はできません。

6.33.17. 異常検出時に障害原因別にコマンドを実行するには

モニタリソースの異常検出時、CLUSTERPROでは障害原因別に異なるコマンドを区別して実行する手段を提供していません。
JVMモニタリソースでは障害原因別にコマンドを区別して実行可能です。異常検出時に実行します。

障害原因別に実行するコマンドの設定項目は以下の通りです。

障害原因

設定項目

・監視対象のJava VMへ接続失敗
・リソース計測失敗

[監視(固有)]タブ-[コマンド]

・ヒープ使用率
・非ヒープ使用率
・ヒープ使用量
・非ヒープ使用量

[監視(固有)]タブ-[調整]プロパティ-[メモリ]タブ-[コマンド]

・動作中のスレッド数

[監視(固有)]タブ-[調整]プロパティ-[スレッド]タブ-[コマンド]

・Full GC実行時間
・Full GC発生回数

[監視(固有)]タブ-[調整]プロパティ-[GC]タブ-[コマンド]

・WebLogicのワークマネージャのリクエスト
・WebLogicのスレッドプールのリクエスト

[監視(固有)]タブ-[調整]プロパティ-[WebLogic]タブ-[コマンド]

[コマンド]は障害原因の詳細をコマンドの引数として渡します。引数は[コマンド]の最後に結合して渡します。スクリプトなどを自身で作成し[コマンド]へ設定することにより、更に障害原因に特化した動作が可能です。引数として渡す文字列は以下の通りです。

引数として渡す文字列が複数記載している場合は、監視対象Java VMのGC方式によりいずれかを渡します。差異の詳細は「 6.33.16. Java メモリプール名について 」を参照してください。

(Oracle Javaの場合) (Oracle JRockitの場合)と記載がある場合は、JVM種別により異なります。記載がない場合、JVM種別による区別はありません。

障害原因の詳細

引数として渡す文字列

・監視対象のJava VMへ接続失敗
・リソース計測失敗

なし

[監視(固有)]タブ-[調整]プロパティ-[メモリ]タブ-[ヒープ使用率を監視する]-[領域全体]
(Oracle Javaの場合)

HEAP

[メモリ]タブ- [ヒープ使用率を監視する]-[Eden Space]
(Oracle Javaの場合)
EdenSpace
PSEdenSpace
ParEdenSpace
[メモリ]タブ- [ヒープ使用率を監視する]-[Survivor Space]
(Oracle Javaの場合)
SurvivorSpace
PSSurvivorSpace
ParSurvivorSpace
[メモリ]タブ- [ヒープ使用率を監視する]-[Tenured Gen]
(Oracle Javaの場合)
TenuredGen
PSOldGen
CMSOldGen
[メモリ]タブ- [非ヒープ使用率を監視する]-[領域全体]
(Oracle Javaの場合)

NON_HEAP

[メモリ]タブ- [非ヒープ使用率を監視する]-[Code Cache]
(Oracle Javaの場合)

CodeCache

[メモリ]タブ- [非ヒープ使用率を監視する]-[Perm Gen]
(Oracle Javaの場合)
PermGen
PSPermGen
CMSPermGen
[メモリ]タブ- [非ヒープ使用率を監視する]-[Perm Gen[shared-ro]]
(Oracle Javaの場合)
PermGen[shared-ro]
[メモリ]タブ- [非ヒープ使用率を監視する]-[Perm Gen[shared-rw]]
(Oracle Javaの場合)

PermGen[shared-rw]

[メモリ]タブ- [ヒープ使用量を監視する]-[領域全体](Oracle Java(usage monitoring)の場合)

HEAP

[メモリ]タブ- [ヒープ使用量を監視する]-[Eden Space](Oracle Java(usage monitoring)の場合)
EdenSpace
PSEdenSpace
ParEdenSpace
G1EdenSpace

[メモリ]タブ- [ヒープ使用量を監視する]-[Survivor Space](Oracle Java(usage monitoring)の場合)

SurvivorSpace
PSSurvivorSpace
ParSurvivorSpace
G1SurvivorSpace

[メモリ]タブ- [ヒープ使用量を監視する]-[Tenured Gen](Oracle Java(usage monitoring)の場合)

TenuredGen
PSOldGen
CMSOldGen
G1OldGen

[メモリ]タブ- [非ヒープ使用量を監視する]-[領域全体](Oracle Java(usage monitoring)の場合)

NON_HEAP

[メモリ]タブ- [非ヒープ使用量を監視する]-[Code Cache](Oracle Java(usage monitoring)の場合)

CodeCache

[メモリ]タブ- [非ヒープ使用量を監視する]-[Metaspace](Oracle Java(usage monitoring)の場合)

Metaspace

[メモリ]タブ - [非ヒープ使用量を監視する]-[CodeHeap non-nmethods](Oracle Java(usage monitoring)の場合)

non-nmethods

[メモリ]タブ - [非ヒープ使用量を監視する]-[CodeHeap profiled](Oracle Java(usage monitoring)の場合)

profilednmethods

[メモリ]タブ - [非ヒープ使用量を監視する]-[CodeHeap non-profiled](Oracle Java(usage monitoring)の場合)

non-profilednmethods

[メモリ]タブ - [非ヒープ使用量を監視する]-[Compressed Class Space](Oracle Java(usage monitoring)の場合)

CompressedClassSpace

[メモリ]タブ- [ヒープ使用率を監視する]-[領域全体]
(Oracle JRockitの場合)
HEAP
Heap
[メモリ]タブ- [ヒープ使用率を監視する]-[Nursery Space]
(Oracle JRockitの場合)

Nursery

[メモリ]タブ- [ヒープ使用率を監視する]-[Old Space]
(Oracle JRockitの場合)

OldSpace

[メモリ]タブ- [非ヒープ使用率を監視する]-[領域全体]
(Oracle JRockitの場合)

NON_HEAP

[メモリ]タブ- [非ヒープ使用率を監視する]-[Class Memory]
(Oracle JRockitの場合)

ClassMemory

[スレッド]タブ-[動作中のスレッド数を監視する]

Count

[GC]タブ-[Full GC 実行時間を監視する]

Time

[GC]タブ-[Full GC 発生回数を監視する]

Count

[WebLogic]タブ-[ワークマネージャのリクエストを監視する]-[待機リクエスト リクエスト数]

WorkManager_PendingRequests

[WebLogic]タブ-[スレッドプールのリクエストを監視する]-[待機リクエスト リクエスト数]

ThreadPool_PendingUserRequestCount

[WebLogic]タブ-[スレッドプールのリクエストを監視する]-[実行リクエスト リクエスト数]

ThreadPool_Throughput

以下に実行例に示します。

例1)

設定項目

設定内容

[監視(固有)]タブ-[調整]プロパティ-[GC]タブ-[コマンド]

/usr/local/bin/downcmd

[監視(固有)]タブ-[調整]プロパティ-[GC]タブ-[Full GC 発生回数を監視する]

1

[クラスタ]プロパティ-[JVM監視]タブ-[リソース計測設定]-[共通]タブ-[異常判定しきい値]

3

JVMモニタリソースは、異常判定しきい値回(3回)連続してFull GCが発生すると、モニタ異常を検出し、「/usr/local/bin/downcmd Cont」としてコマンドを実行します。

例2)

設定項目

設定内容

[監視(固有)]タブ-[調整]プロパティ-[GC]タブ-[コマンド]

"/usr/local/bin/downcmd" GC

[監視(固有)]タブ-[調整]プロパティ-[GC]タブ-[Full GC実行時間を監視する]

65536

[クラスタ]プロパティ-[JVM監視]タブ-[リソース計測設定]-[共通]タブ-[異常判定しきい値]

3

JVMモニタリソースは、異常判定しきい値回(3回)連続してFull GC 実行時間が 65535 ミリ秒超過すると、モニタ異常を検出し、「/usr/local/bin/downcmd GC Time」としてコマンドを実行します。

例3)

設定項目

設定内容

[監視(固有)]タブ-[調整]プロパティ-[メモリ]タブ-[コマンド]

"/usr/local/bin/downcmd" memory

[監視(固有)]タブ-[調整]プロパティ-[メモリ]タブ-[ヒープ使用率を監視する]

オン

[監視(固有)]タブ-[調整]プロパティ-[メモリ]タブ-[Eden Space]

80

[監視(固有)]タブ-[調整]プロパティ-[メモリ]タブ-[Survivor Space]

80

[クラスタ]プロパティ-[JVM監視]タブ-[リソース計測設定]-[共通]タブ-[異常判定しきい値]

3

JVMモニタリソースは、異常判定しきい値回(3回)連続してJava Eden Space の使用率およびJava Survivor Spaceの使用率が80%を超過すると、モニタ異常を検出し、「/usr/local/bin/downcmd memory EdenSpace SurvivorSpace」としてコマンドを実行します。

[コマンド]で設定したコマンドの終了を待つタイムアウト(秒)は、[クラスタのプロパティ] - [JVM監視] タブ - [コマンドタイムアウト] で設定します。これは上記各タブの [コマンド] で同じ値を適用します。[コマンド]個別には設定できません。
タイムアウトした場合、[コマンド]プロセスを強制終了させるような処理は実行しません。[コマンド]プロセスの後処理(例:強制終了)は、お客様が実行してください。タイムアウトした場合は、以下のメッセージをJVM運用ログへ出力します。

action thread execution did not finish. action is alive = <コマンド>

注意事項は以下の通りです。

  • Java VM の正常復帰検出時(異常→正常時)には [コマンド] は実行しません。

  • [コマンド] はJava VM異常検出時(しきい値の超過が異常判定しきい値回連続して発生した場合)を契機として実行します。しきい値の超過毎には実行しません。

  • 複数のタブにて [コマンド] を設定すると、同時に障害が発生した場合は複数の [コマンド]が実行されます。そのため、システム負荷にはご注意ください。

  • [監視(固有)] タブ - [調整] プロパティ - [WebLogic] タブ - [ワークマネージャのリクエストを監視する] - [待機リクエスト リクエスト数]、[監視(固有)] タブ - [調整] プロパティ- [WebLogic] タブ - [ワークマネージャのリクエストを監視する]-[待機リクエスト 平均値] を両方監視している場合、[コマンド] が同時に2回実行される可能性があります。
    これは、[クラスタ] プロパティ - [JVM監視] タブ - [リソース計測設定] - [WebLogic] タブ- [インターバル リクエスト数]と[クラスタ]プロパティ-[JVM監視]タブ-[リソース計測設定]-[WebLogic]タブ-[インターバル 平均値]の異常検出が同時に発生する可能性があるためです。回避策としては、どちらか一方のみ監視するようにしてください。以下の監視項目の組み合わせも同様です。
  • [監視(固有)]タブ-[調整]プロパティ-[WebLogic]タブ-[スレッドプールのリクエストを監視する]-[待機リクエスト リクエスト数]と、[監視(固有)]タブ-[調整]プロパティ-[WebLogic]タブ-[スレッドプールのリクエストを監視する]-[待機リクエスト 平均値]

  • [監視(固有)]タブ-[調整]プロパティ-[WebLogic]タブ-[スレッドプールのリクエストを監視する]-[実行リクエスト リクエスト数]と、[監視(固有)]タブ-[調整]プロパティ-[WebLogic]タブ-[スレッドプールのリクエストを監視する]-[実行リクエスト 平均値]

6.33.18. WebLogic Server を監視するには

監視対象のWebLogic Serverの設定が終了しアプリケーションサーバとして稼動させる手順は、WebLogic Serverのマニュアルを参照してください。
本章では、JVMモニタリソースで監視するために必要な設定のみについて記述します。
  1. WebLogic Server Administration Consoleを起動します。
    起動方法は、WebLogic Serverマニュアルの「Administration Console の概要」を参照してください。
    ドメインコンフィグレーション-ドメイン-コンフィグレーション-全般を選択します。ここで「管理ポートの有効化」のチェックがオフになっていることを確認してください
  2. ドメインコンフィグレーション-サーバを選択し、監視対象のサーバ名を選択します。選択したサーバ名は Cluster WebUI の設定モードから選択可能な[プロパティ]-[監視(固有)] タブの識別名に設定します。CLUSTERPRO X の『リファレンスガイド』 - 「モニタリソースの詳細」 - 「JVMモニタリソースを理解する」を参照してください。

  3. 監視対象のサーバのコンフィグレーション-全般で「リスンポート」で管理接続するポート番号を確認します。

  4. WebLogic Serverを停止します。停止方法は、WebLogic Serverマニュアルの「WebLogic Server の起動と停止」を参照してください。

  5. WebLogic Serverの管理サーバ起動スクリプト(startWebLogic.sh)を開きます。

  6. 開いたスクリプトに以下の内容を記述します。

  • 監視対象がWebLogic Serverの管理サーバの場合

    JAVA_OPTIONS="${JAVA_OPTIONS}
    -Dcom.sun.management.jmxremote.port=n
    -Dcom.sun.management.jmxremote.ssl=false
    -Dcom.sun.management.jmxremote.authenticate=false
    -Djavax.management.builder.initial=weblogic.management.jmx.mbeanserver.WLSMBeanServerBuilder"
    
    ※ 上記内容は実際には1行で記述してください。
  • 監視対象がWebLogic Serverの管理対象サーバの場合

    if [ "${SERVER_NAME}" = "SERVER_NAME" ]; then
        JAVA_OPTIONS="${JAVA_OPTIONS}
        -Dcom.sun.management.jmxremote.port=n
        -Dcom.sun.management.jmxremote.ssl=false
        -Dcom.sun.management.jmxremote.authenticate=false
        -Djavax.management.builder.initial=weblogic.management.jmx.mbeanserver.WLSMBeanServerBuilder"
    fi
    
    ※ 上記でif文の中は実際には1行で記述してください。

注釈

n は、監視のために使用するポート番号を指定します。指定するポート番号は監視対象のJava VMのリスンポート番号とは別の番号を指定してください。また同一のマシンに複数の監視対象のWebLogic Serverが存在する場合、そのリスニング・ポート番号や他のアプリケーションのポート番号と重複しないポート番号を指定してください。

注釈

SERVER_NAMEは、「監視対象サーバ選択」で確認した監視対象となるサーバ名を指定します。監視対象のサーバが複数の場合、同様の設定(1~6行目)に対してサーバ名を変更し、繰り返し設定してください。

注釈

上記の記述内容の追加箇所は、以下の記述より前に記述するようにしてください。

${JAVA_HOME}/bin/java ${JAVA_VM} ${MEM_ARGS} ${JAVA_OPTIONS} -Dweblogic.Name=${SERVER_NAME} -Djava.security.policy=${WL_HOME}/server/lib/weblogic.policy ${PROXY_SETTINGS} ${SERVER_CLASS}

※ 上記内容は実際には1行で記述してください

※ WebLogicのバージョンによって、上記の java 引数の内容が異なっている場合がありますが、java の実行前にJAVA_OPTIONSを記述していただければ問題ありません。

注釈

[メモリタブ]の[Perm Gen[shared-ro]]や [Perm Gen[shared-rw]]を監視する場合、以下を追加してください。

-client -Xshare:on -XX:+UseSerialGC
  1. ワークマネージャやスレッドプールのリクエストを監視する場合は、以下の設定を行ってください。
    監視対象のWebLogic ServerのWLST(wlst.sh)を起動します。表示されたコンソール画面上で、以下のコマンドを実行してください。
    > connect('USERNAME','PASSWORD','t3://SERVER_ADDRESS:SERVER_PORT')
    > edit()
    > startEdit()
    > cd('JMX/DOMAIN_NAME')
    > set('PlatformMBeanServerUsed','true')
    > activate()
    > exit()

    上記のUSERNAMEPASSWORDSERVER_ADDRESSSERVER_PORTDOMAIN_NAMEはドメイン環境に応じた値に置き換えてください

  2. 監視対象のWebLogic Serverを再起動します

6.33.19. WebOTX を監視するには

本ガイドでは、JVM モニタリソースで監視する対象の WebOTX の設定手順について記述します。
WebOTX統合運用管理コンソールを起動します。起動方法は「WebOTX運用編(Web版統合運用管理ツール)」マニュアルの「統合運用管理ツールの起動と終了」を参照してください。
以降の設定は、WebOTX 上の JMX エージェントの Java プロセスに対する監視を行う場合と、プロセスグループ上の Java プロセスに対する監視を行う場合とで設定内容が異なります。監視する対象に合わせて、設定してください。

6.33.20. WebOTX ドメインエージェントの Java プロセスを監視するには

特に設定作業は不要です。

6.33.21. WebOTX プロセスグループの Java プロセスを監視するには

  1. 統合運用管理ツールよりドメインと接続します。

  2. ツリービューより[<ドメイン名>]-[TPシステム]-[アプリケーショングループ]-[<アプリケーショングループ名>]-[プロセスグループ]-[<プロセスグループ名>]を選択します。

  3. 右側に表示される[JVMオプション]タブ内の[その他の引数]属性に、次のJavaオプションを1行で指定します。nは、ポート番号を指定します。同一のマシンに複数の監視対象のJava VMが存在する場合、重複しないポート番号を指定してください。ここで指定するポート番号は、Cluster WebUI ([モニタリソースのプロパティ]→[監視(固有)] タブ→[接続ポート番号]) でも設定します。

    -Dcom.sun.management.jmxremote.port=n
    -Dcom.sun.management.jmxremote.ssl=false
    -Dcom.sun.management.jmxremote.authenticate=false
    -Djavax.management.builder.initial=com.nec.webotx.jmx.mbeanserver.JmxMBeanServerBuilder
    
    ※ WebOTX V9.2以降では -Djavax.management.builder.initial の指定は不要です。
  4. 設定後、[更新]ボタンを押します。設定が完了したら、プロセスグループを再起動します。
    本設定は、WebOTX統合運用管理ツールの[Javaシステムプロパティ]タブ内の[Javaシステムプロパティ]属性にて指定することも可能です。その場合は、"-D"は指定せず、また、"="より前の文字列を「名前」に、"="より後ろの文字列を「値」に指定してください。

    設定タブ名

    項目名

    設定値

    監視(共通)

    監視タイミング

    常時

    回復動作

    回復動作

    最終動作のみ実行

    回復動作

    最終動作

    何もしない

    注釈

    WebOTX プロセスグループの機能でプロセス障害時の再起動を設定されている場合、CLUSTERPROからの復旧動作でプロセスグループの再起動を実行すると、WebOTX プロセスグループの機能が正常に動作しない場合があります。そのため、WebOTX プロセスグループを監視する場合はCluster WebUI からJVMモニタリソースに対して以下のように設定してください。

6.33.22. WebOTX notification 通知を受信するには

特定のリスナクラスを登録することにより、WebOTX が障害を検出すると notification が発行されます。JVM モニタリソースはその notification を受信し、JVM 運用ログへ以下のメッセージを通知します。

%1$s:Notification received. %2$s.

%1$s、%2$sの意味は以下のとおりです。

%1$s:監視対象Java VM
%2$s:notificationの通知メッセージ (ObjectName=**,type=**,message=**)

現在、監視可能なリソースのMBeanの詳細情報は以下のとおりです。

ObjectName

[domainname]:j2eeType=J2EEDomain,name=[domainname],category=runtime

notificationタイプ

nec.webotx.monitor.alivecheck.not-alive

メッセージ

failed

6.33.23. JBoss を監視するには

スタンドアローンモードに対する監視を行う場合と、ドメインモードに対する監視を行う場合とで設定内容が異なります。監視する対象に合わせて、設定してください。

JVMモニタリソースで監視する対象のJBoss の設定手順について記述します。

スタンドアローンモードの場合

  1. JBossを停止し、(JBossインストールパス)/bin/standalone.confをエディタから開きます。

  2. 開いた設定ファイルに、設定するJDKのバージョンに応じて以下の内容を記述します。nは、ポート番号を指定します。同一のマシンに複数の監視対象のJava VMが存在する場合、重複しないポート番号を指定してください。ここで指定するポート番号は、Cluster WebUI ([モニタリソースのプロパティ]→[監視(固有)]タブ→[接続ポート番号])でも設定します。
    JDK10以前を使用する場合は、以下の修正を行う。
    「if [ "x$JBOSS_MODULES_SYSTEM_PKGS" = "x" ]; then」より前に以下を追加
    JBOSS_MODULES_SYSTEM_PKGS="org.jboss.logmanager"
    

    「if [ "x$JAVA_OPTS" = "x" ]; then … fi:」より後に以下を追加

    JAVA_OPTS="$JAVA_OPTS -Xbootclasspath/p:$JBOSS_HOME/modules/org/jboss/logmanager/main/jboss-logmanager-1.3.2.Final-redhat-1.jar"
    JAVA_OPTS="$JAVA_OPTS -Djava.util.logging.manager=org.jboss.logmanager.LogManager"
    JAVA_OPTS="$JAVA_OPTS -Dcom.sun.management.jmxremote.port=n -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false"
    
    JDK11以降を使用する場合は、以下の修正を行う。
    「if [ "x$JBOSS_MODULES_SYSTEM_PKGS" = "x" ]; then」より前に以下を追加
    JBOSS_MODULES_SYSTEM_PKGS="org.jboss.logmanager"
    

    「if [ "x$JAVA_OPTS" = "x" ]; then … fi:」より後に以下を追加

    JAVA_OPTS="$JAVA_OPTS -Xbootclasspath/a:$JBOSS_HOME/modules/org/jboss/logmanager/main/jboss-logmanager-1.3.2.Final-redhat-1.jar"
    JAVA_OPTS="$JAVA_OPTS -Djava.util.logging.manager=org.jboss.logmanager.LogManager"
    JAVA_OPTS="$JAVA_OPTS -Dcom.sun.management.jmxremote.port=n -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false"
    JAVA_OPTS="$JAVA_OPTS -Dsun.util.logging.disableCallerCheck=true"
    

    ※ jboss-logmanager-*.jarはJBossのバージョンによって格納ディレクトリ、ファイル名が異なりますため、インストールしている環境に合わせてパスを指定してください。

  3. 上記設定を保存した後、JBossを起動します。

  4. Cluster WebUI (JVMモニタリソース名→[プロパティ]→[監視(固有)] タブ→[識別名]) には他の監視対象と重ならない任意の文字列(例:JBoss)を設定してください。

ドメインモードの場合

  1. Cluster WebUI (JVMモニタリソース名→[プロパティ]→[監視(固有)] タブ→[識別名]) には他の監視対象と重ならない任意の文字列(例:JBoss)を設定してください。また、Cluster WebUI (JVMモニタリソース名→[プロパティ]→[監視(固有)] タブ→[プロセス名]) では、ユニークに特定できるようJava VM起動時オプションを全て指定してください。

6.33.24. Tomcat を監視するには

JVM モニタリソースで監視する対象の Tomcat の設定手順について記述します。

  1. Tomcatをrpmパッケージでインストールした場合、Tomcatを停止し、/etc/sysconfig/tomcat6 または /etc/sysconfig/tomcat を開きます。Tomcatをrpmパッケージでインストールしていない場合、Tomcatを停止し、(Tomcatインストールパス)/bin/setenv.sh を作成します。

  2. 開いた設定ファイルの Java オプションに以下の内容を 1 行で記述します。n は、ポート番号を指定します。同一のマシンに複数の監視対象のJava VMが存在する場合、重複しないポート番号を指定してください。ここで指定するポート番号は、Cluster WebUI ([モニタリソースのプロパティ]→[監視(固有)]タブ→[接続ポート番号])でも設定します。
    CATALINA_OPTS="${CATALINA_OPTS}
    -Dcom.sun.management.jmxremote.port=n
    -Dcom.sun.management.jmxremote.ssl=false
    -Dcom.sun.management.jmxremote.authenticate=false"
    
  3. 上記設定を保存した後、Tomcat を起動します。

  4. Cluster WebUI (JVMモニタリソース名→[プロパティ]→[監視(固有)] タブ→[識別名]) には他の監視対象と重ならない任意の文字列(例:tomcat)を設定してください。

6.33.25. SVF を監視するには

JVMモニタリソースで監視する対象のSVF の設定手順について記述します。

監視対象がTomcatの場合:

OS の SVF ユーザの環境変数を以下のように変更してください。nは、ポート番号を指定します。同一のマシンに複数の監視対象のJava VMが存在する場合、重複しないポート番号を指定してください。ここで指定するポート番号は、Cluster WebUI([モニタリソースのプロパティ]→[監視(固有)]タブ→[接続ポート番号])でも設定します。

JAVA_OPTS="-Xms512m -Xmx512m -Dcom.sun.management.jmxremote.port=n -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false"
export JAVA_OPTS

監視対象がTomcat以外の場合:

  1. 監視対象を下記より選択し、該当するスクリプトをエディタから開きます。

    監視対象

    編集するスクリプト

    Simple Httpd Service(8.xの場合)

    <SVFインストールパス>/bin/SimpleHttpd

    Simple Httpd Service(9.xの場合)

    <SVFインストールパス>/bin/UCXServer

    RDE Service

    <SVFインストールパス>/rdjava/rdserver/
    rd_server_startup.sh
    <SVFインストールパス>/rdjava/rdserver/
    svf_server_startup.sh

    RD Spool Balancer

    <SVFインストールパス>/rdjava/rdbalancer/
    rd_balancer_startup.sh

    SVF Print Spooler Service

    <SVFインストールパス>/bin/spooler

  2. Javaオプション指定箇所に下記の内容を1行で記述します。nは、ポート番号を指定します。同一のマシンに複数の監視対象のJava VMが存在する場合、重複しないポート番号を指定してください。ここで指定するポート番号は、Cluster WebUI ([モニタリソースのプロパティ]→[監視(固有)]タブ→[接続ポート番号])でも設定します。
    JAVA_OPTIONS="${JAVA_OPTIONS} -Dcom.sun.management.jmxremote.port=n -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false"
    
  3. 監視対象がRDE Serviceの場合、下記の起動パス中およびrd_balancer_startup.shに${JAVA_OPTIONS}を追記します。

    java -Xmx256m -Xms256m -Djava.awt.headless=true ${JAVA_OPTIONS} -classpath $CLASSPATH jp.co.fit.vfreport.RdSpoolPlayerServer &
    

6.33.26. 自製の Java アプリケーションを監視するには

JVMモニタリソースで監視する対象のJavaアプリケーションの設定手順について記述します。監視対象のJavaアプリケーションが停止した状態で、Javaアプリケーションの起動時オプションに次のJavaオプションを1行で指定します。nは、監視のために使用するポート番号を指定します。同一のマシンに複数の監視対象のJava VMが存在する場合、重複しないポート番号を指定してください。ここで指定するポート番号は、Cluster WebUI([モニタリソースのプロパティ]→[監視(固有)]タブ→[接続ポート番号])でも設定します。

-Dcom.sun.management.jmxremote.port=n
-Dcom.sun.management.jmxremote.ssl=false
-Dcom.sun.management.jmxremote.authenticate=false

Javaアプリケーションによっては以下も追加で指定必要です。

-Djavax.management.builder.initial=<MBeanServerBuilder のクラス名>

6.34. システムモニタリソースの設定

システムモニタリソースは、システムリソースの統計情報を継続的に収集し、一定のナレッジ情報にしたがい解析を行います。解析の結果からリソース枯渇の発生を早期検出する機能を提供します。

6.34.1. 監視(固有) タブ

CPU使用率の監視

CPU使用率の監視を行うかどうかを設定します。

  • チェックボックスがオン
    CPU使用率の監視を行います。
  • チェックボックスがオフ
    CPU使用率の監視を行いません。

使用率 (1~100)

CPU使用率の異常を検出するしきい値を設定します。

継続時間 (1~1440)

CPU使用率の異常を検出する時間を設定します。
指定した時間以上連続してしきい値を超過した場合、異常を検出します。

総メモリ使用量の監視

総メモリ使用量の監視を行うかどうかを設定します。

  • チェックボックスがオン
    総メモリ使用量の監視を行います。
  • チェックボックスがオフ
    総メモリ使用量の監視を行いません。

使用量 (1~100)

メモリの使用量の異常を検出するしきい値(システムのメモリ搭載量に対する割合)を設定します。

継続時間 (1~1440)

総メモリ使用量の異常を検出する時間を設定します。
指定した時間以上連続してしきい値を超過した場合、異常を検出します。

総仮想メモリ使用量の監視

総仮想メモリ使用量の監視を行うかどうかを設定します。

  • チェックボックスがオン
    総仮想メモリ使用量の監視を行います。
  • チェックボックスがオフ
    総仮想メモリ使用量の監視を行いません。

使用量 (1~100)

仮想メモリの使用量の異常を検出するしきい値を設定します。

継続時間 (1~1440)

総仮想メモリ使用量の異常を検出する時間を設定します。
指定した時間以上連続してしきい値を超過した場合、異常を検出します。

総オープンファイル数の監視

総オープンファイル数の監視を行うかどうかを設定します。

  • チェックボックスがオン
    総オープンファイル数の監視を行います。
  • チェックボックスがオフ
    総オープンファイル数の監視を行いません。

総オープンファイル数 (1~100)

オープンしているファイルの総数の異常を検出するしきい値(システム上限値に対する割合)を設定します。

継続時間 (1~1440)

総オープンファイル数の異常を検出する時間を設定します。
指定した時間以上連続してしきい値を超過した場合、異常を検出します。

総スレッド数の監視

総スレッド数の監視を行うかどうかを設定します。

  • チェックボックスがオン
    総スレッド数の監視を行います。
  • チェックボックスがオフ
    総スレッド数の監視を行いません。

総スレッド数 (1~100)

起動しているスレッドの総数の異常を検出するしきい値(システム上限値に対する割合)を設定します。

継続時間 (1~1440)

総スレッド数の異常を検出する時間を設定します。
指定した時間以上連続してしきい値を超過した場合、異常を検出します。

ユーザごとの起動プロセス数の監視

ユーザごとの起動プロセス数の監視を行うかどうかを設定します。

  • チェックボックスがオン
    ユーザごとの起動プロセス数の監視を行います。
  • チェックボックスがオフ
    ユーザごとの起動プロセス数の監視を行いません。

ユーザごとの起動プロセス数 (1~100)

ユーザごとの起動プロセス数の異常を検出するしきい値(システム上限値に対する割合)を設定します。

継続時間 (1~1440)

ユーザごとの起動プロセス数の異常を検出する時間を設定します。
指定した時間以上連続してしきい値を超過した場合、異常を検出します。

追加

監視するディスクを追加します。[監視条件の入力] ダイアログボックスが表示されます。
[監視条件の入力] ダイアログの説明に従い異常とする監視条件の詳細設定を行います。

削除

[ディスク一覧] で選択しているディスクを監視対象から削除します。

編集

[監視条件の入力]ダイアログボックスが表示されます。[ディスク一覧] で選択しているディスクの監視条件が表示されるので、編集して[OK]を選択します。

マウントポイント (1024 バイト以内)

監視を行うマウントポイントを設定します。[/] で始まる必要があります。

使用率

ディスク使用率の監視を行うかどうかを設定します。

  • チェックボックスがオン
    ディスク使用率の監視を行います。
  • チェックボックスがオフ
    ディスク使用率の監視を行いません。

警告レベル (1~100)

ディスク使用率の警報レベルの異常を検出するしきい値を設定します。

通知レベル (1~100)

ディスク使用率の通知レベルの異常を検出するしきい値を設定します。

継続時間 (1~43200)

ディスク使用率の通知レベルの異常を検出する時間を設定します。
指定した時間以上連続してしきい値を超過した場合、異常を検出します。

空き容量

ディスク空き容量の監視を行うかどうかを設定します。

  • チェックボックスがオン
    ディスク空き容量の監視を行います。
  • チェックボックスがオフ
    ディスク空き容量の監視を行いません。

警告レベル (1~4294967295)

ディスク空き容量の警報レベルの異常を検出する容量(MB)を設定します。

通知レベル (1~4294967295)

ディスク空き容量の通知レベルの異常を検出する容量(MB)を設定します。

継続時間 (1~43200)

ディスク空き容量の通知レベルの異常を検出する時間を設定します。
指定した時間以上連続してしきい値を超過した場合、異常を検出します。

6.34.2. システムモニタリソースの注意事項

システムモニタリソースを利用する場合、zip および unzip のパッケージが必要です。

回復対象には System Resource Agent がリソース監視の異常を検出した際のフェイルオーバ対象リソースを指定してください。

System Resource Agent の設定値は、デフォルトで使用することを推奨します。

以下のような場合には、リソース監視の異常を検出できないことがあります。

  • システム全体のリソース監視で、しきい値をはさんで増減を繰り返している場合

動作中に OS の日付/時刻を変更した場合、10分間隔で行っている解析処理のタイミングが日付/時刻変更後の最初の一回だけずれてしまいます。以下のようなことが発生するため、必要に応じてクラスタのサスペンド・リジュームを行ってください。

  • 異常として検出する経過時間を過ぎても、異常検出が行われない。

  • 異常として検出する経過時間前に、異常検出が行われる。

クラスタのサスペンド・リジュームを行った場合、その時点から情報の収集を開始します。

SELinux の設定は permissive または disabled にしてください。
enforcingに設定すると CLUSTERPRO で必要な通信が行えない場合があります。

システムリソースの使用量の解析は10分間隔で行います。そのため、監視継続時間を経過してから最大10分後に異常を検出する場合があります。

ディスクリソースの使用量の解析は60分間隔で行います。そのため、監視継続時間を経過してから最大60分後に異常を検出する場合があります。

ディスクリソースの空き容量監視にて指定するディスクサイズは、実際のディスクサイズより小さい値を指定してください。大きい値を指定した場合、空き容量不足として異常検出します。

監視中のディスクを交換した場合、交換前と交換後のディスクにて以下のいずれかが異なる場合、それまでの解析情報はクリアします。

  • ディスクの総容量

  • ファイルシステム

スワップ領域を割り当てていないマシンでは、システムの総仮想メモリ使用量の監視のチェックを外してください。

ディスクリソース監視機能は、ディスクデバイス以外は監視対象外です。

System Resource Agentで収集しているディスク使用率は、ディスク総容量とディスク使用可能容量で計算しています。df(1) コマンドで表示されるディスク使用率とは算出方法の違いにより、値が若干異なる場合があります。

ディスクリソース監視機能で同時に監視できる最大のディスク数は64台です。

システムモニタリソースは収集した統計情報および解析情報をファイル出力します。これらのファイル数が下記最大個数に達した場合には、古いファイルから削除を行います。 (下記文中の <dataパス><インストールディレクトリ>/ha/sra/data/ となります。)

  • システムリソースの統計情報
    パス: <dataパス>/hasrm_monitor_list.xml.YYYYMMDDhhmmss.zip
    最大個数: 1500 個
  • システムリソースの解析情報
    パス: <dataパス>/hasrm_analyze_list.xml.YYYYMMDDhhmmss.zip
    最大個数: 3 個
  • ディスクリソースの統計情報
    パス: <dataパス>/hasrm_diskcapacity_monitor_list.xml.YYYYMMDDhhmmss.zip
    最大個数: 10 個
  • ディスクリソースの解析情報
    パス: <dataパス>/hasrm_diskcapacity_analyze_list.xml.YYYYMMDDhhmmss.zip
    最大個数: 3 個

6.34.3. システムモニタリソースの監視方法

システムモニタリソースは、以下の監視を行います。
システムおよびディスクのリソースの使用量を継続的に収集し、解析します。
リソースの使用量があらかじめ設定したしきい値以上になった場合、異常を検出します。
異常を検出した状態が監視継続時間連続すると、リソース監視の異常を通知します。

システムリソース監視をデフォルト値で運用した場合、リソースの使用量が 90% 以上の状態が連続すると、 60 分後にリソース監視の異常を通知します。

以下に、システムリソース監視をデフォルト値で運用した場合の総メモリ使用量の異常検出の例を示します。

  • 総メモリ使用量が経過時間と共に総メモリ使用量のしきい値以上の状態が続き、一定時間以上になった

    以下の図では、総メモリ使用量がしきい値(90%)以上の状態が続き、連続して監視継続時間(60分)以上になったため、総メモリ使用量の異常を検出します。

    _images/img_how-system-monitor-resources-perform-monitoring-10.png

    図 6.18 総メモリ使用量のしきい値以上の状態が一定時間続いた場合(異常検出する)

  • 総メモリ使用量が経過時間と共に総メモリ使用のしきい値の前後で増減し、連続して総メモリ使用量のしきい値以上にならない

    以下の図では、総メモリ使用量は一時的に総メモリ使用量のしきい値(90%)以上になります。 しかし、そのしきい値を超える状態も監視継続時間(60分)連続することなく推移しているため、総メモリ使用量の異常を検出しません。

    _images/img_how-system-monitor-resources-perform-monitoring-20.png

    図 6.19 総メモリ使用量のしきい値以上の状態が一定時間続かない場合(異常検出しない)

ディスクリソース監視をデフォルト値で運用した場合、 24 時間後に通知レベルの異常を通知します。

以下に、ディスクリソース監視をデフォルト値で運用した場合のディスク使用率の異常検出の例を示します。

警告レベルのディスク容量監視

  • ディスク使用率が警告レベル上限値で指定された一定のしきい値以上になった

    ディスク使用率が警告レベル上限値を超えたため、ディスク容量監視異常と判定します。

    _images/img_how-system-monitor-resources-perform-monitoring-30.png

    図 6.20 ディスク使用率が警告レベル上限値以上になった場合(異常検出する)

  • ディスク使用率が一定の範囲内で増減し、警告レベル上限値で指定された一定のしきい値以上にならない

    ディスク使用率は警告レベル上限値を超えない範囲で増減しているため、ディスク容量監視異常と判定しません。

    _images/img_how-system-monitor-resources-perform-monitoring-40.png

    図 6.21 ディスク使用率が警告レベル上限値以上にならない場合(異常検出しない)

通知レベルのディスク容量監視

  • ディスク使用率が経過時間と共に通知レベル上限値で指定された一定のしきい値以上の状態が続き、一定時間以上になった

    ディスク使用率が通知レベル上限値を連続して超えたため、ディスク容量監視異常と判定します。

    _images/img_how-system-monitor-resources-perform-monitoring-50.png

    図 6.22 ディスク使用率において、通知レベル上限値以上の状態が一定時間続いた場合(異常検出する)

  • ディスク使用率が一定の範囲内で増減し、通知レベル上限値で指定された一定のしきい値以上にならない

    ディスク使用率は通知レベル上限値の前後で増減しているため、ディスク容量監視異常と判定しません。

    _images/img_how-system-monitor-resources-perform-monitoring-60.png

    図 6.23 ディスク使用率において、通知レベル上限値以上の状態が一定時間続かない場合(異常検出しない)

6.35. プロセスリソースモニタリソースの設定

プロセスリソースモニタリソースは、プロセスが使用するリソースの統計情報を継続的に収集し、一定のナレッジ情報にしたがい解析を行います。解析の結果からリソース枯渇の発生を早期検出する機能を提供します。

6.35.1. 監視(固有) タブ

プロセス名 (1023 バイト以内)

監視対象プロセスのプロセス名を設定します。プロセス名を設定しない場合、起動中のすべてのプロセスが対象となります。

また、次の 3 つのパターンでプロセス名のワイルドカード指定が可能です。このパターン以外の指定はできません。

【前方一致】 <プロセス名に含まれる文字列>*

【後方一致】 *<プロセス名に含まれる文字列>

【部分一致】 *<プロセス名に含まれる文字列>*

監視対象プロセス名に指定できるプロセス名は1023バイトまでです。1023バイトを超えるプロセス名を持つプロセスを監視対象として指定する場合は、ワイルドカード(*)を使って指定します。

監視対象プロセスのプロセス名が1023バイトより長い場合、プロセス名として認識できるのはプロセス名の先頭から1023バイトまでです。ワイルドカード(*)を使って指定する場合は、1024バイトまでに含まれる文字列を指定してください。

監視対象プロセス名は、実際に動作しているプロセスのプロセス名をps(1)コマンド等で確認し設定してください。

  • 実行結果の例

UID        PID  PPID  C STIME TTY          TIME CMD
root         1     0  0 Sep12 ?        00:00:00 init [5]
:
root      5314     1  0 Sep12 ?        00:00:00 /usr/sbin/acpid
root      5325     1  0 Sep12 ?        00:00:00 /usr/sbin/sshd
htt       5481     1  0 Sep12 ?        00:00:00 /usr/sbin/htt -retryonerror 0
上記のコマンド実行結果から /usr/sbin/htt を監視する場合、
/usr/sbin/htt -retryonerror 0 を監視対象プロセス名に指定します。

監視対象プロセス名に指定したプロセス名はプロセスの引数もプロセス名の一部として監視対象のプロセスを特定します。監視対象プロセス名を指定する場合は、引数を含めたプロセス名を指定してください。引数を含めずプロセス名のみ監視したい場合は、ワイルドカード(*)を使い、引数を含めない前方一致または部分一致で指定してください。

CPU使用率の監視

CPU使用率の監視を行うかどうかを設定します。

  • チェックボックスがオン
    CPU使用率の監視を行います。
  • チェックボックスがオフ
    CPU使用率の監視を行いません。

使用率(1~100)

CPU使用率の異常を検出するしきい値を設定します。

継続時間(1~129600)

CPU使用率の異常を検出する時間を設定します。
指定した時間以上連続してしきい値を超過した場合、異常を検出します。

メモリ使用量の監視

メモリ使用量の監視を行うかどうかを設定します。

  • チェックボックスがオン
    メモリ使用量の監視を行います。
  • チェックボックスがオフ
    メモリ使用量の監視を行いません。

初回監視時からの増加率(1~1000)

メモリ使用量の異常を検出するしきい値を設定します。

最大更新回数(1~129600)

メモリ使用量の異常を検出する更新回数を設定します。
指定した更新回数以上連続してしきい値を超過した場合、異常を検出します。

オープンファイル数の監視(最大値)

オープンファイル数の監視(最大値)を行うかどうかを設定します。

  • チェックボックスがオン
    オープンファイル数の監視を行います。
  • チェックボックスがオフ
    オープンファイル数の監視を行いません。

更新回数(1~1024)

オープンファイル数の異常を検出する更新回数を設定します。
オープンファイル数の最大値を指定した回数以上更新した場合、異常を検出します。

オープンファイル数の監視(カーネル上限値)

オープンファイル数の監視(カーネル上限値)を行うかどうかを設定します。

  • チェックボックスがオン
    オープンファイル数の監視を行います。
  • チェックボックスがオフ
    オープンファイル数の監視を行いません。

割合(1~100)

オープンファイル数の異常を検出するしきい値(カーネル上限値に対する割合)を設定します。

スレッド数の監視

スレッド数の監視を行うかどうかを設定します。

  • チェックボックスがオン
    スレッド数の監視を行います。
  • チェックボックスがオフ
    スレッド数の監視を行いません。

継続時間(1~129600)

スレッド数の異常を検出する時間を設定します。
スレッド数が増加し、指定した時間以上経過したプロセスがある場合、異常を検出します。

ゾンビプロセスの監視

ゾンビプロセスの監視を行うかどうかを設定します。

  • チェックボックスがオン
    ゾンビプロセスの監視を行います。
  • チェックボックスがオフ
    ゾンビプロセスの監視を行いません。

継続時間(1~129600)

ゾンビプロセスを検出する時間を設定します。
ゾンビプロセスとなって指定時間以上経過したプロセスがある場合、異常を検出します。

同一名プロセスの監視

同一名プロセスの監視を行うかどうかを設定します。

  • チェックボックスがオン
    同一名プロセスの監視を行います。
  • チェックボックスがオフ
    同一名プロセスの監視を行いません。

個数(1~10000)

同一名プロセスの異常を検出する個数を設定します。
同一名プロセスが指定した個数以上存在する場合、異常を検出します。

6.35.2. プロセスリソースモニタリソースの注意事項

プロセスリソースモニタリソースを利用する場合、zip および unzip のパッケージが必要です。

プロセスリソースモニタリソースの設定値は、デフォルトで使用することを推奨します。

スワップアウトされているプロセスについては、リソース異常の検出対象になりません。

動作中に OS の日付/時刻を変更した場合、10分間隔で行っている解析処理のタイミングが日付/時刻変更後の最初の一回だけずれてしまいます。以下のようなことが発生するため、必要に応じてクラスタのサスペンド・リジュームを行ってください。

  • 異常として検出する経過時間を過ぎても、異常検出が行われない。

  • 異常として検出する経過時間前に、異常検出が行われる。

クラスタのサスペンド・リジュームを行った場合、その時点から情報の収集を開始します。

SELinux の設定は permissive または disabled にしてください。

enforcingに設定すると CLUSTERPRO で必要な通信が行えない場合があります。

プロセスリソースの使用量の解析は10分間隔で行います。そのため、監視継続時間を経過してから最大10分後に異常を検出する場合があります。

プロセスリソースモニタリソースは収集した統計情報および解析情報をファイル出力します。これらのファイル数が下記最大個数に達した場合には、古いファイルから削除を行います。 (下記文中の <dataパス> は <インストールディレクトリ>/ha/sra/data/ となります。)

  • プロセスリソースの統計情報
    パス: <dataパス>/hasrm_monitor_list.xml.YYYYMMDDhhmmss.zip
    最大個数: 1500 個
  • プロセスリソースの解析情報
    パス: <dataパス>/hasrm_analyze_list.xml.YYYYMMDDhhmmss.zip
    最大個数: 3 個

プロセスリソースモニタリソースのステータスを異常から正常に戻すには、以下のいずれかを実施してください。

  • クラスタのサスペンド・リジューム

  • クラスタの停止・開始

6.35.3. プロセスリソースモニタリソースの監視方法

プロセスリソースモニタリソースは、以下の監視を行います。

プロセスリソースの使用量を継続的に収集し、解析します。

リソースの使用量があらかじめ設定したしきい値以上になった場合、異常を検出します。

異常を検出した状態が監視継続時間連続すると、リソース監視の異常を通知します。

プロセスリソース監視(CPU、メモリ、オープンファイル数、ゾンビプロセス)をデフォルト値で運用した場合、24 時間後にリソース監視の異常を通知します。

以下に、プロセスリソース監視のメモリ使用量の異常検出の例を示します。

  • メモリ使用量が経過時間と共に増減しながら、規定回数以上最大値を更新し、増加率が初期値の 10% 以上になった 最大値更新回数が24時間(デフォルト)以上になり、増加率も初期値の10%を上回っているため、メモリリークと判定します。

    _images/img_how-process-resource-monitor-resources-perform-monitoring-10.png

    図 6.24 メモリ使用量が規定回数以上最大値を更新し、増加率が初期値の10%を超過(異常検出する)

  • メモリ使用量が経過時間と共に一定の範囲内で増減

    メモリ使用量は、一定の値未満の範囲で増減しているため、メモリリークと判定しません。

    _images/img_how-process-resource-monitor-resources-perform-monitoring-20.png

    図 6.25 メモリ使用量が一定の範囲内で増減(異常検出しない)

7. ハートビートリソースの詳細

本章では、ハートビートリソースの詳細について説明します。

CLUSTERPRO X SingleServerSafe は、クラスタリングソフトウェアである CLUSTERPRO X との操作性などにおける親和性を高めるために、共通の画面を使用しています。

本章で説明する項目は以下のとおりです。

7.1. ハートビートリソース一覧

サーバの死活監視を行います。ハートビートデバイスには以下の種類があります。

ハートビートリソース名

略称

機能概要

LANハートビートリソース

lanhb

LAN を使用してサーバの死活監視を行います

  • LAN ハートビートは 1 つ設定する必要があります。

7.2. LAN ハートビートリソースの設定

7.2.1. LAN ハートビートリソースの注意事項

  • LAN ハートビートリソースは 1 つ設定する必要があります。

8. その他の設定の詳細

本章では、CLUSTERPRO X SingleServerSafe のその他の項目についての詳細を説明します。

CLUSTERPRO X SingleServerSafe は、クラスタリングソフトウェアである CLUSTERPRO X との操作性などにおける親和性を高めるために、共通の画面を使用しています。

本章で説明する項目は以下のとおりです。

8.1. クラスタプロパティ

「クラスタのプロパティ」では、CLUSTERPRO X SingleServerSafe の詳細情報の表示や設定変更ができます。

8.1.1. 情報タブ

クラスタ名の表示、コメントの登録、変更を行います。

クラスタ名

クラスタ名を表示します。ここでは名前の変更はできません。

コメント(127バイト以内)

コメントを設定します。半角英数字のみ入力可能です。

言語

表示言語を以下の中から選択します。Cluster WebUI を動作させる OS の言語(ロケール)に設定してください。

  • 英語

  • 日本語

  • 中国語

8.1.2. インタコネクトタブ

使用しません。

8.1.3. フェンシングタブ

使用しません。

8.1.4. タイムアウトタブ

タイムアウトなどの値を設定します。

サービス起動遅延時間 (0~9999)

OS 起動時にクラスタサービスの起動を遅延させる時間です。

同期待ち時間 (0~99)

使用しません。

ハートビート

ハートビート間隔および、ハートビートタイムアウトです。

  • インターバル (1~99)
    ハートビートの間隔です。
  • タイムアウト (2~9999)
    ハートビートタイムアウトです。ここで設定された時間の間無応答が続くとサーバダウンとみなします。
    • インターバルより大きい値である必要があります。

    • シャットダウン監視 (「 8.1.8. 監視タブ 」参照) をする場合は、アプリケーションを含めて OS がシャットダウンする時間より長い時間にする必要があります。

内部通信タイムアウト (1~9999)

CLUSTERPRO のコマンドを実行する際や、Cluster WebUI での操作、画面表示する際などに行われるCLUSTERPRO サーバの内部通信で使うタイムアウトです。

既定値

既定値に戻すときに使用します。[既定値] をクリックすると全ての項目に既定値が設定されます。

8.1.5. ポート番号タブ

TCP ポート番号、UDP ポート番号を設定します。

TCP

TCPの各ポート番号は重複できません。

  • 内部通信ポート番号(1~65535 3)
    内部通信で使うポート番号です。
  • Information Base ポート番号(1~65535 3)
    クラスタ情報管理で使うポート番号です。
  • データ転送ポート番号(1~65535 3 )
    トランザクション(構成情報反映/バックアップ、ライセンス情報送受信、コマンド実行)で使うポート番号です。
  • WebManager HTTPポート番号(1~65535 3 )
    ブラウザがCLUSTERPROサーバと通信するときに使うポート番号です。
  • API HTTP ポート番号(1~65535 3 )
    Restful API クライアントが CLUSTERPRO サーバと通信するときに使うポート番号です。
  • API 内部通信ポート番号(1~65535 3 )
    Restful API の内部通信で使うポート番号です。

UDP

UDP の各ポート番号は重複できません。

  • カーネルモードハートビートポート番号(1~65535 3 )
    カーネルモードハートビートで使うポート番号です。
  • アラート同期ポート番号(1~65535 3 )
    サーバ間でアラートメッセージを同期するときに使うポート番号です。
3(1,2,3,4,5,6,7,8)

Well-knownポート、特に 1~1023番の予約ポートの使用は推奨しません。

既定値

既定値に戻すときに使用します。[既定値] をクリックすると全ての項目に既定値が設定されます。

8.1.6. ポート番号(ミラー) タブ

使用しません。

8.1.7. ポート番号(ログ) タブ

ログの通信方法を設定します。

ログの通信方法

  • UDP
    ログの通信方法に UDP を使用します。
  • UNIX ドメイン
    ログの通信方法に UNIX ドメインを使用します。
  • メッセージキュー
    ログの通信方法に メッセージキューを使用します。

ポート番号 (1~65535)

ログの通信方法で UDP を選択した場合に使うポート番号です。[ポート番号] タブの UDP の各ポート番号と重複することはできません。

既定値

既定値に戻すときに使用します。[既定値] をクリックすると全ての項目に既定値が設定されます。

8.1.8. 監視タブ

監視に関する設定をします。

シャットダウン監視

CLUSTERPRO のコマンドでサーバシャットダウンを実行したときに、OS がストールしているか否か監視します。
クラスタサービスは OS がストールしていると判断すると強制的にサーバをリセットまたはパニックします。サーバのパニックは、監視方法 keepalive の場合のみ設定可能です。
  • 常に実行する
    シャットダウン監視をします。ハートビートタイムアウト (「 8.1.4. タイムアウトタブ 」参照) を、アプリケーションを含めて OS がシャットダウンする時間より長い時間にする必要があります。
  • グループ非活性処理に失敗した場合のみ実行する
    グループの非活性に失敗した場合のみシャットダウン監視をします。ハートビートタイムアウト (「 8.1.4. タイムアウトタブ 」参照) を、アプリケーションを含めて OS がシャットダウンする時間より長い時間にする必要があります。
  • 実行しない
    シャットダウン監視をしません。

監視方法

シャットダウン監視を行う場合の監視方法を以下の中から選択します。

  • softdog

  • ipmi

  • keepalive

タイムアウト発生時動作

OS がストールしていると判断した場合の動作を以下の中から選択します。監視方法に keepalive を選択した場合のみ設定できます。

  • RESET
    サーバをリセットします
  • PANIC
    サーバをパニックさせます

SIGTERM を有効にする

シャットダウン監視を行う場合に SIGTERM を有効にするかどうかを設定します。

注釈

[監視方法] で ipmi を選択して、[SIGTERM を有効にする] をオフに設定にしている場合、OS のシャットダウンが正常に終了してもリセットすることがあります。

ハートビートのタイムアウトを使用する

シャットダウン監視のタイムアウト値をハートビートタイムアウト値と連動させます。

タイムアウトを指定する (2~9999)

シャットダウン監視のタイムアウト値としてハートビートタイムアウト値を使用しない場合にタイムアウト値を指定します。

システムリソース

システムリソース情報を収集する/しないを設定します。

運用性向上のためにシステムリソース情報を定期的に収集します。システムリソース情報は、CLUSTERPRO の動作状況の調査に役立ち、システムリソース不足を起因とする障害の原因特定が容易になります。

  • チェックボックスがオン
    サーバ動作中に CPU やメモリ、プロセスなどのシステムリソース情報を定期的に収集します。
    収集したシステムリソース情報はclplogccコマンドやCluster WebUIによるログ収集で収集されます。
    clplogcc コマンドでのログ収集時には type2 を、Cluster WebUI でのログ収集時にはパターン 2 を指定してください。
    プロセスの起動数などのシステム稼働状況に依存しますが、リソース情報の保存には 450MB 以上のディスク領域が必要となります。
    本機能を利用するには、各サーバ上に zip および unzip のパッケージが必要です。
  • チェックボックスがオフ
    システムリソース情報を収集しません。

8.1.9. リカバリタブ

リカバリに関する設定をします。

クラスタサービスのプロセス異常時動作

クラスタサービスのプロセス異常時におけるアクションを指定します。

  • OSシャットダウン
    OSをシャットダウンします。
  • OS再起動
    OSを再起動します。

HAプロセス異常時動作

  • プロセス起動リトライ回数 (0~99)
    HA プロセス異常時の再起動回数を指定します。
  • リトライオーバ時の動作
    HA プロセス異常時における動作を指定します。
  • クラスタサービス停止
    クラスタサービスを停止します。
  • クラスタサービス停止 と OS シャットダウン
    クラスタサービスを停止し、OS をシャットダウンします。
  • クラスタサービス停止と OS 再起動
    クラスタサービスを停止し、OS を再起動します。

注釈

HAプロセスは、システムモニタリソースやプロセスリソースモニタリソース、JVMモニタリソース、システムリソース情報収集機能で使用されるプロセスです。

グループリソースの活性/非活性ストール発生時動作

グループリソースの活性/非活性ストール発生時における動作を指定します。

  • クラスタサービス停止と OS シャットダウン
    ストールが発生したサーバのクラスタサービスを停止し、OS をシャットダウンします。
  • クラスタサービス停止と OS 再起動
    ストールが発生したサーバのクラスタサービスを停止し、OS を再起動します。
  • sysrq パニック
    ストールが発生したサーバでsysrq のパニックを行います。
  • keepalive リセット
    ストールが発生したサーバで clpkhb ドライバ、clpka ドライバを使用し、OS をリセットします。
  • keepalive パニック
    ストールが発生したサーバで clpkhb ドライバ、clpka ドライバを使用し、OS をパニックします。
  • BMC リセット
    ストールが発生したサーバで ipmi のコマンドを使用し、サーバをハードウェアリセットします。
  • BMC パワーオフ
    ストールが発生したサーバで ipmi のコマンドを使用し、OS の電源をオフにします。OS の ACPI の設定により OSのシャットダウンが実行される場合があります。
  • BMC パワーサイクル
    ストールが発生したサーバで ipmi のコマンドを使用し、サーバのパワーサイクル (電源オフ/オン) を実行します。OSの ACPI の設定により OS のシャットダウンが実行される場合があります。
  • BMC NMI
    ストールが発生したサーバで ipmi のコマンドを使用し、サーバへ NMI を発生させます。NMI 発生後の挙動は OS の設定に依存します。
  • 何もしない(活性/非活性異常として扱う)
    グループリソースの活性/非活性異常検出時の復旧動作を行います。

注釈

「何もしない(活性/非活性異常として扱う)」を指定してストールが発生した場合、グループリソースへの影響が不定となりますので、「何もしない(活性/非活性異常として扱う)」への設定変更は推奨しません。
「何もしない(活性/非活性異常として扱う)」を指定する場合は、グループリソースの活性/非活性異常検出時の復旧動作の設定を以下のようにしてください。
  • 活性/非活性リトライしきい値 : 0 回

  • フェイルオーバしきい値 : 0 回

  • 最終動作 : OS停止を伴う動作

異常検出時のOS停止を伴う最終動作を抑制する

[詳細設定]をクリックし、異常検出時のOS停止を伴う最終動作の抑制を設定します。

  • グループリソースの活性異常検出時
    グループリソースの活性異常検出時の最終動作が OS 停止を伴うものに設定されている場合、活性異常検出時の最終動作が抑制されます。
  • グループリソースの非活性異常検出時
    グループリソースの非活性異常検出時の最終動作が OS 停止を伴うものに設定されている場合、非活性異常検出時の最終動作が抑制されます。
  • モニタリソースの異常検出時
    モニタリソースの異常検出時の最終動作が OS 停止を伴うものに設定されている場合、異常検出時の最終動作が抑制されます。

注釈

  • 外部連携モニタリソースは異常検出時の最終動作の抑止の対象にはなりません。

  • グループリソースの活性/非活性異常検出時の最終動作、およびモニタリソースの異常検出時の最終動作でOS停止を伴うものは以下の通りです。

    • クラスタサービス停止とOSシャットダウン

    • クラスタサービス停止とOS再起動

    • sysrqパニック

    • keepaliveリセット

    • keepaliveパニック

    • BMCリセット

    • BMCパワーオフ

    • BMCパワーサイクル

    • BMC NMI

両系活性検出時のシャットダウンを抑制する

使用しません。

8.1.10. アラートサービスタブ

アラート通報の設定を行います。

メール通報の機能を使用する場合は、Alert Serviceのライセンスを登録してください。

注釈

メール通報機能を使用するためにはCLUSTERPRO X Alert Service 5.0 for Linux を購入し、ライセンスを登録してください。

アラート通報設定を有効にする

アラート通報の設定を既定値から変更する/しない の設定をします。変更をする場合には、[編集]ボタンを押して出力先の設定をしてください。
チェックボックスをオフにすると 変更した出力先を一時的に既定値に戻すことができます。

メールアドレス (255バイト以内)

通報先のメールアドレスを入力します。メールアドレスを複数設定する場合は、メールアドレスをセミコロンで区切ってください。

件名 (127バイト以内)

メールの件名を入力します。

メール送信方法

メールの送信方法の設定をします。

  • MAIL
    mail コマンドを使います。事前に mail コマンドでメールアドレスにメールが送信されることを確認してください。
  • SMTP
    SMTP サーバと直接通信をしてメール通報します。

syslogにログレベルを出力する

CLUSTERPRO X SingleServerSafe が動作中に出力する syslog のメッセージにレベルを付加します。

ネットワーク警告灯を使用する

使用しません。

アラート送信先の変更

[編集] をクリックすると アラート送信先の変更ダイアログボックスが表示されます。

追加

送信先をカスタマイズしたいモジュールタイプ、イベント ID を追加します。[追加] ボタンを押すとメッセージの入力のダイアログが表示されます。

カテゴリ

モジュールタイプの大分類を選択します。

モジュールタイプ (31バイト以内)

送信先を変更するモジュールタイプ名を選択します。

イベントID

送信先を変更するモジュールタイプのイベントIDを入力します。イベントIDは『操作ガイド』の「エラーメッセージ一覧」の「syslog、アラート、メール通報、SNMP トラップメッセージ、Message Topic」を参照してください。

送信先

メッセージの送信として実行する処理を選択します。

  • System Log
    OSのsyslogへ送信します
  • Alert Logs
    アラートログにメッセージを表示します。
  • Mail Report
    メール通報機能で送信します。
  • SNMP Trap
    SNMP トラップ送信機能で送信します。
  • Message Topic
    Amazon SNSへ送信します。
  • Alert Extension
    指定されたコマンドを実行します(アラート拡張機能)。 [追加] ボタン、[編集] ボタンで実行するコマンドを設定・変更します。(最大4つのコマンドラインを指定することが出来ます)。

追加

アラート拡張機能のコマンドを追加します。[追加] ボタンを押すとコマンドの入力のダイアログが表示されます。コマンドは 1 つのイベント ID について 4 個まで登録できます。

削除

アラート拡張機能のコマンドを削除する場合に使用します。コマンドを選択して、[削除] をクリックしてください。

編集

アラート拡張機能のコマンドを変更する場合に使用します。コマンドを選択して、[編集] をクリックしてください。

コマンド (511バイト以内)

SNMP trap など通報を実行するコマンドを入力します。絶対パスで指定してください。指定したコマンドの実行結果は参照できません。

  • キーワードについて
    %%MSG%% を指定すると、該当のイベントIDのメッセージ本文が挿入されます。
    1つのコマンドに対して複数の %%MSG%% を使用することはできません。
    %%MSG%% の内容を含めて 511バイト以内になるように設定してください。また、%%MSG%% 内に空白文字が含まれることがありますので、コマンドの引数として指定する場合には、"%%MSG%%" と指定してください。

    設定例

    /usr/local/bin/snmptrap -v1 -c HOME 10.0.0.2 0 10.0.0.1 1 0 '' 1 s "%%MSG%%"
    

SMTP設定

[SMTP設定] をクリックするとメール通報で使用する [SMTP 設定] ダイアログボックスが表示されます。

メール送信文書の文字コード (127バイト以内)

メール通報で送信するメールの文字コードを設定します。

通信応答待ち時間 (1~999)

SMTP サーバとの通信のタイムアウトを設定します。

件名のエンコードをする

メールの件名のエンコードをする/しない を設定します。

SMTPサーバ一覧

設定されている SMTP サーバを表示します。本バージョンで設定できる SMTP サーバは 1台です。

追加

SMTP サーバを追加します。[追加] ボタンを押すと SMTP サーバの入力のダイアログが表示されます。

削除

SMTPサーバの設定を削除する場合に使用します。

編集

SMTP サーバの設定を変更する場合に使用します。

SMTPサーバ(255バイト以内)

SMTP サーバの IP アドレスまたはホスト名を設定します。

SMTPポート番号(1~65535)

SMTP サーバのポート番号を設定します。

差出人メールアドレス(255バイト以内)

メール通報で送信されるメールの送信元アドレスを設定します。

SMTP認証を有効にする

SMTP の認証をする/しない の設定をします。

認証方式

SMTP の認証の方式を選択します。

ユーザ名 (255バイト以内)

SMTP の認証で使用するユーザ名を設定します。

パスワード (255バイト以内)

SMTP の認証で使用するパスワードを設定します。

送信先一覧

設定されている SNMP トラップ送信先を表示します。本バージョンで設定できる SNMP トラップ送信先は 32件です。

追加

SNMP トラップ送信先を追加します。[追加] をクリックすると 送信先の入力ダイアログが表示されます。

削除

SNMP トラップ送信先の設定を削除する場合に使用します。

編集

SNMP トラップ送信先の設定を変更する場合に使用します。

送信先サーバ (255 バイト以内)

SNMP トラップ送信先のサーバ名を設定します。

SNMP ポート番号 (1-65535)

SNMP トラップ送信先のポート番号を設定します。

SNMP バージョン

SNMP トラップ送信先のSNMP バージョンを設定します。

SNMP コミュニティ名 (255 バイト以内)

SNMP トラップ送信先のSNMP コミュニティ名を設定します。

8.1.11. WebManager タブ

WebManager サーバを設定します。

WebManager サービスを有効にする

WebManager サービスを有効にします。

  • チェックボックスがオン
    WebManager サービスを有効にします。
  • チェックボックスがオフ
    WebManager サービスを無効にします。

通信方式

  • HTTP
    クライアントとの通信に暗号化を使用しません。
  • HTTPS
    クライアントとの通信に暗号化を使用します。

接続可能なクライアント台数(1~999)

接続可能なクライアント台数を設定します。

パスワードによって接続を制御する

[設定] をクリックすると [パスワード] ダイアログボックスが表示されます。

クラスタパスワード方式 / OS認証方式

Cluster WebUI にログインする方法を下記より選択します。

  • クラスタパスワード方式
    設定した操作用パスワード、参照用パスワードで認証する方式です。
  • OS認証方式
    OS のユーザ、パスワードで認証する方式です。

クラスタパスワード方式

  • 操作用パスワード
    Cluster WebUI に操作モード、設定モード、検証モードで接続するためのパスワードを設定します。
    [変更] をクリックすると [パスワードの変更] ダイアログボックスが表示されます。
  • 参照用パスワード
    Cluster WebUI に参照モードで接続するためのパスワードを設定します。
    [変更] をクリックすると [パスワードの入力] ダイアログボックスが表示されます。
    • 古いパスワード(255 バイト以内)
      変更前のパスワードを入力します。
      古いパスワードが設定されていない場合は何も入力しません。
    • 新しいパスワード(255 バイト以内)
      新しいパスワードを入力します。
      パスワードを削除する場合は何も入力しません。
    • パスワードの確認入力(255 バイト以内)
      新しいパスワードをもう一度入力します。

OS認証方式

Cluster WebUI にログインするユーザを事前にサーバに登録しておく必要があります。また、クラスタの操作権限はグループ単位に設定するため、グループをサーバに登録し、ユーザを所属させておく必要があります。

追加

[権限を与えるグループ一覧] にグループを追加する場合に使用します。[追加] をクリックすると [グループ名] ダイアログボックスが表示されます。新規に追加するグループは [操作権] のチェックボックスがオンの状態で追加されます。

  • グループ名 (255 バイト以内)
    権限を与えるグループ名を入力します。指定したグループに所属しているユーザに権限を与えます。
    グループは事前にサーバに登録しておく必要があります。

削除

[権限を与えるグループ一覧] からグループを削除する場合に使用します。
[権限を与えるグループ一覧] から削除するグループを選択して、[削除]をクリックしてください。

編集

グループを編集する場合に使用します。[権限を与えるグループ一覧] から編集するグループを選択して、[編集] をクリックします。選択されたグループが入力されている [グループ名] ダイアログボックスが表示されます。編集したグループの操作権は変わりません。

操作権

[権限を与えるグループ一覧] に登録されているグループに操作権を設定します。

  • チェックボックスがオン
    グループに所属しているユーザはクラスタの操作と状態表示が行えます。
  • チェックボックスがオフ
    グループに所属しているユーザはクラスタの状態表示のみ行えます。

ログインセッションの有効時間 (0~525600)

ログインセッションの有効時間です。0 に設定すると無期限となります。

自動ログアウト時間 (0~99999)

Cluster WebUI と WebManager サーバとの通信がない場合に自動的にログアウトする時間です。0 に設定すると自動ログアウトすることはありません。

ロックアウトのしきい値 (0~999)

連続してログインに失敗したクライアント IP アドレスをロックアウトするためのしきい値です。ロックアウトされたクライアント IP アドレスからは、ロックアウト期間が過ぎるまでログインできません。0 に設定すると、クライアント IP アドレスがロックアウトされることはありません。

ロックアウト期間 (1~99999)

ロックアウトされたクライアント IP アドレスが自動的にロック解除されるまでの時間です。

既定値

既定値に戻すときに使用します。[既定値] をクリックすると ログインセッションの有効時間自動ログアウト時間ロックアウトのしきい値ロックアウト期間 に既定値が設定されます。

クライアントIPアドレスによって接続を制御する

クライアントIPアドレスによって接続を制御します。

  • チェックボックスがオン
    [追加]、[削除]、[編集]ボタンが表示されます。
  • チェックボックスがオフ
    [追加]、[削除]、[編集]ボタンが表示されません。

追加

[接続を許可するクライアントIPアドレス一覧] に IP アドレスを追加する場合に使用します。[追加] をクリックするとIPアドレスの入力ダイアログボックスが表示されます。新規に追加する IP アドレスは操作権ありで追加されます。
  • IPアドレス(80バイト以内)
    接続を許可するクライアントIPアドレスを入力します。
    • IPアドレスの場合の例 : 10.0.0.21

    • ネットワークアドレスの場合の例 : 10.0.1.0/24

削除

[接続を許可するクライアントIPアドレス一覧] から IP アドレスを削除する場合に使用します。[接続を許可するクライアントIPアドレス一覧] から削除したい IP アドレスを選択して、[削除] をクリックしてください。

編集

IPアドレスを編集する場合に使用します。[接続を許可するクライアントIPアドレス一覧] から編集したいIPアドレスを選択して、[編集] をクリックします。選択された IP アドレスが入力されている IP アドレスの入力ダイアログボックスが表示されます。編集した IP アドレスの操作権は変わりません。

注釈

この接続を許可するクライアントIPアドレスはclprexecによる外部操作に対する接続制限にも使用されます。

操作権

[接続を許可するクライアントIPアドレス一覧] に登録されている IP アドレスに操作権を設定します。

  • チェックボックスがオン
    クライアントは CLUSTERPRO X SingleServerSafe の操作と状態表示が行えます。
  • チェックボックスがオフ
    クライアントは CLUSTERPRO X SingleServerSafe の状態表示のみ行えます。

Cluster WebUI の操作ログを出力する

Cluster WebUI の操作ログを出力します。
  • チェックボックスがオン
    Cluster WebUI の操作ログを出力します。
  • チェックボックスがオフ
    Cluster WebUI の操作ログを出力しません。

ログ出力先 (255 バイト以内)

Cluster WebUI 操作ログの出力先ディレクトリを指定します。絶対パスかつASCII文字で指定してください。

ファイルサイズ (1~10)

Cluster WebUI 操作ログのサイズを指定します。
指定したファイルサイズに達した場合はローテートが行われます。最大で5世代のログファイルが保存されます。

接続用IPアドレス

[設定] をクリックすると 統合 WebManager用IPアドレスダイアログ ボックスが表示されます。
  • 追加
    統合 WebManager 用 IP アドレスを追加します。各サーバのIPアドレスは、各サーバの列のセルをクリックして IP アドレスを選択または入力して設定します。
  • 削除
    通信経路を削除します。削除したい通信経路の列を選択して [削除] をクリックすると、選択していた経路が削除されます
  • 優先度
    統合 WebManager 用 IP アドレスを複数設定する場合、[優先度] 列の番号が小さい通信経路が優先的にクラスタ サーバ間の内部通信に使用されます。優先度を変更する場合は、矢印をクリックして、選択行の順位を変更します。

調整

WebManager サーバの調整を行う場合に使用します。[調整] をクリックすると [WebManager調整プロパティ] ダイアログボックスが表示されます。
  • クライアントセッションタイムアウト(1~999)
    WebManager サーバが Cluster WebUI と通信しなくなってからのタイムアウト時間です。
  • 画面データ更新インターバル(0~999)
    Cluster WebUI の画面データが更新される間隔です。
  • ミラーエージェントタイムアウト(1~999)
    使用しません。
  • ログファイルダウンロード有効期限(60~43200)
    サーバ上に一時保存したログ収集情報を削除するまでの有効期限です。ログ収集情報の保存ダイアログが表示されてから、保存を実行しないまま有効期限が経過するとサーバ上のログ収集情報は削除されます。
  • 時刻情報表示機能を使用する
    時刻情報表示機能の有効/無効を設定します。
    • チェックボックスがオン
      時刻情報表示機能を有効にします。
    • チェックボックスがオフ
      時刻情報表示機能を無効にします。
  • 既定値
    既定値に戻すときに使用します。[既定値] をクリックすると全ての項目に既定値が設定されます。

8.1.12. API タブ

API サービスの設定をおこないます。

API サービスを有効にする

API サービスを有効にします。

  • チェックボックスがオン
    API サービスを有効にします。
  • チェックボックスがオフ
    API サービスを無効にします。

通信方式

  • HTTP
    クライアントとの通信に暗号化を使用しません。
  • HTTPS
    クライアントとの通信に暗号化を使用します。

グループ単位で権限を設定する

クラスタの操作権限をグループ単位に設定、制御します。

  • チェックボックスがオン
    [追加]、[削除]、[編集] が表示されます。
  • チェックボックスがオフ
    [追加]、[削除]、[編集] が表示されません。

リクエストを発行するサーバにログインするユーザを事前にサーバに登録しておく必要があります。また、クラスタの操作権限はグループ単位に設定するため、グループをサーバに登録し、ユーザを所属させておく必要があります。

  • サーバがワークグループに所属している場合
    リクエストを発行するサーバ全てにユーザ、グループを同一名で登録します。
  • サーバがドメインに所属している場合
    ドメインにユーザ、グループを登録します。

追加

[権限を与えるグループ一覧] にグループを追加する場合に使用します。[追加] をクリックすると [グループ名] ダイアログボックスが表示されます。新規に追加するグループは [操作権] のチェックボックスがオンの状態で追加されます。

  • グループ名 (255 バイト以内)
    権限を与えるグループ名を入力します。指定したグループに所属しているユーザに権限を与えます。
    グループは事前にサーバに登録しておく必要があります。

削除

[権限を与えるグループ一覧] からグループを削除する場合に使用します。
[権限を与えるグループ一覧] から削除するグループを選択して、[削除]をクリックしてください。

編集

グループを編集する場合に使用します。[権限を与えるグループ一覧] から編集するグループを選択して、[編集] をクリックします。選択されたグループが入力されている [グループ名] ダイアログボックスが表示されます。編集したグループの操作権は変わりません。

操作権

[権限を与えるグループ一覧] に登録されているグループに操作権を設定します。

  • チェックボックスがオン
    グループに所属しているユーザはクラスタ操作と各種ステータスの取得が行えます。
  • チェックボックスがオフ
    グループに所属しているユーザは各種ステータスの取得のみ行えます。

クライアント IP アドレスによって接続を制御する

クライアント IP アドレスによって接続を制御します。

  • チェックボックスがオン
    [追加]、[削除]、[編集] が表示されます。
  • チェックボックスがオフ
    [追加]、[削除]、[編集] が表示されません。

追加

[接続を許可するクライアント IP アドレス一覧] に IP アドレスを追加する場合に使用します。[追加] をクリックすると IP アドレスの入力ダイアログボックスが表示されます。新規に追加する IP アドレスは操作権ありで追加されます。

  • IP アドレス (80 バイト以内)

    接続を許可するクライアント IP アドレスを入力します。

    • IP アドレスの場合の例 : 10.0.0.21

    • ネットワークアドレスの場合の例 : 10.0.1.0/24

削除

[接続を許可するクライアント IP アドレス一覧] からIP アドレスを削除する場合に使用します。[接続を許可するクライアント IP アドレス一覧] から削除したいIP アドレスを選択して、[削除] をクリックしてください。

編集

IP アドレスを編集する場合に使用します。[接続を許可するクライアント IP アドレス一覧] から編集したい IP アドレスを選択して、[編集] をクリックします。選択された IP アドレスが入力されている [IP アドレス] ダイアログボックスが表示されます。

操作権

[接続を許可するクライアント IP アドレス一覧] に登録されている IP アドレスに操作権を設定します。

  • チェックボックスがオン
    グループに所属しているユーザはクラスタ操作と各種ステータスの取得が行えます。
  • チェックボックスがオフ
    グループに所属しているユーザは各種ステータスの取得のみ行えます。

調整

API サービスの調整を行う場合に使用します。[調整]をクリックすると、[API 調整プロパティ] ダイアログボックスが表示されます。

  • 認証ロックアウトのしきい値
    HTTPサーバへの認証に連続して失敗した場合にロックアウトと判断する回数を設定します。
  • HTTPサーバ起動リトライ回数
    API サービスが HTTPサーバの起動に失敗した時の起動リトライ回数を設定します。
  • HTTPサーバ起動インターバル
    API サービスが HTTPサーバの起動に失敗した時から次の起動をリトライするまでの間隔を設定します。
  • 既定値
    既定値に戻すときに使用します。[既定値]をクリックすると全ての項目に既定値が設定されます。

8.1.13. 暗号化 タブ

クラスタ関連サービスの暗号化で使用するファイルおよびライブラリに関する設定を行います。

証明書ファイル

クライアント接続時に利用されるサーバ証明書ファイルを設定します。サーバ証明書ファイルは独自に用意する必要があります。

秘密鍵ファイル

クライアント接続時に利用される秘密鍵ファイルを設定します。秘密鍵ファイルは独自に用意する必要があります。

SSL ライブラリ

暗号化に利用する SSL ライブラリファイルを設定します。OpenSSL に含まれるSSL ライブラリファイルを選択します。インストールフォルダなど環境に応じて変更する必要があります。

Cryptoライブラリ

暗号化に利用する Crypto ライブラリファイルを設定します。OpenSSL に含まれる Crypto ライブラリファイルを選択します。インストールフォルダなど環境に応じて変更する必要があります。

8.1.14. アラートログタブ

アラートログを設定します。

アラートサービスを有効にする

サーバのアラートサービスを起動するかどうかの設定です。

  • チェックボックスがオン
    アラートサービスを有効にします。
  • チェックボックスがオフ
    アラートサービスを無効にします。

保存最大アラートレコード数(1~99999)

サーバのアラートサービスが保存できる最大のアラートメッセージ数です。

アラート同期 方法

使用しません。

アラート同期 通信タイムアウト(1~300)

使用しません。

既定値

既定値に戻すときに使用します。[既定値] をクリックすると全ての項目に既定値が設定されます。

8.1.15. 遅延警告タブ

遅延警告を設定します。遅延警告の詳細については「9. 監視動作の詳細」の「9.7. モニタリソースの遅延警告」を参照してください。

ハートビート遅延警告(0~100)

ハートビートの遅延警告の割合を設定します。ハートビートタイムアウト時間のここで指定した割合の時間内にハートビートの応答がない場合にアラートログに警告を表示します。100を設定すると警告を表示しません。

モニタ遅延警告(0~100)

モニタの遅延警告の割合を設定します。モニタタイムアウト時間のここで指定した割合の時間内にモニタの応答がない場合にアラートログに警告を表示します。100を設定すると警告を表示しません。

注釈

遅延警告で0%を指定するとハートビートインターバル、モニタインターバルごとにアラートログを表示します。
アラートログで監視にかかった時間を確認することができるので、テスト運用などで監視の時間を確認する場合は、0%を設定します。
本番環境では0%などの低い値は設定しないでください。

8.1.16. ミラーエージェントタブ

使用しません。

8.1.17. ミラードライバタブ

使用しません。

8.1.18. JVM 監視タブ

JVM監視で用いる詳細なパラメータを設定します。

注釈

Cluster WebUI でJVM監視タブを表示するためには、Java Resource Agentのライセンスが登録されている状態で [サーバ情報の更新]を実行する必要があります。

Javaインストールパス(255バイト以内)

JVM監視が使用するJava VMのインストールパスを設定します。絶対パスかつASCII文字で指定してください。末尾に"/"はつけないでください。指定例:/usr/java/jdk-9

最大Javaヒープサイズ(7~4096)

JVM監視が使用するJava VMの最大ヒープサイズをメガバイトで設定します(Java VM起動時オプションの-Xmxに相当)。

Java VM追加オプション (1024バイト以内)

JVM監視が使用するJava VMの起動時オプションを設定します。ただし、-Xmxは[最大Javaヒープサイズ]で指定してください。指定例:-XX:+UseSerialGC

ログ出力設定

[設定]ボタンを押すとログ出力設定入力のダイアログが表示されます。

リソース計測設定

[設定]ボタンを押すとリソース計測設定入力のダイアログが表示されます。

接続設定

[設定]ボタンを押すと接続設定入力のダイアログが表示されます。

コマンドタイムアウト(30~300)

JVM監視の各画面で指定する[コマンド]のタイムアウト値を設定します。[コマンド]共通の設定となります。

ログ出力設定

[設定]ボタンを押すとログ出力設定入力のダイアログが表示されます。

ログレベル

JVM監視が出力するログのログレベルを選択します。

保持する世代数(2~100)

JVM監視が出力するログについて保持する世代数を設定します。[ローテーション方式]にて[時間]を指定している場合、クラスタサスペンドを実行するとローテーション回数がリセットされるため、クラスタサスペンドごとに <CLUSTERPROインストールパス>/log/ha/jra 配下のログファイルが増加することに注意してください。

ローテーション方式

JVM監視が出力するログのローテーション方式を選択します。ファイルサイズによるログローテーションの場合、JVM 運用ログなどログ1ファイルあたりの最大サイズをキロバイトで設定します(範囲は200~2097151)。時間によるログローテーションの場合、ログローテーション開始時刻を"hh:mm"の形式(hh:時間を0~23、mm:分を0~59で指定)、ローテーションのインターバルを時間(範囲は1~8784)で設定します。

既定値

ログレベル、保持する世代数、ローテーション方式を既定値の設定に戻します。

リソース計測設定[共通]

[設定] ボタンを押すとリソース計測設定入力のダイアログが表示されます。JVM 監視が異常と判断する仕組みについては、「6. モニタリソースの詳細」を参照してください。

リトライ回数(1~1440)

JVM 監視がリソース計測失敗した時のリソース計測リトライ回数を設定します。

異常判定しきい値(1~10)

JVM 監視がリソース計測により取得した Java VM やアプリケーションサーバのリソース使用量が、お客様定義のしきい値を連続して超えた場合に異常と判断する回数を設定します。

インターバル メモリ使用量・動作スレッド数(15~600)

JVM 監視がメモリ使用量および動作スレッド数を計測するインターバルを設定します。

インターバル Full GC発生回数・実行時間(15~600)

JVM 監視が Full GC 発生回数および発生時間を計測するインターバルを設定します。

既定値

リトライ回数、異常判定しきい値、インターバルを既定値の設定に戻します。

リソース計測設定[WebLogic]

[設定] ボタンを押すとリソース計測設定入力のダイアログが表示されます。JVM 監視が異常と判断する仕組みについては、「6. モニタリソースの詳細」を参照してください。

リトライ回数(1~5)

JVM監視がリソース計測失敗した時のリソース計測リトライ回数を設定します。

異常判定しきい値(1~10)

JVM 監視がリソース計測により取得した Java VM やアプリケーションサーバのリソース使用量が、お客様定義のしきい値を連続して超えた場合に異常と判断する回数を設定します。

インターバル リクエスト数(15~600)

JVM監視がWebLogic監視におけるワークマネージャおよびスレッドプールのリクエスト数を計測するインターバルを設定します。

インターバル 平均値(15~600)

JVM 監視が WebLogic 監視におけるワークマネージャおよびスレッドプールのリクエスト数平均値を計測するインターバルを設定します。インターバル リクエスト数で設定されている整数倍の値を設定してください。

既定値

リトライ回数、異常判定しきい値、インターバルを既定値の設定に戻します。

接続設定

[設定] ボタンを押すと監視対象の Java VM への接続設定入力のダイアログが表示されます。

管理ポート番号(1~65535)

JVM モニタリソースが内部で使用するためのポート番号を設定します。他のポート番号と被らないようにしてください。32768~61000は非推奨です。

リトライ回数(1~5)

監視対象の Java VM へ接続失敗時のリトライ回数を設定します。

再接続までの待ち時間(15~60)

監視対象の Java VM へ接続失敗時に接続をリトライするまでのインターバルを設定します。

既定値

管理ポート番号、リトライ回数、再接続までの待ち時間を既定値の設定に戻します。

8.1.19. クラウドタブ

クラウド環境で用いる機能を設定します。

Amazon SNS連携機能を有効にする

Amazon SNS連携機能の設定をします。

  • チェックボックスがオン
    Amazon SNS連携機能を有効にします。
    CLUSTERPROのメッセージの送信先としてAmazon SNSを使用します。
    既定では、『操作ガイド』の「エラーメッセージ一覧」の「syslog、アラート、メール通報、SNMP トラップメッセージ、Message Topic」の[5]に●印のあるメッセージを送信します。
    その他のメッセージを送信する場合は、
    [クラスタプロパティ]-[アラートサービス]タブ-[アラート送信先の変更]で[送信先]に[Message Topic]を設定してください。
  • チェックボックスがオフ
    Amazon SNS連携機能を無効にします。

TopicArn

Amazon SNS連携機能で使用するTopicArnを設定します。

Amazon CloudWatch連携機能を有効にする

Amazon CloudWatch連携機能の設定をします。

  • チェックボックスがオン
    Amazon CloudWatch連携機能を有効にします。
    Amazon CloudWatchにモニタリソースの監視処理時間を送信します。
  • チェックボックスがオフ
    Amazon CloudWatch連携機能を無効にします。

注釈

Amazon CloudWatch連携機能を使用する場合は、[Amazon CloudWatch連携機能を有効にする]をオンにし、対象となるモニタリソースの[監視(共通)]タブ-[監視処理時間メトリクスを送信する]の設定を有効にする必要があります。

Namespace

Amazon CloudWatch連携機能で使用するNamespaceを設定します。

メトリクスの送信インターバル

Amazon CloudWatchにモニタリソースの監視処理時間を送信する頻度を設定します。

8.1.20. 拡張タブ

その他のクラスタの機能を設定します。

再起動制限

グループリソースとモニタリソースの異常検出時の最終動作として、OSの再起動を伴うような設定をしている場合、永遠に再起動を繰り返してしまうことがあります。再起動の回数を設定することによって再起動の繰り返しを制限できます。

  • 最大再起動回数(0~99)
    再起動の制限回数を設定します。ここで指定する回数はグループリソース、モニタリソースで別々にカウントされます。
    [最大再起動回数] に 0 を設定した場合、再起動の繰り返しを制限しません。
  • 最大再起動回数をリセットする時間(0~999)
    最大再起動回数を指定している場合に、クラスタ起動時からの正常動作がここで指定した時間続いた時、それまでの再起動回数はリセットされます。ここで指定する時間はグループリソース、モニタリソースで別々にカウントされます。

注釈

[最大再起動回数をリセットする時間] に0を設定した場合、再起動回数はリセットされません。再起動回数をリセットする場合は、clpregctrl コマンドを使用してください。

ダウン後自動起動する

クラスタシャットダウンやクラスタ停止以外の方法でサーバを停止した場合やクラスタシャットダウンやクラスタ停止が正常に終了しなかった場合に、次回OS起動時にクラスタサービスを自動起動するかどうかを設定します。

マウント、アンマウントコマンドを排他する

使用しません。

サーバグループ間のフェイルオーバ時の猶予時間 (0~99999)

使用しません。

OS 停止動作を OS 再起動動作に変更する

OS 停止動作を一括して OS 再起動動作に変更します。
  • チェックボックスがオン
    動作変更を行います。
  • チェックボックスがオフ
    動作変更を行いません。
動作変更を設定した場合、下記の動作が変更されます。
下記以外の動作に関しては変更されません。
  • NP 解決時動作
    • 「クラスタサービスの停止とOS シャットダウン」設定時
      クラスタサービスの停止と OS 再起動に変更します。
    • 「BMC パワーオフ」設定時
      BMC パワーサイクルに変更します。
  • クラスタサービスのプロセス異常時動作
    • 「OS シャットダウン」設定時
      OS 再起動に変更します。
    • 「BMC パワーオフ」設定時
      BMC パワーサイクルに変更します。
  • グループリソース活性/非活性ストール発生時動作
    • 「クラスタサービスの停止とOS シャットダウン」設定時
      クラスタサービスの停止と OS 再起動に変更します。
    • 「BMC パワーオフ」設定時
      BMC パワーサイクルに変更します。
  • グループリソース活性非活性異常時最終動作
    • 「クラスタサービスの停止とOS シャットダウン」設定時
      クラスタサービスの停止と OS 再起動に変更します。
    • 「BMC パワーオフ」設定時
      BMC パワーサイクルに変更します。
  • モニタリソース異常時最終動作
    • 「クラスタサービスの停止とOS シャットダウン」設定時
      クラスタサービスの停止と OS 再起動に変更します。
    • 「BMC パワーオフ」設定時
      BMC パワーサイクルに変更します。

注釈

以下のモニタリソースは動作変更の対象にはなりません。

  • 外部連携モニタリソース

  • ユーザ空間モニタリソース

クラスタ動作の無効化

  • グループ自動起動
    • チェックボックスがオン
      グループの自動起動を無効化します。
    • チェックボックスがオフ
      グループの自動起動を無効化しません。
  • グループリソースの活性異常検出時の復旧動作
    • チェックボックスがオン
      グループリソース活性異常検出による復旧動作を無効化します。
    • チェックボックスがオフ
      グループリソース活性異常検出による復旧動作を無効化しません。
  • グループリソースの非活性異常検出時の復旧動作
    • チェックボックスがオン
      グループリソース非活性異常検出による復旧動作を無効化します。
    • チェックボックスがオフ
      グループリソース非活性異常検出による復旧動作を無効化しません。
  • モニタリソースの異常検出時の回復動作
    • チェックボックスがオン
      モニタリソース異常検出による回復動作を無効化します。
    • チェックボックスがオフ
      モニタリソース異常検出による回復動作を無効化しません。
  • サーバダウン時のフェイルオーバ
    • 使用しません

注釈

モニタリソース異常検出による回復動作の無効化は、ユーザ空間モニタリソースでは有効になりません。
外部連携モニタリソースはモニタリソース異常検出による回復動作の無効化の対象にはなりません。

クラスタ統計情報

グループのフェイルオーバに要した時間やリソースの活性処理時間などクラスタの動作に関する情報を採取し、参照することができます。
詳細は CLUSTERPRO X の 『メンテナンスガイド』 - 「保守情報」 - 「クラスタ統計情報採取機能」 を参照してください。
  • チェックボックスがオン
    クラスタ統計情報の採取を行います。
  • ファイルサイズ (タイプによって設定可能な値が異なります)
    クラスタ統計情報ファイルのサイズを指定します。
    指定したファイルサイズに達した場合はローテートが行われます。最大で2世代の情報が保存されます。
  • チェックボックスがオフ
    クラスタ統計情報の採取を行いません。

注釈

クラスタ統計情報のファイルサイズに設定可能な値は以下の通りです。
  • ハートビートリソース : 1~50 (MB)
  • グループ : 1~5 (MB)
  • グループリソース : 1~5 (MB)
  • モニタリソース : 1~10 (MB)

既定値

既定値に戻すときに使用します。[既定値] をクリックすると全ての項目に既定値が設定されます。

8.2. サーバプロパティ

「サーバのプロパティ」では、サーバ固有の設定を行います。

8.2.1. 情報タブ

サーバ名の表示、コメントの登録、変更を行います。

名前

サーバ名を表示しています。ここでは名前の変更はできません。

コメント(127バイト以内)

サーバのコメントを設定します。半角英数字のみ入力可能です。

8.2.2. 警告灯タブ

使用しません。

8.2.3. ディスク I/O 閉塞タブ

使用しません。

8.3. 登録最大数一覧

Version

登録最大数

サーバ

4.0.0-1以降

1

グループ

4.0.0-1以降

128

グループリソース
(1 グループにつき)

4.0.0-1以降

256

モニタリソース

4.0.0-1以降

512

9. 監視動作の詳細

本章では、監視における監視インターバル、監視タイムアウト、監視リトライ回数をどうのように設定すればよいか検討するために、いくつかの障害パターンにより、どのように障害を検出するかの仕組みについての詳細を説明します。

本章で説明する項目は以下のとおりです。

9.1. 常時監視と活性時監視について

常時監視では、サーバが起動して、CLUSTERPRO X SingleServerSafeが動作可能になった時点から監視を始めます。
活性時監視では、指定されたグループが活性してから、そのグループが非活性(停止)する間で監視が行われます。
モニタリソースにより、いずれかに固定されているもの、いずれかを選択できるものがあります。
  1. Server startup: サーバ起動

  2. Group activation: グループ活性

  3. Group deactivation: グループ非活性

  4. Server stops: サーバ停止

サーバ起動からサーバ停止までのうち、常時監視の区間と活性時監視の区間

図 9.1 モニタリソースの常時監視と活性時監視

9.2. モニタリソースの監視インターバルのしくみ

全てのモニタリソースは、監視インターバル毎に監視が行われます。

以下は、この監視インターバルの設定による正常または、異常時におけるモニタリソースの監視の流れを時系列で表した説明です。

監視正常検出時

図は、サーバ起動後に監視を開始または再開した際の動作を表しています。 監視メインプロセス(Main monitoring process)が監視結果を受け取ると、監視インターバル(Monitor interval)の時間を空けて、繰り返し、監視が起動されます。

下記の値が設定されている場合の挙動の例:

<監視>
監視インターバル 30秒
監視タイムアウト 60秒
監視リトライ回数 0回
監視メインプロセスと監視サブプロセス、および監視インターバル

図 9.2 監視インターバル(監視正常検出時)

監視異常検出時(監視リトライ設定なし)

図は、監視対象(Monitor target)で異常が発生し、それが検出された後の動作を表しています。 監視メインプロセス(Main monitoring process)が監視結果(異常)を受け取ると、回復対象グループに対してフェイルオーバを実行します。

監視異常発生後、次回監視で監視異常を検出し回復対象に対して再活性化が行われます。

下記の値が設定されている場合の挙動の例:

<監視>
監視インターバル 30秒
監視タイムアウト 60秒
監視リトライ回数 0回
<異常検出>
回復動作 回復対象を再起動
回復対象 グループ
回復スクリプト実行回数 0 回
再活性化しきい値 1回
最終動作 何もしない
監視メインプロセスと監視サブプロセス、および監視インターバル

図 9.3 監視インターバル(監視異常検出時 ・監視リトライ設定なし)

監視異常検出時(監視リトライ設定あり)

図は、監視対象(Monitor target)で異常が発生し、それが検出された後の動作を表しています。 監視メインプロセス(Main monitoring process)が監視結果(異常)を受け取ると、設定された監視リトライ回数に達するまで、監視動作を実行します。それでも監視対象が回復しない場合、回復対象グループに対してフェイルオーバを実行します。

監視異常発生後、次回監視で監視異常を検出し監視リトライ以内で回復しなければ、回復対象に対して再活性化が行われます。

下記の値が設定されている場合の挙動の例:

<監視>
監視インターバル 30秒
監視タイムアウト 60秒
監視リトライ回数 2回
<異常検出>
回復動作 回復対象を再起動
回復対象 グループ
回復スクリプト実行回数 0回
再活性化しきい値 1回
最終動作 何もしない
監視メインプロセスと監視サブプロセス、および監視インターバル

図 9.4 監視インターバル(監視異常検出時 ・監視リトライ設定あり)

監視タイムアウト検出時(監視リトライ設定なし)

図は、設定された時間内に監視処理が終わらなかった場合の動作を表しています。 監視メインプロセス(Main monitoring process)が監視を起動した後、監視タイムアウトに設定された時間内に監視結果が得られなかった場合、回復対象グループに対してフェイルオーバを実行します。

監視タイムアウト発生後、直ぐに回復対象への回復動作に対して再活性化が行われます。

下記の値が設定されている場合の挙動の例:

<監視>
監視インターバル 30秒
監視タイムアウト 60秒
監視リトライ回数 0回
<異常検出>
回復動作 回復対象を再起動
回復対象 グループ
回復スクリプト実行回数 0回
再活性化しきい値 1回
最終動作 何もしない
監視メインプロセスと監視サブプロセス、および監視インターバル

図 9.5 監視インターバル(監視タイムアウト検出時 ・監視リトライ設定なし)

監視タイムアウト検出時(監視リトライ設定あり)

図は、設定された時間内に監視処理が終わらなかった場合の動作を表しています。 監視メインプロセス(Main monitoring process)が監視を起動した後、監視タイムアウトに設定された時間内に監視結果が得られなかった場合、設定された監視リトライ回数に達するまで、監視動作を実行します。それでも監視結果が得られなかった場合、回復対象グループに対してフェイルオーバを実行します。

監視タイムアウト発生後、監視リトライを行い回復対象に対して再活性化が行われます。

下記の値が設定されている場合の挙動の例:

<監視>
監視インターバル 30秒
監視タイムアウト 60秒
監視リトライ回数 1回
<異常検出>
回復動作 回復対象を再起動
回復対象 グループ
回復スクリプト実行回数 0回
再活性化しきい値 1回
最終動作 何もしない
監視メインプロセスと監視サブプロセス、および監視インターバル

図 9.6 監視インターバル(監視タイムアウト検出時 ・監視リトライ設定あり)

9.3. モニタリソースによる異常検出時の動作

異常検出時には回復対象に対して以下の回復動作が行われます。

  • 監視対象の異常を検出すると回復スクリプトを実行します。

  • 回復スクリプト実行回数の回復スクリプト実行後、回復対象の再活性化を行います。再活性前スクリプト実行が設定されている場合はスクリプトを実行後に再活性化を行います。

  • 監視対象の異常を検出すると回復対象の再活性化を行います(回復動作が [最終動作のみ実行] の場合、及び [カスタム設定] で最大再活性回数が 0 に設定されている場合は再活性化を行いません)。

  • 再活性化に失敗した場合、あるいは再活性化を行っても異常を検出する場合、最終動作を行います([カスタム設定] で最大再活性回数が 2 以上に設定されている場合は、指定回数まで再活性化をリトライします)。

回復動作が実行されるか否かは、回復対象の状態によって変わります。

回復対象

状態

再活性化 4

最終動作 5

グループ/グループリソース

停止済

No

No

起動/停止中

No

No

起動済

Yes

Yes

異常

Yes

Yes

LocalServer

-

-

Yes

Yes:回復動作が行われる No:回復動作が行われない

4

再活性化しきい値に1以上が設定されている場合のみ有効になります。

5

最終動作に"何もしない"以外が設定されている場合のみ有効になります。

注釈

モニタリソースの異常検出時の設定で回復対象にグループリソース (例: EXECリソース) を指定し、モニタリソースが異常を検出した場合の回復動作遷移中(再活性化 → 最終動作) には、以下のコマンドまたは Cluster WebUI から以下の操作を行わないでください。

  • サーバの停止 / サスペンド

  • グループの開始 / 停止

モニタリソース異常による回復動作遷移中に上記の制御を行うと、そのグループの他のグループリソースが停止しないことがあります。
また、モニタリソース異常状態であっても最終動作実行後であれば上記制御を行うことが可能です。

モニタリソースの状態が異常から復帰(正常)した場合は、再活性化回数、最終動作の実行要否はリセットされます。ただし、回復対象としてグループ/グループリソースが指定されている場合は、同一の回復対象が指定されている全てのモニタリソースの状態が正常状態になった場合のみ、これらのカウンタがリセットされます。

回復動作の再活性化回数は、回復動作に失敗した場合でも1回としてカウントされることに注意してください。

9.4. 監視異常からの復帰(正常)

監視異常を検出し、回復動作遷移中または全ての回復動作を完了後にモニタリソースの復帰を検出すると、そのモニタリソースが保持している以下のしきい値に対する回数カウンタはリセットされます。

  • 回復スクリプト実行回数

  • 再活性化回数

最終動作については、実行要否がリセットされます。

9.5. 回復動作時の回復対象活性/非活性異常

モニタリソースの監視先と回復対象のグループリソースが同一のデバイスの場合で監視異常を検出すると、回復動作中にグループリソースの活性/非活性異常を検出する場合があります。

9.6. 回復スクリプト、回復動作前スクリプトについて

モニタリソースの異常検出時に、回復スクリプトを実行させることが可能です。また、回復対象の再活性化、最終動作を実行する前に回復動作前スクリプトを実行させることも可能です。
いずれの場合でも共通のスクリプトファイルが実行されます。

回復スクリプト、回復動作前スクリプトで使用する環境変数

CLUSTERPRO はスクリプトを実行する場合に、どの状態で実行したか (回復動作種別) などの情報を環境変数にセットします。
スクリプト内で下図の環境変数を分岐条件として、システム運用にあった処理内容を記述できます。

環境変数

環境変数の値

意味

CLP_MONITORNAME
…モニタリソース名
モニタリソース名
回復スクリプト、回復動作前スクリプトを実行する原因となる異常を検出したモニタリソース名を示します。
CLP_VERSION_FULL
…CLUSTERPROフルバージョン
CLUSTERPROフルバージョン
CLUSTERPROのフルバージョンを示す。
(例) 5.0.0-1
CLP_VERSION_MAJOR
…CLUSTERPROメジャーバージョン
CLUSTERPROメジャーバージョン
CLUSTERPROのメジャーバージョンを示す。
(例)5
CLP_PATH
…CLUSTERPROインストールパス
CLUSTERPROインストールパス
CLUSTERPROがインストールされているパスを示す。
(例)/opt/nec/clusterpro
CLP_OSNAME
…サーバOS名
サーバOS名
スクリプトが実行されたサーバのOS名を示す。
(例)
(1) OS名が取得できた場合:
Red Hat Enterprise Linux Server release 6.8 (Santiago)
(2) OS名が取得できなかった場合:
Linux
CLP_OSVER
…サーバOSバージョン
サーバOSバージョン
スクリプトが実行されたサーバのOSバージョンを示す。
(例)
(1) OSバージョンが取得できた場合:6.8
(2) OSバージョンが取得できなかった場合:※値なし
CLP_ACTION
…回復動作種別

RECOVERY

回復スクリプトとして実行された場合。

RESTART

再起動前に実行された場合。

FINALACTION

最終動作前に実行された場合。

CLP_RECOVERYCOUNT
…回復スクリプトの実行回数
回復スクリプト実行回数
何回目の回復スクリプト実行回数かを示す。
CLP_RESTARTCOUNT
…再活性化回数
再活性化回数
何回目の再活性化回数かを示す。
CLP_FAILOVERCOUNT
…フェイルオーバ回数
フェイルオーバ回数
使用しません。

回復スクリプト、回復動作前スクリプトの記述の流れ

前のトピックの、環境変数と実際のスクリプト記述を関連付けて説明します。

回復スクリプト、回復動作前スクリプトの一例

#!/bin/sh

# ***************************************
# *           preactaction.sh
# ***************************************

# スクリプト実行要因の環境変数を参照して、処理の振り分けを行う。
if ["$CLP_ACTION"="RECOVERY"]
then
    # ここに回復処理を記述する。
    # この処理は以下のタイミングで実行される。
    #
    # 回復動作: 回復スクリプト

elif ["$CLP_ACTION"="RESTART"]
then
    # ここに再活性化前処理を記述する。
    # この処理は以下のタイミングで実行される。
    #
    # 回復動作: 再活性化

elif ["$CLP_ACTION"="FINALACTION"]
then
    # ここに回復処理を記述する。
    # この処理は以下のタイミングで実行される。
    #
    # 回復動作: 最終動作

fi
exit 0

回復スクリプト、回復動作前スクリプト作成のヒント

以下の点に注意して、スクリプトを作成してください。

  • スクリプト中にて、実行に時間を必要とするコマンドを実行する場合には、コマンドの実行が完了したことを示すトレースを残すようにしてください。この情報は、問題発生時、障害の切り分けを行う場合に使用することができます。clplogcmdを使用してトレースを残す方法があります。

  • スクリプト中に clplogcmd を使用して記述する方法
    clplogcmd で Cluster WebUI のアラートログや OS の syslog に、メッセージを出力できます。clplogcmd については、『操作ガイド』 の 「CLUSTERPRO X SingleServerSafe コマンドリファレンス」の「メッセージを出力する (clplogcmd コマンド)」を参照してください。

(例:スクリプト中のイメージ)

clplogcmd -m "recoverystart.."
recoverystart
clplogcmd -m "OK"

回復スクリプト、回復動作前スクリプト 注意事項

  • スクリプトから起動されるコマンド、アプリケーションのスタックサイズについて
    スタックサイズが 2MB に設定された状態で回復スクリプト、回復動作前スクリプトが実行されます。このため、スクリプトから起動されるコマンドやアプリケーションで 2MB 以上のスタックサイズが必要な場合には、スタックオーバーフローが発生します。
    スタックオーバーフローが発生する場合には、コマンドやアプリケーションを起動する前にスタック サイズを設定してください。

9.7. モニタリソースの遅延警告

モニタリソースは、業務アプリケーションの集中などにより、サーバが高負荷状態になり監視タイムアウトを検出する場合があります。監視タイムアウトを検出する前に監視の監視処理時間(実測時間)が監視タイムアウト時間の何割かに達した場合、アラート通報させることが可能です。
以下は、モニタリソースが遅延警告されるまでの流れを時系列で表した説明です。
監視タイムアウトに60秒、遅延警告割合には、既定値の80%を指定します。
モニタリソースが遅延警告されるまでの時間

図 9.7 監視ポーリング時間と遅延警告

  1. 監視の監視処理時間は 10 秒で、モニタリソースは正常状態。
    この場合、アラート通報は行いません。
  2. 監視の監視処理時間は 50 秒で、監視の遅延を検出し、モニタリソースは正常状態。
    この場合、遅延警告割合の80%を超えているためアラート通報を行います。
  3. 監視の監視処理時間は監視タイムアウト時間の 60 秒を越え、監視タイムアウトを検出し、モニタリソースは異常状態。
    この場合、アラート通報は行いません。

また、遅延警告割合を0または、100 に設定すれば以下を行うことが可能です。

  • 遅延警告割合に0を設定した場合
    監視ごとに遅延警告がアラート通報されます。
    この機能を利用し、サーバが高負荷状態でのモニタリソースへの監視処理時間を算出し、モニタリソースの監視タイムアウト時間を決定することができます。
  • 遅延警告割合に 100 を設定した場合
    遅延警告の通報を行いません。

注釈

テスト運用以外で、0%などの低い値を設定しないように注意してください。

参考

モニタリソースの遅延警告は[クラスタのプロパティ]→[遅延警告]タブの[モニタ遅延警告]で設定します。

9.8. モニタリソースの監視開始待ち

監視開始待ちとは、監視を指定した監視開始待ち時間後から開始することをいいます。
以下は、監視開始待ちを0秒に指定した場合と30秒に指定した場合の監視の違いを時系列で表した説明です。

監視開始待ち時間が0秒の場合、サーバ起動または監視再開後に監視リソースポーリングを開始します。

[モニタリソース構成]

<監視>
インターバル 30秒
タイムアウト 60秒
リトライ回数 0回
監視開始待ち時間 0秒
監視開始待ち時間毎の挙動の違い

図 9.8 モニタリソースの監視開始待ち(監視開始待ち時間0秒)

監視開始待ち時間が30秒の場合、サーバ起動または監視再開後に30秒待ってから監視リソースポーリングを開始します。

[モニタリソース構成]

<監視>
インターバル 30秒
タイムアウト 60秒
リトライ回数 0回
監視開始待ち時間 30秒
監視開始待ち時間毎の挙動の違い

図 9.9 モニタリソースの監視開始待ち(監視開始待ち時間30秒)

注釈

監視制御コマンドによるモニタリソースの一時停止/再開を行った場合も、指定された監視開始待ち時間後に再開します。

監視開始待ち時間は、PIDモニタリソースが監視する EXEC リソースのようにアプリケーションの設定ミスなどにより監視開始後すぐに終了する可能性があり、再活性化では回復できない場合に使用します。
たとえば、以下のように監視開始待ち時間を 0 に設定すると回復動作を無限に繰り返す場合があります。

このケースにおいて、アプリケーションは一旦起動します。 さらにPIDモニタによる監視が開始され、PIDモニタによるポーリングが一度正常終了します。 しかしその後、アプリケーションは何らかの理由で異常終了します。

[PIDモニタリソース構成]

<監視>
インターバル 5秒
タイムアウト 60秒
リトライ回数 0回
監視開始待ち時間 0秒
<異常検出>
回復動作 回復対象を再起動
回復対象 exec
再活性化しきい値 1回
最終動作 グループ停止
EXECリソース、アプリケーション、PIDモニタの動作の推移

図 9.10 モニタリソースの監視開始待ち(監視開始待ち時間0秒)

この回復動作を無限に繰り返す原因は、初回の監視処理が正常終了することにあります。モニタリソースの回復動作の現在回数は、モニタリソースが正常状態になればリセットされます。そのため、現在回数が常に 0 リセットされ再活性化の回復動作を無限に繰り返すことになります。

上記の現象は、監視開始待ち時間を設定することで回避できます。

監視開始待ち時間には、アプリケーションが起動後、終了しうる時間として既定値で 60 秒を設定しています。

このケースにおいて、アプリケーションは一旦起動します。 その後、設定された開始監視待ち時間待ちあわせた後に、PIDモニタによる監視が開始されます。 その後、アプリケーションは何らかの理由で異常終了しますが、それはPIDモニタによる初回のポーリングで検出されます。

[PIDモニタリソース構成]

<監視>
インターバル 5秒
タイムアウト 60秒
リトライ回数 0回
監視開始待ち時間 60秒
<異常検出>
回復動作 回復対象を再起動
回復対象 exec
再活性化しきい値 1回
最終動作 グループ停止
EXECリソース、アプリケーション、PIDモニタの動作の推移

図 9.11 モニタリソースの監視開始待ち(監視開始待ち時間60秒)

9.9. 再起動回数制限について

活性異常、非活性異常検出時の最終動作、またはモニタリソース異常検出時の最終動作としてOSの再起動を伴うような設定をしている場合に、シャットダウン回数、または再起動回数を制限することができます。

注釈

再起動回数はサーバごとに記録されるため、最大再起動回数はサーバごとの再起動回数の上限になります。

また、グループ活性、非活性異常検出時の最終動作による再起動回数とモニタリソース異常の最終動作による再起動回数は別々に記録されます。
最大再起動回数をリセットする時間に 0 を設定した場合には、再起動回数はリセットされません。リセットする場合は clpregctrl コマンドを使用する必要があります。

10. 注意制限事項

本章では、注意事項や既知の問題とその回避策について説明します。
本章で説明する項目は以下の通りです。

10.1. システム構成検討時

システム構成時に留意すべき事項について説明します。

10.1.1. JVM モニタリソースについて

  • 同時に監視可能なJava VMは最大25個です。同時に監視可能なJava VMとはCluster WebUI ([監視(固有)]タブ-[識別名])で一意に識別するJava VM数のことです。

  • Java VMとJVMモニタリソース間のコネクションはSSLには対応していません。

  • スレッドのデッドロックは検出できない場合があります。これは、Java VMの既知で発生している不具合です。詳細は、OracleのBug Databaseの「Bug ID: 6380127 」を参照してください。

  • JVMモニタリソースが監視できるJava VMは、JVMモニタリソースが動作中のサーバと同じサーバ内のみです。

  • JVMモニタリソースが監視できるJBoss のサーバインスタンスは、1 サーバに1 つまでです。

  • x86_64版OS上においてIA32版の監視対象のアプリケーションを動作させている場合、監視を行うことはできません。

  • Cluster WebUI ([クラスタのプロパティ] - [JVM監視] タブ - [最大Javaヒープサイズ]) で設定した最大 Java ヒープサイズを 3000 など大きな値に設定すると、JVMモニタリソースが起動に失敗します。システム環境に依存するため、システムのメモリ搭載量を元に決定してください。

  • 監視対象 Java VM の起動オプションに「-XX:+UseG1GC」が付加されている場合、Java 7 以前では JVM モニタリソースの [プロパティ] - [監視(固有)] タブ - [調整] プロパティ-[メモリ]タブ内の設定項目は監視できません。
    Java 8 以降では JVM モニタリソースの [プロパティ] - [監視(固有)] タブ - [JVM種別] に [Oracle Java(usage monitoring)] を選択することで監視可能です。

10.1.2. メール通報について

  • メール通報機能は、STARTTLS や SSL に対応していません。

10.2. CLUSTERPRO X SingleServerSafeの情報作成時

構成情報の設計、作成前にシステムの構成に依存して確認、留意が必要な事項です。

10.2.1. インストールパス配下のディレクトリ、ファイルについて

インストールパス配下にあるディレクトリやファイルは、CLUSTERPRO X SingleServerSafe以外から操作(編集/作成/追加/削除など)しないでください。
CLUSTERPRO X SingleServerSafe以外からディレクトリやファイルを操作した場合の影響についてはサポート対象外とします。

10.2.2. 環境変数

環境変数が 256 個以上設定されている環境では、下記のスクリプトが実行できません。下記の機能またはリソースを使用する場合は、環境変数を 255 個以下に設定してください。

  • exec リソースが活性/非活性時に実行する開始/停止スクリプト

  • カスタムモニタリソースが監視時に実行するスクリプト

  • グループリソース、モニタリソース異常検出後の最終動作実行前スクリプト

10.2.3. サーバのリセット、パニック、パワーオフ

CLUSTERPRO X SingleServerSafe が「サーバのリセット」または「サーバのパニック」または「サーバのパワーオフ」を行う場合、サーバが正常にシャットダウンされません。そのため下記のリスクがあります。

  • マウント中のファイルシステムへのダメージ

  • 保存していないデータの消失

「サーバのリセット」または「サーバのパニック」が発生する設定は下記です。

  • グループリソース活性時/非活性時異常時の動作

    • sysrq パニック

    • keepalive リセット

    • keepalive パニック

    • BMC リセット

    • BMC パワーオフ

    • BMC サイクル

    • BMC NMI

  • モニタリソース異常検出時の最終動作

    • sysrq パニック

    • keepalive リセット

    • keepalive パニック

    • BMC リセット

    • BMC パワーオフ

    • BMC サイクル

    • BMC NMI

  • ユーザ空間監視のタイムアウト検出時動作

    • 監視方法 softdog

    • 監視方法 ipmi

    • 監視方法 keepalive

注釈

「サーバのパニック」は監視方法がkeepaliveの場合のみ設定可能です。

  • シャットダウン監視

    • 監視方法 softdog

    • 監視方法 ipmi

    • 監視方法 keepalive

注釈

「サーバのパニック」は監視方法がkeepaliveの場合のみ設定可能です。

10.2.4. グループリソースの非活性異常時の最終アクション

非活性異常検出時の最終動作に「何もしない」を選択すると、グループが非活性失敗のまま停止しません。 本番環境では「何もしない」は設定しないように注意してください。

10.2.5. 遅延警告割合

遅延警告割合を0または、100に設定すれば以下のようなことを行うことが可能です。

  • 遅延警告割合に0を設定した場合
    監視毎に遅延警告がアラート通報されます。
    この機能を利用し、サーバが高負荷状態でのモニタリソースへのポーリング時間を算出し、モニタリソースの監視タイムアウト時間を決定することができます。
  • 遅延警告割合に100を設定した場合
    遅延警告の通報を行いません。

テスト運用以外で、0%等の低い値を設定しないように注意してください。

10.2.6. ディスクモニタリソースの監視方法 TURについて

  • SCSIのTest Unit ReadyコマンドやSG_IOコマンドをサポートしていないディスク、ディスクインターフェイス(HBA)では使用できません。
    ハードウェアがサポートしている場合でもドライバがサポートしていない場合があるのでドライバの仕様も合わせて確認してください。
  • S-ATA インターフェイスのディスクの場合には、ディスクコントローラのタイプや使用するディストリビューションにより、OS に IDE インターフェイスのディスク (hd) として認識される場合と SCSI インターフェイスのディスク(sd)として認識される場合があります。
    IDE インターフェイスとして認識される場合には、すべての TUR 方式は使用できません。
    SCSIイ ンターフェイスとして認識される場合には、TUR(legacy) が使用できます。TUR(generic) は使用できません。
  • Read 方式に比べて OS やディスクへの負荷は小さくなります。

  • Test Unit Ready では、実際のメディアへの I/O エラーは検出できない場合があります。

10.2.7. スクリプトのコメントなどで取り扱える 2 バイト系文字コードについて

  • CLUSTERPRO では、Linux 環境で編集されたスクリプトは EUC、Windows 環境で編集されたスクリプトは Shift-JIS として扱われます。その他の文字コードを利用した場合、環境によっては文字化けが発生する可能性があります。

10.2.8. スクリプトの文字コードと改行コードについて

  • Cluster WebUI 以外で作成したスクリプトを clpcfctrl コマンドで設定反映する場合、構成情報ファイル(clp.conf)とスクリプトの文字コードと改行コードが同じであることを確認してから設定反映してください。文字コードまたは改行コードが異なる場合、スクリプトが正常に動作しない可能性があります。

10.2.9. システムモニタリソースの設定について

  • リソース監視の検出パターン
    System Resource Agent では、「しきい値」、「監視継続時間」という2つのパラメータを組み合わせて検出を行います。
    各システムリソース(オープンファイル数、ユーザプロセス数、スレッド数、メモリ使用量、CPU 使用率、仮想メモリ使用量)を継続して収集し、一定時間(継続時間として指定した時間)しきい値を超えていた場合に異常を検出します。

10.2.10. 外部連携モニタリソースの設定について

  • 外部連携モニタリソースに異常を通知するには、[clprexec] コマンドを用いる方法があります。

  • [clprexec] コマンドを用いる場合は CLUSTERPRO CD に同梱されているファイルを利用します。通知元サーバの OS やアーキテクチャに合わせて利用してください。また、通知元サーバと通知先サーバの通信が可能である必要があります。

10.2.11. JVM 監視の設定について

  • 監視対象が WebLogic Server の場合、JVM モニタリソースの以下の設定値については、システム環境(メモリ搭載量など)により、設定範囲の上限に制限がかかることがあります。

    • [ワークマネージャのリクエストを監視する]-[リクエスト数]

    • [ワークマネージャのリクエストを監視する]-[平均値]

    • [スレッドプールのリクエストを監視する]-[待機リクエスト リクエスト数]

    • [スレッドプールのリクエストを監視する]-[待機リクエスト 平均値]

    • [スレッドプールのリクエストを監視する]-[実行リクエスト リクエスト数]

    • [スレッドプールのリクエストを監視する]-[実行リクエスト 平均値]

  • 監視対象の JRockit JVM が64bit 版の場合、JRockit JVM から取得した各最大メモリ量がマイナスとなり使用率が計算できないため、以下のパラメータが監視できません。

    • [ヒープ使用率を監視する]- [領域全体]

    • [ヒープ使用率を監視する]- [Nursery Space]

    • [ヒープ使用率を監視する]- [Old Space]

    • [非ヒープ使用率を監視する]- [領域全体]

    • [非ヒープ使用率を監視する]- [ClassMemory]

  • Java Resource Agent を使用するには、『インストールガイド』の「JVM モニタリソースの動作環境」に記載している JRE(Java Runtime Environment) をインストールしてください。監視対象(WebLogic ServerやWebOTX)が使用する JRE と同じ物件を使用することも、別の物件を使用することも可能です。

  • モニタリソース名に空白を含まないでください。

10.3. CLUSTERPRO X SingleServerSafeの構成変更時

クラスタとして運用を開始した後に構成を変更する場合に発生する事象で留意して頂きたい事項です。

10.3.1. リソースプロパティの依存関係について

リソースの依存関係を変更した場合、クラスタサスペンド、リジュームにより変更が反映されます。
リソースの依存関係と反映方法としてリソース停止が必要な設定変更をした場合、リジューム後のリソースの起動状態が依存関係を考慮したものになっていない場合があります。
次回グループ起動時から正しく依存関係の制御が行われるようになります。

10.3.2. 外部連携モニタリソースのクラスタ統計情報の設定について

モニタリソースのクラスタ統計情報の設定を変更した場合、サスペンド・リジュームを実行しても外部連携モニタリソースにはクラスタ統計情報の設定が反映されません。外部連携モニタリソースにもクラスタ統計情報の設定を反映させる場合は、OS の再起動を行ってください。

10.3.3. ポート番号の変更について

サーバのファイアウォールを有効にしており、ポート番号を変更した場合、ファイアウォールの設定の変更が必要です。clpfwctrlコマンドでファイアウォールの設定を行うことができます。詳細は『CLUSTERPRO X SingleServerSafe for Linux 操作ガイド』 - 「CLUSTERPRO X SingleServerSafe コマンドリファレンス」 - 「ファイアウォールの規則を追加する (clpfwctrlコマンド)」を参照してください。