1. はじめに

1.1. 対象読者と目的

『CLUSTERPRO X ハードウェア連携ガイド』は、管理者を対象に、特定ハードウェアと連携する機能について記載しています。
このガイドは、『CLUSTERPRO X インストール&設定ガイド』を補完する役割を持ちます。
クラスタ構築時および運用時に必要な情報を参照してください。

1.2. 本書の構成

1.3. CLUSTERPRO マニュアル体系

CLUSTERPRO のマニュアルは、以下の 5 つに分類されます。各ガイドのタイトルと役割を以下に示します。

CLUSTERPRO X スタートアップガイド』 (Getting Started Guide)

すべてのユーザを対象読者とし、製品概要、動作環境、アップデート情報、既知の問題などについて記載します。

CLUSTERPRO X インストール&設定ガイド』 (Install and Configuration Guide)

CLUSTERPRO を使用したクラスタシステムの導入を行うシステムエンジニアと、クラスタシステム導入後の保守・運用を行うシステム管理者を対象読者とし、CLUSTERPRO を使用したクラスタシステム導入から運用開始前までに必須の事項について説明します。実際にクラスタシステムを導入する際の順番に則して、CLUSTERPRO を使用したクラスタシステムの設計方法、CLUSTERPRO のインストールと設定手順、設定後の確認、運用開始前の評価方法について説明します。

CLUSTERPRO X リファレンスガイド』 (Reference Guide)

管理者、および CLUSTERPRO を使用したクラスタシステムの導入を行うシステムエンジニアを対象とし、CLUSTERPRO の運用手順、各モジュールの機能説明およびトラブルシューティング情報等を記載します。『CLUSTERPRO X インストール&設定ガイド』を補完する役割を持ちます。

CLUSTERPRO X メンテナンスガイド』 (Maintenance Guide)

管理者、および CLUSTERPRO を使用したクラスタシステム導入後の保守・運用を行うシステム管理者を対象読者とし、CLUSTERPRO のメンテナンス関連情報を記載します。

『CLUSTERPRO X ハードウェア連携ガイド』 (Hardware Feature Guide)

管理者、および CLUSTERPRO を使用したクラスタシステムの導入を行うシステムエンジニアを対象読者とし、特定ハードウェアと連携する機能について記載します。『CLUSTERPRO X インストール&設定ガイド』を補完する役割を持ちます。

1.4. 本書の表記規則

本書では、注意すべき事項、重要な事項および関連情報を以下のように表記します。

注釈

この表記は、重要ではあるがデータ損失やシステムおよび機器の損傷には関連しない情報を表します。

重要

この表記は、データ損失やシステムおよび機器の損傷を回避するために必要な情報を表します。

参考

この表記は、参照先の情報の場所を表します。

また、本書では以下の表記法を使用します。

表記

使用方法

[ ] 角かっこ

コマンド名の前後
画面に表示される語(ダイアログボックス、メニューなど)の前後
[スタート]をクリックします。
[プロパティ]ダイアログ ボックス

コマンドライン中の [ ] 角かっこ

かっこ内の値の指定が省略可能であることを示します。

clpstat -s [-h host_name ]

モノスペースフォント

パス名、コマンドライン、システムからの出力(メッセージ、プロンプトなど)、ディレクトリ、ファイル名、関数、パラメータ

/Linux/5.0/jpn/server/

太字

ユーザが実際にコマンドプロンプトから入力する値を示します。

以下を入力します。
clpcl -s -a

斜体

ユーザが有効な値に置き換えて入力する項目

clpstat -s [-h host_name]

CLUSTERPRO X 本書の図では、CLUSTERPROを表すために このアイコンを使用します。

1.5. 最新情報の入手先

最新の製品情報については、以下のWebサイトを参照してください。

https://jpn.nec.com/clusterpro/

2. サーバ管理基盤との連携

本章では、Enterprise Linux with Dependable Support に含まれるサーバ管理基盤と CLUSTERPRO を連携させる場合の設定について説明します。

本章で説明する項目は以下のとおりです。

2.1. サーバ管理基盤の概要

サーバ管理基盤は、Enterprise Linux with Dependable Support に含まれる製品です。サーバ管理基盤は、次の機能を提供するソフトウェアです。

  • 強化デバイスドライバが検知した障害に関する情報を記録する機能

  • 強化デバイスドライバがシステムに致命的な障害を検知した場合に、CLUSTERPRO X と連携しフェイルオーバする機能

詳細は、Enterprise Linux with Dependable Support のマニュアルを参照してください。

2.2. サーバ管理基盤との連携の概要

CLUSTERPRO におけるサーバ管理基盤との連携機能とは、CLUSTERPRO が自ら監視を行うのではなく、driver モジュールより自発的に発信されるメッセージを CLUSTERPRO が受信し、受動的にフェイルオーバ等を行うための連携機能になります。

以下に概要図を示します。

エラーの発生したServer1と、正常なServer2、および Management PC

図 2.1 サーバ管理基盤との連携概要

Enterprise Linux with Dependable Support に含まれる強化デバイスドライバ (以下、強化ドライバと表記します) はシステムに致命的なエラーが発生した場合にサーバ管理基盤を通し CLUSTERPRO へメッセージを送信します。CLUSTERPRO はメッセージが受信されたときに以下の動作を行います。

  • 対応する外部連携モニタ (mrw) のステータスを異常にします。これにより、管理者がCluster WebUI や CLUSTERPRO のコマンドによる状態確認で異常が検出されたことを視覚的に確認することが可能です。

  • 障害発生時には設定されたアクションに従い、業務のフェイルオーバや OS のシャット ダウンを行います。

2.4. 外部連携モニタリソース

外部連携モニタリソースは、外部から通知されるエラーメッセージの監視を行います。本節では、サーバ管理基盤と連携する場合の記述のみ記載しています。それ以外の場合については、『リファレンスガイド』の「モニタリソースの詳細」を参照してください。

2.4.1. 外部連携モニタリソースに関する注意事項

サーバ管理基盤と連携する場合、外部連携モニタリソースのステータスは CLUSTERPROが管理するため、[clprexec] コマンドは利用しないで下さい。
外部連携モニタリソースのキーワードを指定している場合、キーワードに指定されたデバイスで異常を検出するとエラーになり、異常検出時の動作が実行されます。
外部連携モニタリソースのキーワードにデバイスを指定していない場合、カテゴリが一致するいずれかのデバイスで異常を検出するとエラーになり、異常検出時の動作が実行されます。

2.4.2. 外部連携モニタリソースによるカテゴリ

サーバ管理基盤と連携する場合、外部連携モニタリソースが受信するメッセージタイプには 下記があります。

  1. NIC
    ネットワークインタフェースカードのエラーメッセージを監視します。
  2. FC
    Fibre Channel のエラーメッセージを監視します。
  3. HA/SS
    CLUSTERPRO X HA/StorageSaver のエラーメッセージを監視します。
  4. HA/AM
    CLUSTERPRO X HA/ApplicationMonitor のエラーメッセージを監視します。
  5. HA/RS
    CLUSTERPRO X HA/ResourceSaverのエラーメッセージを監視します。
  6. SPS
    SPS のエラーメッセージを監視します。

2.4.3. 監視(固有) タブ

情報タブ、監視 (共通) タブについては 『リファレンスガイド』 の 「モニタリソースの詳細」 を参照してください。

カテゴリ (32 バイト以内)

カテゴリを指定します。
必ずリストボックスから既定文字列を選択してください。

キーワード (1023 バイト以内)

監視対象を指定します。

2.4.4. 回復動作タブ

情報タブ、監視 (共通) タブについては 『リファレンスガイド』 の 「モニタリソースの詳細」 を参照してください。

回復対象と異常検出時の動作を設定します。外部連携モニタリソースの場合、異常検出時の動作は、"回復対象の再活性" または "回復対象に対してフェイルオーバ実行"、"最終動作" のいずれか 1 つを選択します。ただし、回復対象が非活性状態であれば回復動作は 行われません。

回復動作

モニタ異常検出時に行う動作を選択します。

  • 回復スクリプトを実行
    モニタ異常検出時に、回復スクリプトを実行します。
  • 回復対象を再起動
    モニタ異常検出時に、回復対象に選択したグループまたはグループリソースの再起動 を行います。
  • 回復対象に対してフェイルオーバ実行
    モニタ異常検出時に、回復対象に選択したグループまたはグループリソースの属する グループに対してフェイルオーバを行います。
  • 最終動作のみ実行
    モニタ異常検出時に、最終動作に選択した動作を行います。

サーバグループ外にフェイルオーバする

外部連携モニタリソースのみ設定できます。異常発生通知受信時に、現用系サーバグループとは別のサーバグループにフェイルオーバさせるかどうかを設定します。

※ 上記以外の設定項目については、『リファレンスガイド』の「モニタリソースの詳細」 - 「モニタリソースのプロパティ」 - 「回復動作タブ」を参照してください。