1. はじめに¶
1.1. 対象読者と目的¶
『CLUSTERPRO X スタートアップガイド』は、CLUSTERPRO をはじめてご使用になるユーザの皆様を対象に、CLUSTERPRO の製品概要、クラスタシステム導入のロードマップ、他マニュアルの使用方法についてのガイドラインを記載します。また、最新の動作環境情報や制限事項などについても紹介します。
1.2. 本書の構成¶
「2. クラスタシステムとは?」:クラスタシステムおよび CLUSTERPRO の概要について説明します。
「3. CLUSTERPRO の使用方法」:クラスタシステムの使用方法および関連情報について説明します。
「4. CLUSTERPRO の動作環境」:導入前に確認が必要な最新情報について説明します。
1.3. CLUSTERPRO マニュアル体系¶
CLUSTERPRO のマニュアルは、以下の 6 つに分類されます。各ガイドのタイトルと役割を以下に示します。
『CLUSTERPRO X スタートアップガイド』 (Getting Started Guide)
すべてのユーザを対象読者とし、製品概要、動作環境、アップデート情報、既知の問題などについて記載します。
『CLUSTERPRO X インストール&設定ガイド』 (Install and Configuration Guide)
CLUSTERPRO を使用したクラスタシステムの導入を行うシステムエンジニアと、クラスタシステム導入後の保守・運用を行うシステム管理者を対象読者とし、CLUSTERPRO を使用したクラスタシステム導入から運用開始前までに必須の事項について説明します。実際にクラスタシステムを導入する際の順番に則して、CLUSTERPRO を使用したクラスタシステムの設計方法、CLUSTERPRO のインストールと設定手順、設定後の確認、運用開始前の評価方法について説明します。
『CLUSTERPRO X リファレンスガイド』 (Reference Guide)
管理者、および CLUSTERPRO を使用したクラスタシステムの導入を行うシステムエンジニアを対象とし、CLUSTERPRO の運用手順、各モジュールの機能説明およびトラブルシューティング情報等を記載します。『CLUSTERPRO X インストール&設定ガイド』を補完する役割を持ちます。
『CLUSTERPRO X メンテナンスガイド』 (Maintenance Guide)
管理者、および CLUSTERPRO を使用したクラスタシステム導入後の保守・運用を行うシステム管理者を対象読者とし、CLUSTERPRO のメンテナンス関連情報を記載します。
『CLUSTERPRO X ハードウェア連携ガイド』 (Hardware Feature Guide)
管理者、および CLUSTERPRO を使用したクラスタシステムの導入を行うシステムエンジニアを対象読者とし、特定ハードウェアと連携する機能について記載します。『CLUSTERPRO X インストール&設定ガイド』を補完する役割を持ちます。
『CLUSTERPRO X 互換機能ガイド』 (Legacy Feature Guide)
管理者、および CLUSTERPRO を使用したクラスタシステムの導入を行うシステムエンジニアを対象読者とし、CLUSTERPRO X 4.0 WebManager および Builder に関する情報について記載します。
1.4. 本書の表記規則¶
本書では、注意すべき事項、重要な事項および関連情報を以下のように表記します。
注釈
この表記は、重要ではあるがデータ損失やシステムおよび機器の損傷には関連しない情報を表します。
重要
この表記は、データ損失やシステムおよび機器の損傷を回避するために必要な情報を表します。
参考
この表記は、参照先の情報の場所を表します。
また、本書では以下の表記法を使用します。
表記 |
使用方法 |
例 |
---|---|---|
[ ] 角かっこ |
コマンド名の前後
画面に表示される語(ダイアログボックス、メニューなど)の前後
|
[スタート]をクリックします。
[プロパティ]ダイアログ ボックス
|
コマンドライン中の [ ] 角かっこ |
かっこ内の値の指定が省略可能であることを示します。 |
|
モノスペースフォント(courier) |
パス名、コマンドライン、システムからの出力(メッセージ、プロンプトなど)、ディレクトリ、ファイル名、関数、パラメータ |
|
モノスペースフォント太字(courier) |
ユーザが実際にコマンドプロンプトから入力する値を示します。 |
以下を入力します。
clpcl -s -a |
モノスペースフォント(courier)斜体 |
ユーザが有効な値に置き換えて入力する項目 |
|
2. クラスタシステムとは?¶
本章では、クラスタシステムの概要について説明します。
本章で説明する項目は以下のとおりです。
2.1. クラスタシステムの概要¶
現在のコンピュータ社会では、サービスを停止させることなく提供し続けることが成功への重要なカギとなります。例えば、1 台のマシンが故障や過負荷によりダウンしただけで、顧客へのサービスが全面的にストップしてしまうことがあります。そうなると、莫大な損害を引き起こすだけではなく、顧客からの信用を失いかねません。
このような事態に備えるのがクラスタシステムです。クラスタシステムを導入することにより、万一のときのシステム稼働停止時間 (ダウンタイム) を最小限に食い止めたり、負荷を分散させたりすることでシステムダウンを回避することが可能になります。
クラスタとは、「群れ」「房」を意味し、その名の通り、クラスタシステムとは「複数のコンピュータを一群 (または複数群) にまとめて、信頼性や処理性能の向上を狙うシステム」です。クラスタシステムには様々な種類があり、以下の 3 つに分類できます。この中で、CLUSTERPRO は HA(High Availability) クラスタに分類されます。
HA (High Availability) クラスタ
通常時は一方が現用系として業務を提供し、現用系障害発生時に待機系に業務を引き継ぐような形態のクラスタです。高可用性を目的としたクラスタで、データの引継ぎも可能です。共有ディスク型、データミラー型、遠隔クラスタがあります。
負荷分散クラスタ
クライアントからの要求を適切な負荷分散ルールに従って負荷分散ホストに要求を割り当てるクラスタです。高スケーラビリティを目的としたクラスタで、一般的にデータの引継ぎはできません。ロードバランスクラスタ、並列データベースクラスタがあります。
HPC (High Performance Computing) クラスタ
全てのノードの CPU を利用し、単一の業務を実行するためのクラスタです。高性能化を目的としており、あまり汎用性はありません。なお、HPC の 1 つであり、より広域な範囲のノードや計算機クラスタまでを束ねた、グリッドコンピューティングという技術も近年話題に上ることが多くなっています。
2.2. HA (High Availability) クラスタ¶
一般的にシステムの可用性を向上させるには、そのシステムを構成する部品を冗長化し、Single Point of Failure をなくすことが重要であると考えられます。Single Point of Failure とは、コンピュータの構成要素 (ハードウェアの部品) が 1 つしかないために、その箇所で障害が起きると業務が止まってしまう弱点のことを指します。HA クラスタとは、サーバを複数台使用して冗長化することにより、システムの停止時間を最小限に抑え、業務の可用性(availability) を向上させるクラスタシステムをいいます。
システムの停止が許されない基幹業務システムはもちろん、ダウンタイムがビジネスに大きな影響を与えてしまうそのほかのシステムにおいても、HA クラスタの導入が求められています。
HA クラスタは、共有ディスク型とデータミラー型に分けることができます。以下にそれぞれのタイプについて説明します。
2.2.2. データミラー型¶
前述の共有ディスク型は大規模なシステムに適していますが、共有ディスクはおおむね高価なためシステム構築のコストが膨らんでしまいます。そこで共有ディスクを使用せず、各サーバのディスクをサーバ間でミラーリングすることにより、同じ機能をより低価格で実現したクラスタシステムをデータミラー型といいます。
しかし、サーバ間でデータをミラーリングする必要があるため、大量のデータを必要とする大規模システムには向きません。
アプリケーションからの Write 要求が発生すると、データミラーエンジンはローカルディスクにデータを書き込むと同時に、インタコネクトを通して待機系サーバにも Write 要求を振り分けます。インタコネクトとは、サーバ間をつなぐネットワークのことで、クラスタシステムではサーバの死活監視のために必要になります。データミラータイプでは死活監視に加えてデータの転送に使用することがあります。待機系のデータミラーエンジンは、受け取ったデータを待機系のローカルディスクに書き込むことで、現用系と待機系間のデータを同期します。
アプリケーションからのRead要求に対しては、単に現用系のディスクから読み出すだけです。
データミラーの応用例として、スナップショットバックアップの利用があります。データミラータイプのクラスタシステムは2カ所に共有のデータを持っているため、待機系のサーバをクラスタから切り離すだけで、バックアップ時間をかけることなくスナップショットバックアップとしてディスクを保存する運用が可能です。
フェイルオーバの仕組みと問題点
ここまで、一口にクラスタシステムといってもフェイルオーバクラスタ、負荷分散クラスタ、HPC (High Performance Computing) クラスタなど、さまざまなクラスタシステムがあることを説明しました。そして、フェイルオーバクラスタはHA (High Availability) クラスタと呼ばれ、サーバそのものを多重化することで、障害発生時に実行していた業務をほかのサーバで引き継ぐことにより、業務の可用性 (Availability) を向上することを目的としたクラスタシステムであることを見てきました。次に、クラスタの実装と問題点について説明します。
2.3. 障害検出のメカニズム¶
クラスタソフトウェアは、業務継続に問題をきたす障害を検出すると業務の引き継ぎ (フェイルオーバ) を実行します。フェイルオーバ処理の具体的な内容に入る前に、簡単にクラスタソフトウェアがどのように障害を検出するか見ておきましょう。
ハートビートとサーバの障害検出
クラスタシステムにおいて、検出すべき最も基本的な障害はクラスタを構成するサーバ全てが停止してしまうものです。サーバの障害には、電源異常やメモリエラーなどのハードウェア障害や OS のパニックなどが含まれます。このような障害を検出するために、サーバの死活監視としてハートビートが使用されます。
ハートビートは、ping の応答を確認するような死活監視だけでもよいのですが、クラスタソフトウェアによっては、自サーバの状態情報などを相乗りさせて送るものもあります。クラスタソフトウェアはハートビートの送受信を行い、ハートビートの応答がない場合はそのサーバの障害とみなしてフェイルオーバ処理を開始します。ただし、サーバの高負荷などによりハートビートの送受信が遅延することも考慮し、サーバ障害と判断するまである程度の猶予時間が必要です。このため、実際に障害が発生した時間とクラスタソフトウェアが障害を検知する時間とにはタイムラグが生じます。
リソースの障害検出
業務の停止要因はクラスタを構成するサーバ全ての停止だけではありません。例えば、業務アプリケーションが使用するディスク装置や NIC の障害、もしくは業務アプリケーションそのものの障害などによっても業務は停止してしまいます。可用性を向上するためには、このようなリソースの障害も検出してフェイルオーバを実行しなければなりません。
リソース異常を検出する手法として、監視対象リソースが物理的なデバイスの場合は、実際にアクセスしてみるという方法が取られます。アプリケーションの監視では、アプリケーションプロセスそのものの死活監視のほか、業務に影響のない範囲でサービスポートを試してみるような手段も考えられます。
2.3.2. ネットワークパーティション症状 (Split-brain-syndrome)¶
サーバ間をつなぐすべてのインタコネクトが切断されると、ハートビートによる死活監視で互いに相手サーバのダウンを検出し、フェイルオーバ処理を実行してしまいます。結果として、複数のサーバでファイルシステムを同時にマウントしてしまい、データ破壊を引き起こします。フェイルオーバクラスタシステムでは異常が発生したときに適切に動作しなければならないことが理解できると思います。
このような問題を「ネットワークパーティション症状」またはスプリットブレインシンドローム(Split-brain-syndrome) と呼びます。フェイルオーバクラスタでは、すべてのインタコネクトが切断されたときに、確実に共有ディスク装置の排他制御を実現するためのさまざまな対応策が考えられています。
2.4. クラスタリソースの引き継ぎ¶
クラスタが管理するリソースにはディスク、IP アドレス、アプリケーションなどがあります。これらのクラスタリソースを引き継ぐための、フェイルオーバクラスタシステムの機能について説明します。
2.4.1. データの引き継ぎ¶
クラスタシステムでは、サーバ間で引き継ぐデータは共有ディスク装置上のパーティションに格納します。すなわち、データを引き継ぐとは、アプリケーションが使用するファイルが格納されているファイルシステムを健全なサーバ上でマウントしなおすことにほかなりません。共有ディスク装置は引き継ぐ先のサーバと物理的に接続されているので、クラスタソフトウェアが行うべきことはファイルシステムのマウントだけです。
単純な話のようですが、クラスタシステムを設計・構築するうえで注意しなければならない点があります。
1 つは、ファイルシステムの復旧時間の問題です。引き継ごうとしているファイルシステムは、障害が発生する直前までほかのサーバで使用され、もしかしたらまさに更新中であったかもしれません。このため、引き継ぐファイルシステムは通常ダーティであり、ファイルシステムの整合性チェックが必要な状態となっています。ファイルシステムのサイズが大きくなると、整合性チェックに必要な時間は莫大になり、場合によっては数時間もの時間がかかってしまいます。それがそのままフェイルオーバ時間 (業務の引き継ぎ時間) に追加されてしまい、システムの可用性を低下させる要因になります。
もう 1 つは、書き込み保証の問題です。アプリケーションが大切なデータをファイルに書き込んだ場合、同期書き込みなどを利用してディスクへの書き込みを保証しようとします。ここでアプリケーションが書き込んだと思い込んだデータは、フェイルオーバ後にも引き継がれていることが期待されます。例えばメールサーバは、受信したメールをスプールに確実に書き込んだ時点で、クライアントまたはほかのメールサーバに受信完了を応答します。これによってサーバ障害発生後も、スプールされているメールをサーバの再起動後に再配信することができます。クラスタシステムでも同様に、一方のサーバがスプールへ書き込んだメールはフェイルオーバ後にもう一方のサーバが読み込めることを保証しなければなりません。
2.4.2. アプリケーションの引き継ぎ¶
クラスタソフトウェアが業務引き継ぎの最後に行う仕事は、アプリケーションの引き継ぎです。フォールトトレラントコンピュータ (FTC) とは異なり、一般的なフェイルオーバクラスタでは、アプリケーション実行中のメモリ内容を含むプロセス状態などを引き継ぎません。すなわち、障害が発生していたサーバで実行していたアプリケーションを健全なサーバで再実行することでアプリケーションの引き継ぎを行います。
例えば、データベース管理システム (DBMS) のインスタンスを引き継ぐ場合、インスタンスの起動時に自動的にデータベースの復旧 (ロールフォワード / ロールバックなど) が行われます。このデータベース復旧に必要な時間は、DBMS のチェックポイントインターバルの設定などによってある程度の制御ができますが、一般的には数分程度必要となるようです。
多くのアプリケーションは再実行するだけで業務を再開できますが、障害発生後の業務復旧手順が必要なアプリケーションもあります。このようなアプリケーションのためにクラスタソフトウェアは業務復旧手順を記述できるよう、アプリケーションの起動の代わりにスクリプトを起動できるようになっています。スクリプト内には、スクリプトの実行要因や実行サーバなどの情報をもとに、必要に応じて更新途中であったファイルのクリーンアップなどの復旧手順を記述します。
2.4.3. フェイルオーバ総括¶
ここまでの内容から、次のようなクラスタソフトの動作が分かると思います。
障害検出 (ハートビート/リソース監視)
ネットワークパーティション状態の解決 (NP解決)
クラスタ資源切り替え - データの引き継ぎ - IP アドレスの引き継ぎ - アプリケーションの引き継ぎ
クラスタソフトウェアは、フェイルオーバ実現のため、これらの様々な処置を 1 つ 1 つ確実に、短時間で実行することで、高可用性 (High Availability) を実現しているのです。
2.5. Single Point of Failureの排除¶
高可用性システムを構築するうえで、求められるもしくは目標とする可用性のレベルを把握することは重要です。これはすなわち、システムの稼働を阻害し得るさまざまな障害に対して、冗長構成をとることで稼働を継続したり、短い時間で稼働状態に復旧したりするなどの施策を費用対効果の面で検討し、システムを設計するということです。
Single Point of Failure (SPOF) とは、システム停止につながる部位を指す言葉であると前述しました。クラスタシステムではサーバの多重化を実現し、システムの SPOF を排除することができますが、共有ディスクなど、サーバ間で共有する部分については SPOF となり得ます。この共有部分を多重化もしくは排除するようシステム設計することが、高可用性システム構築の重要なポイントとなります。
クラスタシステムは可用性を向上させますが、フェイルオーバには数分程度のシステム切り替え時間が必要となります。従って、フェイルオーバ時間は可用性の低下要因の 1 つともいえます。このため、高可用性システムでは、まず単体サーバの可用性を高める ECC メモリや冗長電源などの技術が本来重要なのですが、ここでは単体サーバの可用性向上技術には触れず、クラスタシステムにおいて SPOF となりがちな下記の 3 つについて掘り下げて、どのような対策があるか見ていきたいと思います。
共有ディスク
共有ディスクへのアクセスパス
LAN
2.5.3. LAN¶
クラスタシステムに限らず、ネットワーク上で何らかのサービスを実行するシステムでは、LANの障害はシステムの稼働を阻害する大きな要因です。クラスタシステムでは適切な設定を行えば NIC 障害時にノード間でフェイルオーバを発生させて可用性を高めることは可能ですが、クラスタシステムの外側のネットワーク機器が故障した場合はやはりシステムの稼働を阻害します。
このようなケースでは、LAN を冗長化することでシステムの可用性を高めます。クラスタシステムにおいても、LAN の可用性向上には単体サーバでの技術がそのまま利用可能です。例えば、予備のネットワーク機器の電源を入れずに準備しておき、故障した場合に手動で入れ替えるといった原始的な手法や、高機能のネットワーク機器を冗長配置してネットワーク経路を多重化することで自動的に経路を切り替える方法が考えられます。また、インテル社の ANS ドライバのようにNICの冗長構成をサポートするドライバを利用するということも考えられます。
ロードバランス装置 (Load Balance Appliance) やファイアウォールサーバ (Firewall Appliance) も SPOF となりやすいネットワーク機器です。これらもまた、標準もしくはオプションソフトウェアを利用することで、フェイルオーバ構成を組めるようになっているのが普通です。同時にこれらの機器は、システム全体の非常に重要な位置に存在するケースが多いため、冗長構成をとることはほぼ必須と考えるべきです。
2.6. 可用性を支える運用¶
2.6.1. 運用前評価¶
システムトラブルの発生要因の多くは、設定ミスや運用保守に起因するものであるともいわれています。このことから考えても、高可用性システムを実現するうえで運用前の評価と障害復旧マニュアルの整備はシステムの安定稼働にとって重要です。評価の観点としては、実運用に合わせて、次のようなことを実践することが可用性向上のポイントとなります。
障害発生箇所を洗い出し、対策を検討し、擬似障害評価を行い実証する
クラスタのライフサイクルを想定した評価を行い、縮退運転時のパフォーマンスなどの検証を行う
これらの評価をもとに、システム運用、障害復旧マニュアルを整備する
クラスタシステムの設計をシンプルにすることは、上記のような検証やマニュアルが単純化でき、システムの可用性向上のポイントとなることが分かると思います。
2.6.2. 障害監視¶
上記のような努力にもかかわらず障害は発生するものです。ハードウェアには経年劣化があり、ソフトウェアにはメモリリークなどの理由や設計当初のキャパシティプラニングを超えた運用をしてしまうことによる障害など、長期間運用を続ければ必ず障害が発生してしまいます。このため、ハードウェア、ソフトウェアの可用性向上と同時に、さらに重要となるのは障害を監視して障害発生時に適切に対処することです。万が一サーバに障害が発生した場合を例に取ると、クラスタシステムを組むことで数分の切り替え時間でシステムの稼働を継続できますが、そのまま放置しておけばシステムは冗長性を失い次の障害発生時にはクラスタシステムは何の意味もなさなくなってしまいます。
このため、障害が発生した場合、すぐさまシステム管理者は次の障害発生に備え、新たに発生した SPOF を取り除くなどの対処をしなければなりません。このようなシステム管理業務をサポートするうえで、リモートメンテナンスや障害の通報といった機能が重要になります。Linuxでは、リモートメンテナンスの面ではいうまでもなく非常に優れていますし、障害を通報する仕組みも整いつつあります。
以上、クラスタシステムを利用して高可用性を実現するうえで必要とされる周辺技術やそのほかのポイントについて説明しました。簡単にまとめると次のような点に注意しましょうということになるかと思います。
Single Point of Failure を排除または把握する
障害に強いシンプルな設計を行い、運用前評価に基づき運用・障害復旧手順のマニュアルを整備する
発生した障害を早期に検出し適切に対処する
3. CLUSTERPRO の使用方法¶
本章では、CLUSTERPRO を構成するコンポーネントの説明と、クラスタシステムの設計から運用手順までの流れについて説明します。
本章で説明する項目は以下のとおりです。
3.1. CLUSTERPRO とは?¶
クラスタについて理解したところで、CLUSTERPRO の紹介を始めましょう。CLUSTERPRO とは、冗長化 (クラスタ化) したシステム構成により、現用系のサーバでの障害が発生した場合に、自動的に待機系のサーバで業務を引き継がせることで、飛躍的にシステムの可用性と拡張性を高めることを可能にするソフトウェアです。
3.2. CLUSTERPRO の製品構成¶
CLUSTERPRO は大きく分けると 2 つのモジュールから構成されています。
- CLUSTERPRO ServerCLUSTERPRO の本体で、サーバの高可用性機能の全てが包含されています。また、Cluster WebUI のサーバ側機能も含まれます。
- Cluster WebUICLUSTERPRO の構成情報の作成や運用管理を行うための管理ツールです。ユーザインターフェイスとして Web ブラウザを利用します。実体は CLUSTERPRO Server に組み込まれていますが、操作は管理端末上の Web ブラウザで行うため、CLUSTERPRO Server 本体とは区別されています。
3.3. CLUSTERPRO のソフトウェア構成¶
CLUSTERPRO のソフトウェア構成は次の図のようになります。Linux サーバ上には「CLUSTERPRO Server (CLUSTERPRO本体)」をインストールします。Cluster WebUI の本体機能は CLUSTERPRO Server に含まれるため、別途インストールする必要がありません。Cluster WebUI は管理 PC 上の Web ブラウザから利用するほか、クラスタを構成する各サーバ上の Web ブラウザでも利用できます。
3.3.1. CLUSTERPRO の障害監視のしくみ¶
CLUSTERPRO では、サーバ監視、業務監視、内部監視の 3 つの監視を行うことで、迅速かつ確実な障害検出を実現しています。以下にその監視の詳細を示します。
3.3.2. サーバ監視とは¶
- プライマリインタコネクトフェイルオーバ型クラスタ専用の通信パスで、一般の Ethernet NIC を使用します。ハートビートを行うと同時にサーバ間の情報交換に使用します。
- セカンダリインタコネクトクライアントとの通信に使用している通信パスを予備のインタコネクトとして使用します。TCP/IP が使用できる NIC であればどのようなものでも構いません。ハートビートを行うと同時にサーバ間の情報交換に使用します。
- 共有ディスクフェイルオーバ型クラスタを構成する全てのサーバに接続されたディスク上に、CLUSTERPRO 専用のパーティション (CLUSTERパーティション) を作成し、CLUSTER パーティション上でハートビートを行います。
- COM ポートフェイルオーバ型クラスタを構成するサーバ間を、COM ポートを介してハートビート通信を行い、他サーバの生存を確認します。
- BMCフェイルオーバ型クラスタを構成するサーバ間を、BMC を介してハートビート通信を行い、他サーバの生存を確認します。
- Witnessフェイルオーバ型クラスタを構成する各サーバとWitness サーバサービスが動作している外部サーバ (Witness サーバ) 間で通信を行い、Witness サーバが保持する他サーバとの通信情報から生存を確認します。
これらの通信経路を使用することでサーバ間の通信の信頼性は飛躍的に向上し、ネットワークパーティション状態の発生を防ぎます。
注釈
ネットワークパーティション状態について:クラスタサーバ間の全ての通信路に障害が発生しネットワーク的に分断されてしまう状態のことです。ネットワークパーティション状態に対応できていないクラスタシステムでは、通信路の障害とサーバの障害を区別できず、同一資源を複数のサーバからアクセスしデータ破壊を引き起こす場合があります。
3.3.3. 業務監視とは¶
業務監視とは、業務アプリケーションそのものや業務が実行できない状態に陥る障害要因を監視する機能です。
- アプリケーションの死活監視アプリケーションを起動用のリソース (EXEC リソースと呼びます) により起動を行い、監視用のリソース (PID モニタリソースと呼びます) により定期的にプロセスの生存を確認することで実現します。業務停止要因が業務アプリケーションの異常終了である場合に有効です。
注釈
CLUSTERPRO が直接起動したアプリケーションが監視対象の常駐プロセスを起動し終了してしまうようなアプリケーションでは、常駐プロセスの異常を検出することはできません。
アプリケーションの内部状態の異常 (アプリケーションのストールや結果異常) を検出することはできません。
- リソースの監視CLUSTERPRO のモニタリソースによりクラスタリソース (ディスクパーティション、IP アドレスなど) やパブリック LAN の状態を監視することで実現します。業務停止要因が業務に必要なリソースの異常である場合に有効です。
3.3.4. 内部監視とは¶
CLUSTERPRO プロセスの死活監視
3.3.5. 監視できる障害と監視できない障害¶
CLUSTERPRO には、監視できる障害とできない障害があります。クラスタシステム構築時、運用時に、どのような監視が検出可能なのか、または検出できないのかを把握しておくことが重要です。
3.3.6. サーバ監視で検出できる障害とできない障害¶
監視条件: 障害サーバからのハートビートが途絶
監視できる障害の例
ハードウェア障害 (OS が継続動作できないもの)
panic
監視できない障害の例
OS の部分的な機能障害 (マウス/キーボードのみが動作しない等)
3.3.7. 業務監視で検出できる障害とできない障害¶
監視条件: 障害アプリケーションの消滅、 継続的なリソース異常、 あるネットワーク装置への通信路切断
監視できる障害の例
アプリケーションの異常終了
共有ディスクへのアクセス障害 (HBA 1 の故障など)
パブリック LAN NIC の故障
監視できない障害の例
アプリケーションのストール/結果異常
アプリケーションのストール/結果異常を CLUSTERPRO で直接監視することはできませんが、アプリケーションを監視し異常検出時に自分自身を終了するプログラムを作成し、そのプログラムを EXEC リソースで起動、PID モニタリソースで監視することで、フェイルオーバを発生させることは可能です。
- 1
Host Bus Adapterの略で、共有ディスク側ではなく、サーバ本体側のアダプタのことです。
3.4. ネットワークパーティション解決¶
ping 方式
http 方式
参考
ネットワークパーティション解決方法の設定についての詳細は、『リファレンスガイド』の「ネットワークパーティション解決リソースの詳細」を参照してください。
3.5. フェイルオーバのしくみ¶
CLUSTERPRO は障害を検出すると、フェイルオーバ開始前に検出した障害がサーバの障害かネットワークパーティション状態かを判別します。この後、健全なサーバ上で各種リソースを活性化し業務アプリケーションを起動することでフェイルオーバを実行します。
このとき、同時に移動するリソースの集まりをフェイルオーバグループと呼びます。フェイルオーバグループは利用者から見た場合、仮想的なコンピュータとみなすことができます。
注釈
クラスタシステムでは、アプリケーションを健全なノードで起動しなおすことでフェイルオーバを実行します。このため、アプリケーションのメモリ上に格納されている実行状態をフェイルオーバすることはできません。
障害発生からフェイルオーバ完了までの時間は数分間必要です。以下にタイムチャートを示します。
ハートビートタイムアウト
業務を実行しているサーバの障害発生後、待機系がその障害を検出するまでの時間です。
- 業務の負荷に応じてクラスタプロパティの設定値を調整します。(出荷時設定では 90 秒に設定されています。)
各種リソース活性化
業務で必要なリソースを活性化するための時間です。
- 一般的な設定では数秒で活性化しますが、フェイルオーバグループに登録されているリソースの種類や数によって必要時間は変化します。(詳しくは、『インストール&設定ガイド』を参照してください。)
開始スクリプト実行時間
データベースのロールバック/ロールフォワードなどのデータ復旧時間と業務で使用するアプリケーションの起動時間です。
ロールバック/ロールフォワード時間などはチェックポイントインターバルの調整である程度予測可能です。詳しくは、各ソフトウェア製品のドキュメントを参照してください。
3.5.1. フェイルオーバリソース¶
CLUSTERPRO がフェイルオーバ対象とできる主なリソースは以下のとおりです。
切替パーティション (ディスクリソース、ミラーディスクリソース、ハイブリッドディスクリソースなど)
業務アプリケーションが引き継ぐべきデータを格納するためのディスクパーティションです。
フローティング IP アドレス (フローティング IP リソース)
フローティング IP アドレスを使用して業務へ接続することで、フェイルオーバによる業務の実行位置 (サーバ) の変化をクライアントは気にする必要がなくなります。
パブリック LAN アダプタへの IP アドレス動的割り当てと ARP パケットの送信により実現しています。ほとんどのネットワーク機器からフローティング IP アドレスによる接続が可能です
スクリプト (EXEC リソース)
CLUSTERPRO では、業務アプリケーションをスクリプトから起動します。
共有ディスクにて引き継がれたファイルはファイルシステムとして正常であっても、データとして不完全な状態にある場合があります。スクリプトにはアプリケーションの起動のほか、フェイルオーバ時の業務固有の復旧処理も記述します。
注釈
クラスタシステムでは、アプリケーションを健全なノードで起動しなおすことでフェイルオーバを実行します。このため、アプリケーションのメモリ上に格納されている実行状態をフェイルオーバすることはできません。
3.5.2. フェイルオーバ型クラスタのシステム構成¶
フェイルオーバ型クラスタは、ディスクアレイ装置をクラスタサーバ間で共有します。サーバ障害時には待機系サーバが共有ディスク上のデータを使用し業務を引き継ぎます。
フェイルオーバ型クラスタでは、運用形態により、次のように分類できます。
片方向スタンバイクラスタ
同一アプリケーション双方向スタンバイクラスタ
異種アプリケーション双方向スタンバイクラスタ
N + N 構成
3.5.4. ミラーディスク型のハードウェア構成¶
データミラー構成の CLUSTERPRO は、下図のような構成になります。
共有ディスク構成と比べ、ミラーディスクデータコピー用のネットワークが必要となりますが、通常、CLUSTERPRO の内部通信用 NIC と兼用します。
また、ミラーディスクは接続インターフェイス (IDE or SCSI) には依存しません。
3.5.5. ハイブリッドディスク型のハードウェア構成¶
ハイブリッド構成の CLUSTERPRO は、下図のような構成になります。
共有ディスク構成と比べ、データコピー用のネットワークが必要となりますが、通常、CLUSTERPRO の内部通信用 NIC と兼用します。
また、ディスクは接続インターフェイス (IDE or SCSI) には依存しません。
3.5.6. クラスタオブジェクトとは?¶
CLUSTERPRO では各種リソースを下のような構成で管理しています。
- クラスタオブジェクトクラスタの構成単位となります。
- サーバオブジェクト実体サーバを示すオブジェクトで、クラスタオブジェクトに属します。
- サーバグループオブジェクトサーバを束ねるオブジェクトで、クラスタオブジェクトに属します。
- ハートビートリソースオブジェクト実体サーバの NW 部分を示すオブジェクトで、サーバオブジェクトに属します。
- ネットワークパーティション解決リソースオブジェクトネットワークパーティション解決機構を示すオブジェクトで、サーバオブジェクトに属します。
- グループオブジェクト仮想サーバを示すオブジェクトで、クラスタオブジェクトに属します。
- グループリソースオブジェクト仮想サーバの持つリソース (NW、ディスク) を示すオブジェクトでグループオブジェクトに属します。
- モニタリソースオブジェクト監視機構を示すオブジェクトで、クラスタオブジェクトに属します。
3.6. リソースとは?¶
CLUSTERPRO では、監視する側とされる側の対象をすべてリソースと呼び、分類して管理します。このことにより、より明確に監視/被監視の対象を区別できるほか、クラスタ構築や障害検出時の対応が容易になります。リソースはハートビートリソース、ネットワークパーティション解決リソース、グループリソース、モニタリソースの 4 つに分類されます。以下にその概略を示します。
3.6.1. ハートビートリソース¶
サーバ間で、お互いの生存を確認するためのリソースです。
以下に現在サポートされているハートビートリソースを示します。
- LAN ハートビートリソースEthernet を利用した通信を示します。
- カーネルモード LAN ハートビートリソースEthernet を利用した通信を示します。
- COM ハートビートリソースRS232C (COM) を利用した通信を示します。
- ディスクハートビートリソース共有ディスク上の特定パーティション (ディスクハートビート用パーティション) を利用した通信を示します。共有ディスク構成の場合のみ利用可能です。
- BMC ハートビートリソースBMC 経由で Ethernet を利用した通信を示します。BMC のハードウェアおよびファームウェアが対応している場合のみ利用可能です。
- Witness ハートビートリソースWitness サーバサービスが動作している外部サーバから取得した各サーバとの通信状態を示します。
3.6.2. ネットワークパーティション解決リソース¶
ネットワークパーティション状態を解決するためのリソースを示します。
- PING ネットワークパーティション解決リソースPING 方式によるネットワークパーティション解決リソースです。
- HTTP ネットワークパーティション解決リソースHTTP 方式によるネットワークパーティション解決リソースです。
3.6.3. グループリソース¶
フェイルオーバを行う際の単位となる、フェイルオーバグループを構成するリソースです。
以下に現在サポートされているグループリソースを示します。
- フローティング IP リソース (fip)仮想的な IP アドレスを提供します。クライアントからは一般の IP アドレスと同様にアクセス可能です。
- EXEC リソース (exec)業務 (DB、httpd、etc..) を起動/停止するための仕組みを提供します。
- ディスクリソース (disk)共有ディスク上の指定パーティションを提供します。 (共有ディスク) 構成の場合のみ利用可能です。
- ミラーディスクリソース (md)ミラーディスク上の指定パーティションを提供します。 (ミラーディスク) 構成の場合のみ利用可能です。
- ハイブリッドディスクリソース (hd)共有ディスク、またはディスク上の指定パーティションを提供します。(ハイブリッド) 構成の場合のみ利用可能です。
- ボリュームマネージャリソース (volmgr)複数のストレージやディスクを一つの論理的なディスクとして扱います。
- NAS リソース (nas)NAS サーバ上の共有リソースへ接続します。(クラスタサーバが NAS のサーバ側として振る舞うリソースではありません。)
- 仮想 IP リソース (vip)仮想的な IP アドレスを提供します。クライアントからは一般の IP アドレスと同様にアクセス可能です。ネットワークアドレスの異なるセグメント間で遠隔クラスタを構成する場合に使用します。
- 仮想マシンリソース (vm)仮想マシンの起動、停止、マイグレーションを行います。
- ダイナミック DNS リソース (ddns)Dynamic DNS サーバに仮想ホスト名と活性サーバの IP アドレスを登録します。
- AWS Elastic IPリソース (awseip)AWS 上で CLUSTERPRO を利用する場合、Elastic IP(以下、EIP)を付与する仕組みを提供します。
- AWS 仮想IPリソース (awsvip)AWS 上で CLUSTERPRO を利用する場合、仮想IP(以下、VIP)を付与する仕組みを提供します。
- AWS DNS リソース (awsdns)AWS 上で CLUSTERPRO を利用する場合、Amazon Route 53 に仮想ホスト名と活性サーバの IP アドレスを登録します。
- Azure プローブポートリソース (azurepp)Microsoft Azure 上で CLUSTERPRO を利用する場合、業務が稼働するノードで特定のポートを開放する仕組みを提供します。
- Azure DNS リソース (azuredns)Microsoft Azure 上で CLUSTERPRO を利用する場合、Azure DNS に仮想ホスト名と活性サーバの IP アドレスを登録します。
- Google Cloud 仮想 IP リソース (gcvip)Google Cloud Platform 上で CLUSTERPRO を利用する場合、業務が稼働するノードで特定のポートを開放する仕組みを提供します。
- Oracle Cloud 仮想 IP リソース (ocvip)Oracle Cloud Infrastructure 上で CLUSTERPRO を利用する場合、業務が稼働するノードで特定のポートを開放する仕組みを提供します。
3.6.4. モニタリソース¶
クラスタシステム内で、監視を行う主体であるリソースです。
以下に現在サポートされているモニタリソースを示します。
- フローティング IP モニタリソース (fipw)フローティング IP リソースで起動した IP アドレスの監視機構を提供します。
- IP モニタリソース (ipw)外部の IP アドレスの監視機構を提供します。
- ディスクモニタリソース (diskw)ディスクの監視機構を提供します。共有ディスクの監視にも利用されます。
- ミラーディスクモニタリソース (mdw)ミラーディスクの監視機構を提供します。
- ミラーディスクコネクトモニタリソース (mdnw)ミラーディスクコネクトの監視機構を提供します。
- ハイブリッドディスクモニタリソース (hdw)ハイブリッドディスクの監視機構を提供します。
- ハイブリッドディスクコネクトモニタリソース (hdnw)ハイブリッドディスクコネクトの監視機構を提供します。
- PID モニタリソース (pidw)EXEC リソースで起動したプロセスの死活監視機能を提供します。
- ユーザ空間モニタリソース (userw)ユーザ空間のストール監視機構を提供します。
- NIC Link Up/Down モニタリソース (miiw)LAN ケーブルのリンクステータスの監視機構を提供します。
- ボリュームマネージャモニタリソース (volmgrw)複数のストレージやディスクの監視機構を提供します。
- マルチターゲットモニタリソース (mtw)複数のモニタリソースを束ねたステータスを提供します。
- 仮想 IP モニタリソース (vipw)仮想 IP リソースの RIP パケットを送出する機構を提供します。
- ARP モニタリソース (arpw)フローティング IP リソースまたは仮想 IP リソースの ARP パケットを送出する機構を提供します。
- カスタムモニタリソース (genw)監視処理を行うコマンドやスクリプトがある場合に、その動作結果によりシステムを監視する機構を提供します。
- 仮想マシンモニタリソース (vmw)仮想マシンの生存確認を行います。
- 外部連携モニタリソース (mrw)"異常発生通知受信時に実行する異常時動作の設定" と "異常発生通知のCluster WebUI 表示" を実現するためのモニタリソースです。
- ダイナミック DNS モニタリソース (ddnsw)定期的に Dynamic DNS サーバに仮想ホスト名と活性サーバの IP アドレスを登録します。
- プロセス名モニタリソース (psw)プロセス名を指定することで、任意のプロセスの死活監視機能を提供します。
- BMC モニタリソース (bmcw)搭載されているBMCの死活監視機能を提供します。
- DB2 モニタリソース (db2w)IBM DB2 データベースへの監視機構を提供します。
- ftp モニタリソース (ftpw)FTP サーバへの監視機構を提供します。
- http モニタリソース (httpw)HTTP サーバへの監視機構を提供します。
- imap4 モニタリソース (imap4w)IMAP4 サーバへの監視機構を提供します。
- MySQL モニタリソース (mysqlw)MySQL データベースへの監視機構を提供します。
- nfs モニタリソース (nfsw)nfs ファイルサーバへの監視機構を提供します。
- Oracle モニタリソース (oraclew)Oracle データベースへの監視機構を提供します。
- Oracle Clusterware同期管理モニタリソース (osmw)Oracle Clusterware連携プロセスの監視とメンバシップ情報同期機構を提供します。
- pop3 モニタリソース (pop3w)POP3 サーバへの監視機構を提供します。
- PostgreSQL モニタリソース (psqlw)PostgreSQL データベースへの監視機構を提供します。
- samba モニタリソース (sambaw)samba ファイルサーバへの監視機構を提供します。
- smtp モニタリソース (smtpw)SMTP サーバへの監視機構を提供します。
- Sybase モニタリソース (sybasew)Sybase データベースへの監視機構を提供します。
- Tuxedo モニタリソース (tuxw)Tuxedo アプリケーションサーバへの監視機構を提供します。
- Websphere モニタリソース (wasw)Websphere アプリケーションサーバへの監視機構を提供します。
- Weblogic モニタリソース (wlsw)Weblogic アプリケーションサーバへの監視機構を提供します。
- WebOTX モニタリソース (otxw)WebOTX アプリケーションサーバへの監視機構を提供します。
- JVM モニタリソース (jraw)Java VMへの監視機構を提供します。
- システムモニタリソース (sraw)システム全体のリソースへの監視機構を提供します。
- プロセスリソースモニタリソース (psrw)プロセス個別のリソースへの監視機構を提供します。
- AWS Elastic IP モニタリソース (awseipw)AWS Elastic IP リソースで付与した EIP の監視機構を提供します。
- AWS 仮想IPモニタリソース (awsvipw)AWS 仮想IPリソースで付与した VIP の監視機構を提供します。
- AWS AZ モニタリソース (awsazw)Availability Zone(以下、AZ) の監視機構を提供します。
- AWS DNS モニタリソース (awsdnsw)AWS DNS リソースで付与した仮想ホスト名と IP アドレスの監視機構を提供します。
- Azure プローブポートモニタリソース (azureppw)Azure プローブポートリソースが起動しているノードに対して、プローブポートの監視機構を提供します。
- Azure ロードバランスモニタリソース (azurelbw)Azure プローブポートリソースが起動していないノードに対して、プローブ ポートと同じポート番号が開放されていないかの監視機構を提供します。
- Azure DNS モニタリソース (azurednsw)Azure DNS リソースで付与した仮想ホスト名と IP アドレスの監視機構を提供します。
- Google Cloud 仮想 IP モニタリソース (gcvipw)Google Cloud 仮想 IP リソースが起動しているノードに対して、死活監視のためのポートの監視機構を提供します。
- Google Cloud ロードバランスモニタリソース (gclbw)Google Cloud 仮想 IP リソースが起動していないノードに対して、ヘルスチェック用ポートと同じポート番号が開放されていないかの監視機構を提供します。
- Oracle Cloud 仮想 IP モニタリソース (ocvipw)Oracle Cloud 仮想 IP リソースが起動しているノードに対して、死活監視のためのポートの監視機構を提供します。
- Oracle Cloud ロードバランスモニタリソース (oclbw)Oracle Cloud 仮想 IP リソースが起動していないノードに対して、ヘルスチェック用ポートと同じポート番号が開放されていないかの監視機構を提供します。
3.7. CLUSTERPRO を始めよう!¶
以上で CLUSTERPRO の簡単な説明が終了しました。
以降は、以下の流れに従い、対応するガイドを読み進めながら CLUSTERPRO を使用したクラスタシステムの構築を行ってください。
3.7.2. クラスタシステムの設計¶
『インストール&設定ガイド』の「システム構成を決定する」、「クラスタシステムを設計する」および
『リファレンスガイド 』の「グループリソースの詳細」、「モニタリソースの詳細」、「ハートビートリソースの詳細」、「ネットワークパーティション解決リソースの詳細」、「その他の設定情報」および『ハードウェア連携ガイド』 を参照してください。
3.7.3. クラスタシステムの構築¶
『インストール&設定ガイド』の全編を参照してください。
3.7.4. クラスタシステムの運用開始後の障害対応¶
『メンテナンスガイド』の「保守情報」および『リファレンスガイド』の「トラブルシューティング」、「エラーメッセージ一覧」を参照してください。
4. CLUSTERPRO の動作環境¶
本章では、CLUSTERPRO の動作環境について説明します。
本章で説明する項目は以下の通りです。
4.1. ハードウェア¶
CLUSTERPRO は以下のアーキテクチャのサーバで動作します。
x86_64
IBM POWER (Replicator, Replicator DR、並びに、Database Agent 以外の Agent は未サポート)
IBM POWER LE (Replicator, Replicator DR、並びに、各 Agent は未サポート)
4.1.1. スペック¶
CLUSTERPRO Server で必要なスペックは下記の通りです。
RS-232C ポート 1 つ (3 ノード以上のクラスタを構築する場合は不要)
Ethernet ポート 2 つ以上
共有ディスク
ミラー用ディスク または ミラー用空きパーティション
CD-ROM ドライブ
4.1.2. NX7700x シリーズとの連携に対応したサーバ¶
BMC ハートビートリソースおよび外部連携モニタリソースの NX7700x シリーズ連携機能が利用可能なサーバは下記の通りです。本機能は下記のサーバ以外では利用できません。
サーバ |
備考 |
---|---|
NX7700x/A2010M |
最新のファームウェアにアップデートしてください。 |
NX7700x/A2010L |
最新のファームウェアにアップデートしてください。 |
NX7700x/A3012M |
最新のファームウェアにアップデートしてください。 |
NX7700x/A3012L |
最新のファームウェアにアップデートしてください。 |
NX7700x/A3010M |
最新のファームウェアにアップデートしてください。 |
4.1.3. Express5800/A1080a,A1040a シリーズとの連携に対応したサーバ¶
BMC ハートビートリソースおよび外部連携モニタリソースの Express5800/A1080a,A1040a シリーズ連携機能が利用可能なサーバは下記の通りです。本機能は下記のサーバ以外では利用できません。
サーバ |
備考 |
---|---|
Express5800/A1080a-E |
最新のファームウェアにアップデートしてください。 |
Express5800/A1080a-D |
最新のファームウェアにアップデートしてください。 |
Express5800/A1080a-S |
最新のファームウェアにアップデートしてください。 |
Express5800/A1040a |
最新のファームウェアにアップデートしてください。 |
4.2. ソフトウェア¶
4.2.1. CLUSTERPRO Server の動作環境¶
4.2.2. 動作可能なディストリビューションとkernel¶
注釈
CLUSTERPRO XのCD媒体には、新しいkernelに対応したrpmが含まれていない場合があります。運用環境でのkernelバージョンと本章の「 動作可能なディストリビューションとkernel 」を確認していただき、「CLUSTERPRO Version」に記載されているバージョンに適合したUpdateの適用をお願いいたします。
独自kernelモジュール |
説明 |
---|---|
カーネルモード LANハートビートドライバ |
カーネルモード LAN ハートビートリソースで使用します。 |
Keepaliveドライバ |
ユーザ空間モニタリソースの監視方法として keepalive を選択した場合に使用します。
シャットダウン監視の監視方法として keepalive を選択した場合に使用します。
|
ミラードライバ |
ミラーディスクリソースで使用します。 |
動作確認済みのディストリビューションと kernel バージョンについては、以下のWebサイトを参照してください。
CLUSTERPRO製品Webサイト→ CLUSTERPRO X→ 動作環境→ Linux 動作環境
注釈
CLUSTERPRO が対応する CentOS のkernelバージョンは、Red Hat Enterprise Linux の対応kernelバージョンを確認してください。
4.2.3. 監視オプションの動作確認済アプリケーション情報¶
モニタリソースの監視対象のアプリケーションのバージョンの情報
x86_64
モニタリソース
監視対象のアプリケーション CLUSTERPROVersion備考
Oracle モニタ
Oracle Database 12c Release 1 (12.1)
4.0.0-1~
Oracle Database 12c Release 2 (12.2)
4.0.0-1~
Oracle Database 18c (18.3)
4.1.0-1~
Oracle Database 19c (19.3)
4.1.0-1~
DB2 モニタ
DB2 V10.5
4.0.0-1~
DB2 V11.1
4.0.0-1~
DB2 V11.5
4.2.0-1~
PostgreSQL モニタ
PostgreSQL 9.3
4.0.0-1~
PostgreSQL 9.4
4.0.0-1~
PostgreSQL 9.5
4.0.0-1~
PostgreSQL 9.6
4.0.0-1~
PostgreSQL 10
4.0.0-1~
PostgreSQL 11
4.1.0-1~
PostgreSQL 12
4.2.2-1~
PowerGres on Linux 9.1
4.0.0-1~
PowerGres on Linux 9.4
4.0.0-1~
PowerGres on Linux 9.6
4.0.0-1~
PowerGres on Linux 11
4.1.0-1~
MySQL モニタ
MySQL 5.5
4.0.0-1~
MySQL 5.6
4.0.0-1~
MySQL 5.7
4.0.0-1~
MySQL 8.0
4.1.0-1~
MariaDB 5.5
4.0.0-1~
MariaDB 10.0
4.0.0-1~
MariaDB 10.1
4.0.0-1~
MariaDB 10.2
4.0.0-1~
MariaDB 10.3
4.1.0-1~
MariaDB 10.4
4.2.0-1~
Sybase モニタ
Sybase ASE 15.5
4.0.0-1~
Sybase ASE 15.7
4.0.0-1~
SAP ASE 16.0
4.0.0-1~
SQL Server モニタ
SQL Server 2017
4.0.0-1~
SQL Server 2019
4.2.0-1~
samba モニタ
Samba 3.3
4.0.0-1~
Samba 3.6
4.0.0-1~
Samba 4.0
4.0.0-1~
Samba 4.1
4.0.0-1~
Samba 4.2
4.0.0-1~
Samba 4.4
4.0.0-1~
Samba 4.6
4.0.0-1~
Samba 4.7
4.1.0-1~
Samba 4.8
4.1.0-1~
nfs モニタ
nfsd 2 (udp)
4.0.0-1~
nfsd 3 (udp)
4.0.0-1~
nfsd 4 (tcp)
4.0.0-1~
mountd 1(tcp)
4.0.0-1~
mountd 2(tcp)
4.0.0-1~
mountd 3(tcp)
4.0.0-1~
http モニタ
バージョン指定無し
4.0.0-1~
smtp モニタ
バージョン指定無し
4.0.0-1~
pop3 モニタ
バージョン指定無し
4.0.0-1~
imap4 モニタ
バージョン指定無し
4.0.0-1~
ftp モニタ
バージョン指定無し
4.0.0-1~
Tuxedo モニタ
Tuxedo 12c Release 2 (12.1.3)
4.0.0-1~
Weblogic モニタ
WebLogic Server 11g R1
4.0.0-1~
WebLogic Server 11g R2
4.0.0-1~
WebLogic Server 12c R2 (12.2.1)
4.0.0-1~
WebLogic Server 14c (14.1.1)
4.2.0-1~
Websphere モニタ
WebSphere Application Server 8.5
4.0.0-1~
WebSphere Application Server 8.5.5
4.0.0-1~
WebSphere Application Server 9.0
4.0.0-1~
WebOTX モニタ
WebOTX Application Server V9.1
4.0.0-1~
WebOTX Application Server V9.2
4.0.0-1~
WebOTX Application Server V9.3
4.0.0-1~
WebOTX Application Server V9.4
4.0.0-1~
WebOTX Application Server V10.1
4.0.0-1~
JVM モニタ
WebLogic Server 11g R1
4.0.0-1~
WebLogic Server 11g R2
4.0.0-1~
WebLogic Server 12c
4.0.0-1~
WebLogic Server 12c R2 (12.2.1)
4.0.0-1~
WebLogic Server 14c (14.1.1)
4.2.0-1~
WebOTX Application Server V9.1
4.0.0-1~
WebOTX Application Server V9.2
4.0.0-1~
プロセスグループ監視にはWebOTX updateが必要
WebOTX Application Server V9.3
4.0.0-1~
WebOTX Application Server V9.4
4.0.0-1~
WebOTX Application Server V10.1
4.0.0-1~
WebOTX Enterprise Service Bus V8.4
4.0.0-1~
WebOTX Enterprise Service Bus V8.5
4.0.0-1~
JBoss Enterprise Application Platform 7.0
4.0.0-1~
Apache Tomcat 8.0
4.0.0-1~
Apache Tomcat 8.5
4.0.0-1~
Apache Tomcat 9.0
4.0.0-1~
WebSAM SVF for PDF 9.0
4.0.0-1~
WebSAM SVF for PDF 9.1
4.0.0-1~
WebSAM SVF for PDF 9.2
4.0.0-1~
WebSAM Report Director Enterprise 9.0
4.0.0-1~
WebSAM Report Director Enterprise 9.1
4.0.0-1~
WebSAM Report Director Enterprise 9.2
4.0.0-1~
WebSAM Universal Connect/X 9.0
4.0.0-1~
WebSAM Universal Connect/X 9.1
4.0.0-1~
WebSAM Universal Connect/X 9.2
4.0.0-1~
システムモニタ
バージョン指定無し
4.0.0-1~
プロセスリソースモニタ
バージョン指定無し
4.1.0-1~
注釈
x86_64環境で監視オプションをご利用される場合、監視対象のアプリケーションもx86_64版のアプリケーションをご利用ください。
IBM POWER
モニタリソース
監視対象のアプリケーション CLUSTERPROVersion備考
DB2 モニタ
DB2 V10.5
4.0.0-1~
PostgreSQL モニタ
PostgreSQL 9.3
4.0.0-1~
PostgreSQL 9.4
4.0.0-1~
PostgreSQL 9.5
4.0.0-1~
PostgreSQL 9.6
4.0.0-1~
PostgreSQL 10
4.0.0-1~
PostgreSQL 11
4.1.0-1~
注釈
IBM POWER環境で監視オプションをご利用される場合、監視対象のアプリケーションもIBM POWER版のアプリケーションをご利用ください。
4.2.4. 仮想マシンリソースの動作環境¶
仮想マシンリソースの動作確認を行った仮想化基盤のバージョン情報を下記に提示します。
仮想化基盤 |
バージョン |
CLUSTERPRO
Version
|
備考 |
---|---|---|---|
vSphere |
5.5 |
4.0.0-1~ |
管理用OSが必要です。 |
6.5 |
4.0.0-1~ |
管理用OSが必要です。 |
|
XenServer |
6.5 (x86_64) |
4.0.0-1~ |
|
KVM |
Red Hat Enterprise Linux 6.9 (x86_64) |
4.0.0-1~ |
|
Red Hat Enterprise Linux 7.4 (x86_64) |
4.0.0-1~ |
注釈
XenServer ホストで CLUSTERPRO を使用する場合、以下の機能が利用できません。
カーネルモード LAN ハートビートリソース
ミラーディスクリソース/ハイブリッドディスクリソース
ユーザ空間モニタリソース (keepalive/softdog 方式)
シャットダウン監視 (keepalive/softdog 方式)
4.2.5. JVM モニタの動作環境¶
JVMモニタを使用する場合には、Java 実行環境が必要です。また、JBoss Enterprise Application Platformのドメインモードを監視する場合は、Java(TM) SE Development Kitが必要です。
JVMモニタ ロードバランサ連携機能の動作確認を行ったロードバランサを下記に提示します。
x86_64
ロードバランサ
CLUSTERPROVersion備考
Express5800/LB400h以降
4.0.0-1~
InterSec/LB400i 以降
4.0.0-1~
BIG-IP v11
4.0.0-1~
CoyotePoint Equalizer
4.0.0-1~
4.2.6. AWS Elastic IP リソース、AWS 仮想 IP リソース、AWS Elastic IP モニタリソース、AWS 仮想 IP モニタリソース、AWS AZ モニタリソースの動作環境¶
AWS Elastic IPリソース、AWS 仮想IPリソース、AWS Elastic IPモニタリソース、AWS 仮想IPモニタリソース、AWS AZモニタリソースを使用する場合には、以下のソフトウェアが必要です。
ソフトウェア |
Version |
備考 |
---|---|---|
AWS CLI |
1.6.0~ |
AWS CLI バージョン 2 は未対応です |
Python |
2.6.5~
2.7.5~
3.5.2~
3.6.8~
3.8.1~
|
AWS CLI 付属の Python は不可 |
x86_64
ディストリビューション
CLUSTERPROVersion備考
Red Hat Enterprise Linux 6.8
4.0.0-1~
Red Hat Enterprise Linux 6.9
4.0.0-1~
Red Hat Enterprise Linux 6.10
4.1.0-1~
Red Hat Enterprise Linux 7.3
4.0.0-1~
Red Hat Enterprise Linux 7.4
4.0.0-1~
Red Hat Enterprise Linux 7.5
4.1.0-1~
Red Hat Enterprise Linux 7.6
4.1.0-1~
Red Hat Enterprise Linux 7.7
4.2.0-1~
Cent OS 6.8
4.0.0-1~
Cent OS 6.9
4.0.0-1~
Cent OS 6.10
4.2.0-1~
Cent OS 7.3
4.0.0-1~
Cent OS 7.4
4.0.0-1~
Cent OS 7.5
4.1.0-1~
Cent OS 7.6
4.2.0-1~
SUSE Linux Enterprise Server 11 SP3
4.0.0-1~
SUSE Linux Enterprise Server 11 SP4
4.0.0-1~
SUSE Linux Enterprise Server 12 SP1
4.0.0-1~
SUSE Linux Enterprise Server 12 SP2
4.1.0-1~
SUSE Linux Enterprise Server 12 SP4
4.2.0-1~
SUSE Linux Enterprise Server 15 SP1
4.2.0-1~
Oracle Linux 6.6
4.0.0-1~
Oracle Linux 7.3
4.0.0-1~
Oracle Linux 7.6
4.2.0-1~
Ubuntu 14.04.LTS
4.0.0-1~
Ubuntu 16.04.3 LTS
4.0.0-1~
Ubuntu 18.04.3 LTS
4.2.0-1~
Amazon Linux 2
4.1.0-1~
4.2.7. AWS DNS リソース、AWS DNS モニタリソースの動作環境¶
AWS DNS リソース、AWS DNS モニタリソースを使用する場合には、以下のソフトウェアが必要です。
ソフトウェア |
Version |
備考 |
---|---|---|
AWS CLI |
1.11.0~ |
AWS CLI バージョン 2 は未対応です |
Python (Red Hat Enterprise Linux 6, Cent OS 6, SUSE Linux Enterprise Server 11, Oracle Linux 6 の場合) |
2.6.6~
3.6.5~
3.8.1~
|
AWS CLI 付属の Python は不可 |
Python (Red Hat Enterprise Linux 6, Cent OS 6, SUSE Linux Enterprise Server 11, Oracle Linux 6 以外の場合) |
2.7.5~
3.5.2~
3.6.8~
3.8.1~
|
AWS CLI 付属の Python は不可 |
x86_64
ディストリビューション
CLUSTERPROVersion備考
Red Hat Enterprise Linux 6.8
4.0.0-1~
Red Hat Enterprise Linux 6.9
4.0.0-1~
Red Hat Enterprise Linux 6.10
4.1.0-1~
Red Hat Enterprise Linux 7.3
4.0.0-1~
Red Hat Enterprise Linux 7.4
4.0.0-1~
Red Hat Enterprise Linux 7.5
4.1.0-1~
Red Hat Enterprise Linux 7.6
4.1.0-1~
Red Hat Enterprise Linux 7.7
4.2.0-1~
Cent OS 6.8
4.0.0-1~
Cent OS 6.9
4.0.0-1~
Cent OS 6.10
4.2.0-1~
Cent OS 7.3
4.0.0-1~
Cent OS 7.4
4.0.0-1~
Cent OS 7.5
4.1.0-1~
Cent OS 7.6
4.2.0-1~
SUSE Linux Enterprise Server 11 SP3
4.0.0-1~
SUSE Linux Enterprise Server 11 SP4
4.0.0-1~
SUSE Linux Enterprise Server 12 SP1
4.0.0-1~
SUSE Linux Enterprise Server 12 SP2
4.1.0-1~
SUSE Linux Enterprise Server 12 SP4
4.2.0-1~
SUSE Linux Enterprise Server 15 SP1
4.2.0-1~
Oracle Linux 6.6
4.0.0-1~
Oracle Linux 7.3
4.0.0-1~
Oracle Linux 7.6
4.2.0-1~
Ubuntu 14.04.LTS
4.0.0-1~
Ubuntu 16.04.3 LTS
4.0.0-1~
Ubuntu 18.04.3 LTS
4.2.0-1~
Amazon Linux 2
4.1.0-1~
4.2.8. Azure プローブポートリソース、Azure プローブポートモニタリソース、Azure ロードバランスモニタリソースの動作環境¶
x86_64
ディストリビューション
CLUSTERPROVersion備考
Red Hat Enterprise Linux 6.8
4.0.0-1~
Red Hat Enterprise Linux 6.9
4.0.0-1~
Red Hat Enterprise Linux 6.10
4.1.0-1~
Red Hat Enterprise Linux 7.3
4.0.0-1~
Red Hat Enterprise Linux 7.4
4.0.0-1~
Red Hat Enterprise Linux 7.5
4.1.0-1~
Red Hat Enterprise Linux 7.6
4.1.0-1~
Red Hat Enterprise Linux 7.7
4.2.0-1~
CentOS 6.8
4.0.0-1~
CentOS 6.9
4.0.0-1~
CentOS 6.10
4.1.0-1~
CentOS 7.3
4.0.0-1~
CentOS 7.4
4.0.0-1~
CentOS 7.5
4.1.0-1~
CentOS 7.6
4.1.0-1~
Asianux Server 4 SP6
4.0.0-1~
Asianux Server 4 SP7
4.0.0-1~
Asianux Server 7 SP1
4.0.0-1~
Asianux Server 7 SP2
4.0.0-1~
Asianux Server 7 SP3
4.2.0-1~
SUSE Linux Enterprise Server 11 SP3
4.0.0-1~
SUSE Linux Enterprise Server 11 SP4
4.0.0-1~
SUSE Linux Enterprise Server 12 SP1
4.0.0-1~
SUSE Linux Enterprise Server 12 SP2
4.1.0-1~
SUSE Linux Enterprise Server 12 SP4
4.2.0-1~
SUSE Linux Enterprise Server 15 SP1
4.2.0-1~
Oracle Linux 6.6
4.0.0-1~
Oracle Linux 7.3
4.0.0-1~
Oracle Linux 7.5
4.1.0-1~
Oracle Linux 7.7
4.2.0-1~
Ubuntu 14.04.LTS
4.0.0-1~
Ubuntu 16.04.3 LTS
4.0.0-1~
Ubuntu 18.04.3 LTS
4.2.0-1~
Azure プローブポートリソースの動作確認を行った Microsoft Azure 上のデプロイモデルを下記に提示します。ロードバランサーの追加方法は Microsoft のドキュメント(https://azure.microsoft.com/ja-jp/documentation/articles/load-balancer-arm/)を参照してください。
x86_64
デプロイモデル |
CLUSTERPRO
|
備考 |
---|---|---|
リソースマネージャー |
4.0.0-1~ |
ロードバランサーの追加が必要 |
4.2.9. Azure DNS リソース、Azure DNS モニタリソースの動作環境¶
Azure DNS リソース、Azure DNS モニタリソースを使用する場合には、以下のソフトウェアが必要です。
ソフトウェア |
Version |
備考 |
---|---|---|
Azure CLI (Red Hat Enterprise Linux 6, Cent OS 6, Asianux Server 4, SUSE Linux Enterprise Server 11, Oracle Linux 6 の場合) |
1.0~ |
Python は不要 |
Azure CLI (Red Hat Enterprise Linux 6, Cent OS 6, Asianux Server 4, SUSE Linux Enterprise Server 11, Oracle Linux 6 以外の場合) |
2.0~ |
x86_64
ディストリビューション
CLUSTERPROVersion備考
Red Hat Enterprise Linux 6.8
4.0.0-1~
Red Hat Enterprise Linux 6.9
4.0.0-1~
Red Hat Enterprise Linux 6.10
4.1.0-1~
Red Hat Enterprise Linux 7.3
4.0.0-1~
Red Hat Enterprise Linux 7.4
4.0.0-1~
Red Hat Enterprise Linux 7.5
4.1.0-1~
Red Hat Enterprise Linux 7.6
4.1.0-1~
Red Hat Enterprise Linux 7.7
4.2.0-1~
CentOS 6.8
4.0.0-1~
CentOS 6.9
4.0.0-1~
CentOS 6.10
4.1.0-1~
CentOS 7.3
4.0.0-1~
CentOS 7.4
4.0.0-1~
CentOS 7.5
4.1.0-1~
CentOS 7.6
4.1.0-1~
Asianux Server 4 SP6
4.0.0-1~
Asianux Server 4 SP7
4.0.0-1~
Asianux Server 7 SP1
4.0.0-1~
Asianux Server 7 SP2
4.0.0-1~
Asianux Server 7 SP3
4.2.0-1~
SUSE Linux Enterprise Server 11 SP3
4.0.0-1~
SUSE Linux Enterprise Server 11 SP4
4.0.0-1~
SUSE Linux Enterprise Server 12 SP1
4.0.0-1~
SUSE Linux Enterprise Server 12 SP2
4.1.0-1~
SUSE Linux Enterprise Server 12 SP4
4.2.0-1~
SUSE Linux Enterprise Server 15 SP1
4.2.0-1~
Oracle Linux 6.6
4.0.0-1~
Oracle Linux 7.3
4.0.0-1~
Oracle Linux 7.5
4.1.0-1~
Oracle Linux 7.7
4.2.0-1~
Ubuntu 14.04.LTS
4.0.0-1~
Ubuntu 16.04.3 LTS
4.0.0-1~
Ubuntu 18.04.3 LTS
4.2.0-1~
x86_64
デプロイモデル |
CLUSTERPRO
|
備考 |
---|---|---|
リソースマネージャー |
4.0.0-1~ |
Azure DNS の追加が必要 |
4.2.10. Google Cloud 仮想 IP リソース、Google Cloud 仮想 IP モニタリソース、Google Cloud ロードバランスモニタリソースの動作環境¶
x86_64
ディストリビューション
CLUSTERPROVersion備考
Red Hat Enterprise Linux 6.10
4.2.0-1~
Red Hat Enterprise Linux 7.7
4.2.0-1~
SUSE Linux Enterprise Server 15 SP1
4.2.0-1~
Ubuntu 16.04.3 LTS
4.2.0-1~
Ubuntu 18.04.3 LTS
4.2.0-1~
4.2.11. Oracle Cloud 仮想 IP リソース、Oracle Cloud 仮想 IP モニタリソース、Oracle Cloud ロードバランスモニタリソースの動作環境¶
x86_64
ディストリビューション
CLUSTERPROVersion備考
Oracle Linux 6.10
4.2.0-1~
Oracle Linux 7.7
4.2.0-1~
Ubuntu 16.04.3 LTS
4.2.0-1~
Ubuntu 18.04.3 LTS
4.2.0-1~
4.2.12. SAP 連携コネクタの動作環境¶
SAP連携コネクタの動作確認を行った OS および SAP NetWeaver(以降、SAP NW) のバージョン情報を下記に提示します。
x86_64
NW Version
SAPカーネルバージョン
CLUSTERPROVersionOS
クラスタ構成
7.5
7457497534.0.0-1~
Red Hat Enterprise Linux 7.3Red Hat Enterprise Linux 7.4SUSE LINUX Enterprise Server 12 SP1NAS接続、共有ディスク型
7.52
753 4.1.0-1~ Red Hat Enterprise Linux 7.5 NAS接続、共有ディスク型 753 4.2.0-1~ Red Hat Enterprise Linux 7.6Red Hat Enterprise Linux 7.7 NAS接続、共有ディスク型
IBM POWER
NW Version
SAPカーネルバージョン
CLUSTERPROVersionOS
クラスタ構成
7.5
7457497534.0.0-1~
SUSE LINUX Etnerprise Server 11 SP4
NAS接続、共有ディスク型
7.52
753
4.1.0-1~
SUSE LINUX Etnerprise Server 11 SP4
NAS接続、共有ディスク型
以下の注意事項があります。
LAN ハートビートを使用する場合、LAN ハートビートリソースを使用してください。カーネルモード LAN ハートビートリソースは使用しないでください。
ユーザ空間モニタリソースを使用する場合、[監視方法]は softdog を指定してください。
シャットダウン監視を使用する場合、[監視方法]は softdog を指定してください。
ミラーディスク型クラスターには対応しておりません。
SAP NW のハードウェア要件およびソフトウェア要件は、SAP NW のドキュメントを参照してください。
4.2.13. 必要メモリ容量とディスクサイズ¶
必要メモリサイズ |
必要ディスクサイズ |
備考 |
||
---|---|---|---|---|
ユーザモード |
kernelモード |
インストール直後 |
運用時 |
|
200MB 2 |
同期モードの場合
1MB+(リクエストキュー数×I/Oサイズ)+(2MB+差分ビットマップサイズ)×(ミラーディスクリソース、ハイブリッドディスクリソース数)
非同期モードの場合
1MB +{リクエストキュー数}×{I/Oサイズ}
+[3MB
+({I/Oサイズ}×{非同期キュー数})
+({I/Oサイズ}÷ 4KB × 8バイト + 0.5KB)× ({履歴ファイルサイズ制限値}÷{I/Oサイズ}+{非同期キュー数})
+{差分ビットマップサイズ}
]×(ミラーディスクリソース、ハイブリッドディスクリソース数)
カーネルモード LAN ハートビートドライバの場合
8MB
キープアライブドライバの場合
8MB
|
300MB |
5.0GB |
- 2
オプション類を除く。
注釈
I/O サイズの目安は、以下の様になります。
Ubuntu16の場合、1MB
Ubuntu14、RHEL7の場合、124KB
RHEL6の場合、4KB
リクエストキュー数、非同期キュー数の設定値については『リファレンスガイド』の「グループリソースの詳細」の「ミラーディスクリソースを理解する」を参照してください。
ディスクハートビートリソースが使用するパーティションに必要なサイズは「共有ディスクについて」を参照してください。
クラスタパーティションに必要なサイズは「ミラー用のディスクについて」、「ハイブリッドディスクリソース用のディスクについて」を参照してください。
4.3. Cluster WebUI の動作環境¶
4.3.1. 動作確認済 OS、ブラウザ¶
現在の対応状況は下記の通りです。
ブラウザ |
言語 |
---|---|
Internet Explorer 11 |
日本語/英語/中国語 |
Internet Explorer 10 |
日本語/英語/中国語 |
Firefox |
日本語/英語/中国語 |
Google Chrome |
日本語/英語/中国語 |
注釈
IPアドレスで接続する場合、事前に該当のIPアドレスを [ローカル イントラネット] の [サイト] に登録する必要があります。
注釈
Internet Explorer 11 にて Cluster WebUI に接続すると、Internet Explorer が停止することがあります。本事象回避のために、Internet Explorer のアップデート (KB4052978 以降) を適用してください。なお、Windows 8.1/Windows Server 2012R2 に KB4052978 以降を適用するためには、事前に KB2919355 の適用が必要となります。詳細は Microsoft より展開されている情報をご確認ください。
注釈
タブレットやスマートフォンなどのモバイルデバイスには対応していません。
4.3.2. 必要メモリ容量/ディスク容量¶
必要メモリ容量 500MB 以上
必要ディスク容量 200MB 以上
5. 最新バージョン情報¶
本章では、CLUSTERPROの最新情報について説明します。新しいリリースで強化された点、改善された点などをご紹介します。
5.1. CLUSTERPRO とマニュアルの対応一覧¶
本書では下記のバージョンの CLUSTERPROを前提に説明してあります。CLUSTERPROのバージョンとマニュアルの版数に注意してください。
CLUSTERPROの
内部バージョン
|
マニュアル |
版数 |
備考 |
---|---|---|---|
4.2.2-1 |
スタートアップガイド |
第 5 版 |
|
インストール&設定ガイド |
第 3 版 |
||
リファレンスガイド |
第 4 版 |
||
メンテナンスガイド |
第 2 版 |
||
ハードウェア連携ガイド |
第 1 版 |
||
互換機能ガイド |
第 1 版 |
5.2. 機能強化¶
各バージョンにおいて以下の機能強化を実施しています。
項番 |
内部バージョン |
機能強化項目 |
---|---|---|
1 |
4.0.0-1 |
デザインを刷新した管理GUI (Cluster WebUI) を実装しました。 |
2 |
4.0.0-1 |
WebManager が HTTPS プロトコルに対応しました。 |
3 |
4.0.0-1 |
期限付きライセンスが利用可能になりました。 |
4 |
4.0.0-1 |
ミラーディスクリソース、ハイブリッドディスクリソースの最大数を拡大しました。 |
5 |
4.0.0-1 |
ボリュームマネージャリソース、ボリュームマネージャモニタリソースがZFS ストレージプールに対応しました。 |
6 |
4.0.0-1 |
対応 OS を拡充しました。 |
7 |
4.0.0-1 |
systemd に対応しました。 |
8 |
4.0.0-1 |
Oracle モニタリソースが Oracle Database 12c R2 に対応しました。 |
9 |
4.0.0-1 |
MySQL モニタリソースが MariaDB 10.2 に対応しました。 |
10 |
4.0.0-1 |
PostgreSQL モニタリソースが PowerGres on Linux 9.6 に対応しました。 |
11 |
4.0.0-1 |
SQL Server モニタリソースを追加しました。 |
12 |
4.0.0-1 |
ODBC モニタリソースを追加しました。 |
13 |
4.0.0-1 |
WebOTX モニタリソースが WebOTX V10.1 に対応しました。 |
14 |
4.0.0-1 |
JVM モニタリソースが Apache Tomcat 9.0 に対応しました。 |
15 |
4.0.0-1 |
JVM モニタリソースが WebOTX V10.1 に対応しました。 |
16 |
4.0.0-1 |
JVMモニタリソースで以下の監視が可能になりました。
|
17 |
4.0.0-1 |
AWS DNS リソース、AWS DNS モニタリソースを追加しました。 |
18 |
4.0.0-1 |
Azure DNS リソース、Azure DNS モニタリソースを追加しました。 |
19 |
4.0.0-1 |
モニタリソースにおけるエラー判定およびタイムアウト判定の精度を改善しました。 |
20 |
4.0.0-1 |
グループリソースの活性/非活性の前後で、任意のスクリプトを実行する機能を追加しました。 |
21 |
4.0.0-1 |
両系活性検出時に生存させるサーバグループを選択できるようにしました。 |
22 |
4.0.0-1 |
フェイルオーバ属性に[完全排他]が設定されているグループにて、排他の対象とする組み合わせを設定できるようになりました。 |
23 |
4.0.0-1 |
内部プロセス間通信で消費されるTCPポート量を削減しました。 |
24 |
4.0.0-1 |
ログ収集で収集する項目を強化しました。 |
25 |
4.0.0-1 |
ミラーディスクリソース、ハイブリッドディスクリソースの差分ビットマップサイズを設定できるようになりました。 |
26 |
4.0.1-1 |
新しくリリースされた kernel に対応しました。 |
27 |
4.0.1-1 |
WebManager において、設定不備により HTTPS を使用できない場合に、syslog およびアラートログへメッセージを出力するようにしました。 |
28 |
4.1.0-1 |
新しくリリースされた kernel に対応しました。 |
29 |
4.1.0-1 |
Red Hat Enterprise Linux 7.6 に対応しました。 |
30 |
4.1.0-1 |
SUSE Linux Enterprise Server 12 SP2 に対応しました。 |
31 |
4.1.0-1 |
Amazon Linux 2 に対応しました。 |
32 |
4.1.0-1 |
Oracle Linux 7.5 に対応しました。 |
33 |
4.1.0-1 |
Oracle モニタリソースが Oracle Database 18c に対応しました。 |
34 |
4.1.0-1 |
Oracle モニタリソースが Oracle Database 19c に対応しました。 |
35 |
4.1.0-1 |
PostgreSQL モニタリソースが PostgreSQL11 に対応しました。 |
36 |
4.1.0-1 |
PostgreSQL モニタリソースが PowerGres V11 に対応しました。 |
37 |
4.1.0-1 |
MySQL モニタリソースが MySQL8.0 に対応しました。 |
38 |
4.1.0-1 |
MySQL モニタリソースが MariaDB10.3 に対応しました。 |
39 |
4.1.0-1 |
以下のリソース / モニタリソースが Python3 に対応しました。
|
40 |
4.1.0-1 |
SAP NetWeaver 用 SAP 連携コネクタが以下の OS に対応しました。
|
41 |
4.1.0-1 |
SAP NetWeaver 用 SAP 連携コネクタが以下の SAP NetWeaver に対応しました。
|
42 |
4.1.0-1 |
SAP NetWeaver 用 SAP 連携コネクタ / サンプルスクリプトが以下に対応しました。
|
43 |
4.1.0-1 |
Samba モニタリソースが以下に対応しました。
|
44 |
4.1.0-1 |
Cluster WebUI でクラスタの構築、構成変更が可能になりました。 |
45 |
4.1.0-1 |
ミラーディスクリソース / ハイブリッドディスクリソースが RAW パーティションに対応しました |
46 |
4.1.0-1 |
ミラーの設定項目に 「ミラー復帰 I/O サイズ」 を追加し、ミラー復帰性能をチューニング可能になりました。 |
47 |
4.1.0-1 |
ハイブリッドディスクリソース (非同期モード) のサーバグループ内のフェイルオーバ処理時間を改善しました。 |
48 |
4.1.0-1 |
ハイブリッドディスクリソースのミラー復帰中にサーバグループ内のフェイルオーバが可能になりました。 |
49 |
4.1.0-1 |
ミラー非同期モードの未送信データのバッファリング機構を改善しました。 |
50 |
4.1.0-1 |
DB2 用 DB 静止点コマンドを追加しました。 |
51 |
4.1.0-1 |
PostgreSQL 用 DB 静止点コマンドを追加しました。 |
52 |
4.1.0-1 |
Sybase 用 DB 静止点コマンドを追加しました。 |
53 |
4.1.0-1 |
SQL Server 用 DB 静止点コマンドを追加しました。 |
54 |
4.1.0-1 |
MySQL 用 DB 静止点コマンドが MariaDB に対応しました。 |
55 |
4.1.0-1 |
Witness ハートビートリソースを追加しました。 |
56 |
4.1.0-1 |
HTTP ネットワークパーティション解決リソースを追加しました。 |
57 |
4.1.0-1 |
クラスタ構成の変更時、業務を停止せずに変更を反映可能な設定項目を拡充しました。 |
58 |
4.1.0-1 |
フェイルオーバグループの起動時に、フローティング IP アドレスの重複チェックを行う機能を追加しました。 |
59 |
4.1.0-1 |
遠隔クラスタ構成で、サーバグループ間のハートビートタイムアウトを検出しても、設定された時間だけ自動フェイルオーバを猶予する機能を追加しました。 |
60 |
4.1.0-1 |
EXEC リソースの開始 / 終了スクリプトで使用できる環境変数を拡充しました。 |
61 |
4.1.0-1 |
強制停止スクリプトの実行結果を判定し、フェイルオーバを抑制する機能を追加しました。 |
62 |
4.1.0-1 |
強制停止機能および筐体 ID 連携機能で実行する IPMI コマンドラインを編集できるようにしました。 |
63 |
4.1.0-1 |
プロセスリソースモニタリソースを追加し、システムモニタリソースのプロセスリソース監視機能を集約しました。 |
64 |
4.1.0-1 |
ミラー統計情報に新たな統計値を追加しました。 |
65 |
4.1.0-1 |
システムリソース統計情報採取機能を追加しました。 |
66 |
4.1.0-1 |
フェイルオーバグループ、グループリソース、モニタリソースの稼働状況をクラスタ統計情報として保存する機能を追加しました。 |
67 |
4.1.0-1 |
ログ収集のパターンに、ミラー統計情報とクラスタ統計情報を追加しました。 |
68 |
4.1.0-1 |
カスタムモニタリソースに、非同期スクリプトの監視開始を待ち合わせる機能を追加しました。 |
69 |
4.1.0-1 |
クラスタ停止の実行時、グループリソースの停止前にカスタムモニタリソースの停止完了を待ち合わせる設定を追加しました。 |
70 |
4.1.0-1 |
clpmonctrl コマンドに処理を要求する先のサーバを指定するためのオプションを追加しました。 |
71 |
4.1.0-1 |
WebManager サーバに対する HTTPS 接続において、SSL および TLS 1.0 を無効化しました。 |
72 |
4.1.0-1 |
共有ディスクデバイスが使用可能となるまでクラスタの起動を待ち合わせる機能を追加しました。 |
73 |
4.1.0-1 |
NX7700x シリーズ連携機能の障害検出時の回復動作処理を改善しました。 |
74 |
4.1.0-1 |
シャットダウン監視の既定値を 「常に実行する」 から 「グループ非活性処理に失敗した場合のみ実行する」 に変更しました。 |
75 |
4.1.1-1 |
Asianux Server 7 SP3 に対応しました。 |
76 |
4.1.1-1 |
Cluster WebUI の表示および操作を改善しました。 |
77 |
4.1.2-1 |
新しくリリースされた kernel に対応しました。 |
78 |
4.1.2-1 |
Cluster WebUI および HTTP モニタリソースが OpenSSL 1.1.1 に対応しました。 |
79 |
4.2.0-1 |
クラスタの操作および状態取得が可能なRESTful APIを追加しました。 |
80 |
4.2.0-1 |
Cluster WebUIやコマンドにおけるクラスタ情報の取得処理を改善しました。 |
81 |
4.2.0-1 |
クラスタ構成情報チェック機能を追加しました。 |
82 |
4.2.0-1 |
異常検出時の動作としてOSパニックを実行する際に、待機系サーバへ記録メッセージの内容を強化しました。 |
83 |
4.2.0-1 |
グループの自動起動やグループリソース活性・非活性異常時の復旧動作を無効化する機能を追加しました。 |
84 |
4.2.0-1 |
ライセンス管理コマンドにて、クラスタノード削除時における期限付きライセンスの再構成が可能となりました。 |
85 |
4.2.0-1 |
OSのユーザアカウントにより、Cluster WebUIにログインできるようになりました。 |
86 |
4.2.0-1 |
EXECリソースにおいて、現用系サーバでの開始・終了スクリプトの実行と連動して、待機系サーバでもスクリプトを実行できるようになりました。 |
87 |
4.2.0-1 |
業務を停止せずにクラスタノードの追加・削除が可能となりました。 |
88 |
4.2.0-1 |
グループの停止待ち合わせの設定条件を拡充しました。 |
89 |
4.2.0-1 |
Cluster WebUI でグループ起動停止予測時間を表示する機能を追加しました。 |
90 |
4.2.0-1 |
新しくリリースされた kernel に対応しました。 |
91 |
4.2.0-1 |
Red Hat Enterprise Linux 7.7 に対応しました。 |
92 |
4.2.0-1 |
SUSE LINUX Enterprise Server 15 に対応しました。 |
93 |
4.2.0-1 |
SUSE LINUX Enterprise Server 15 SP1 に対応しました。 |
94 |
4.2.0-1 |
SUSE LINUX Enterprise Server 12 SP4 に対応しました。 |
95 |
4.2.0-1 |
Oracle Linux 7.7 に対応しました。 |
96 |
4.2.0-1 |
Ubuntu 18.04.3 LTS に対応しました。 |
97 |
4.2.0-1 |
以下の機能でProxyサーバを利用できるようになりました。
|
98 |
4.2.0-1 |
Cluster WebUIやclpstatコマンドで、クラスタ停止状態、クラスタサスペンド状態における表示内容を改善しました。 |
99 |
4.2.0-1 |
ログ収集のパターンに、システム統計情報を追加しました。 |
100 |
4.2.0-1 |
グループ起動停止予測時間およびモニタリソースの監視所用時間を表示するコマンドを追加しました。 |
101 |
4.2.0-1 |
システムリソース統計情報の出力先を変更しました。 |
102 |
4.2.0-1 |
システムリソース統計情報の採取情報を拡充しました。 |
103 |
4.2.0-1 |
HTTPモニタリソースが、BASIC認証に対応しました。 |
104 |
4.2.0-1 |
AWS AZ監視リソースのステータスを、アベイラビリティゾーンの状態が information または impaired の場合、異常から警告に変更しました。 |
105 |
4.2.0-1 |
Google Cloud 仮想IPリソース、Google Cloud 仮想IPモニタリソースを追加しました。 |
106 |
4.2.0-1 |
Oracle Cloud 仮想IPリソース、Oracle Cloud 仮想IPモニタリソースを追加しました。 |
107 |
4.2.0-1 |
以下のモニタリソースについて、[AWS CLI コマンド応答取得失敗時動作] の既定値を「回復動作を実行しない(警告を表示する)」から「回復動作を実行しない(警告を表示しない)」に変更しました。
|
108 |
4.2.0-1 |
DB2モニタリソースがDB2 v11.5に対応しました。 |
109 |
4.2.0-1 |
MySQLモニタリソースがMariaDB 10.4に対応しました。 |
110 |
4.2.0-1 |
SQL ServerモニタリソースがSQL Server 2019に対応しました。 |
111 |
4.2.0-1 |
ミラーディスクリソースのデータパーティションサイズを無停止で拡張する機能を追加しました。 |
112 |
4.2.0-1 |
ディスクモニタリソースのタイムアウト発生時におけるアラートログの出力情報を改善しました。 |
113 |
4.2.2-1 |
新しくリリースされた kernel に対応しました。 |
114 |
4.2.2-1 |
Red Hat Enterprise Linux 7.8 に対応しました。 |
115 |
4.2.2-1 |
Red Hat Enterprise Linux 8.1 に対応しました。 |
116 |
4.2.2-1 |
MIRACLE LINUX 8 Asianux Inside に対応しました。 |
117 |
4.2.2-1 |
RESTful APIで取得可能なリソースステータス情報を拡充しました。 |
118 |
4.2.2-1 |
PostgreSQLモニタリソースがPostgreSQL12に対応しました。 |
5.3. 修正情報¶
各バージョンにおいて以下の修正を実施しています。
項番 |
修正バージョン
/ 発生バージョン
|
修正項目 |
致命度 |
発生条件
発生頻度
|
原因 |
---|---|---|---|---|---|
1 |
4.0.1-1
/ 4.0.0-1
|
同一製品の期限付きライセンスが2つ有効化されることがある。 |
小 |
ライセンス期限切れの際にストックされた未使用のライセンスを自動的に有効化する処理と、ライセンス登録コマンドによる新規ライセンスの登録操作が同時に行われた場合に、稀に発生する。 |
ライセンス情報を操作する際の排他処理に不備があったため。 |
2 |
4.0.1-1
/ 4.0.0-1
|
clpgrpコマンドによるグループの起動が失敗する。 |
小 |
排他ルールが設定された構成で、起動対象のグループ名を指定せずにclpgrpコマンドを実行した場合に発生する。 |
グループ名が省略された場合の処理に不備があったため。 |
3 |
4.0.1-1
/ 4.0.0-1
|
CPUライセンスとVMノードライセンスが混在する構成で、CPUライセンスの不足を示す警告メッセージが出力される。 |
小 |
CPUライセンスとVMノードライセンスが混在する場合に発生する。 |
ライセンスのカウント処理に不備があったため。 |
4 |
4.0.1-1
/ 4.0.0-1
|
Azure DNS モニタリソースにおいて、Azure 上のDNSサーバーが正常に稼働していても異常となる場合がある。 |
小 |
以下の条件をすべて満たす場合、必ず発生する。
・[名前解決確認をする] がオンの場合
・Azure CLI のバージョンが 2.0.30 ~ 2.0.32 の場合(2.0.29 以下、2.0.33 以上だと発生しない)
|
該当バージョンのAzure CLI により取得する DNSサーバー一覧にタブ文字が含まれることにより、Azure CLI の出力結果の解析処理に失敗するため。 |
5 |
4.0.1-1
/ 4.0.0-1
|
Azure DNS モニタリソースにおいて、Azure 上のDNSサーバーの一部が正常に稼働している場合でも異常となる場合がある。 |
小 |
以下の条件をすべて満たす場合、必ず発生する。
・[名前解決確認をする] がオンの場合
・Azure CLI により取得したDNSサーバー一覧で最初に表示されるDNSサーバーが正常に稼働していない場合(2番目以降のDNSサーバーは正常に稼働)
|
DNSサーバーに対する健全性確認処理に不備があったため。 |
6 |
4.0.1-1
/ 4.0.0-1
|
Azure DNS モニタリソースにおいて、Azure 上のDNSサーバー一覧の取得に失敗した場合でも異常とならない。 |
小 |
以下の条件をすべて満たす場合、必ず発生する。
・[名前解決確認をする] がオンの場合
・Azure CLI によるDNSサーバー一覧の取得に失敗した場合
|
正常、異常の判定処理に不備があったため。 |
7 |
4.0.1-1
/ 4.0.0-1
|
JVM モニタリソース利用時、監視対象Java VM でメモリリークが発生することがある。 |
中 |
以下の条件の場合に発生することがある。
・[監視(固有)]タブ-[調整]プロパティ-[スレッド]タブ-[動作中のスレッド数を監視する]がオンの場合
|
使用しているJava APIの延長でScavenge GC で解放されないクラスが蓄積されることがあるため。 |
8 |
4.0.1-1
/ 4.0.0-1
|
JVMモニタリソースのJavaプロセスにおいて、メモリリークが発生することがある。 |
中 |
以下の条件をすべて満たす場合、発生することがある。
・[監視(固有)]タブ-[調整]プロパティ内の設定をすべてオフにした場合
・JVM モニタリソースを複数作成した場合
|
監視対象Java VMへの接続切断処理に不備があったため。 |
9 |
4.0.1-1
/ 4.0.0-1
|
JVM モニタリソースにおいて、以下のパラメータをオフにしてもJVM統計ログ(jramemory.stat)が出力される。
・[監視(固有)]タブ-[調整]プロパティ-[メモリ]タブ-[ヒープ使用量を監視する]
・[監視(固有)]タブ-[調整]プロパティ-[メモリ]タブ-[非ヒープ使用量を監視する]
|
小 |
以下の条件をすべて満たす場合、必ず発生する。
・[監視(固有)]タブ-[JVM 種別]が[Oracle Java(usage monitoring)]の場合
・[監視(固有)]タブ-[調整]プロパティ-[メモリ]タブ-[ヒープ使用量を監視する]がオフの場合
・[監視(固有)]タブ-[調整]プロパティ-[メモリ]タブ-[非ヒープ使用量を監視する]がオフの場合
|
JVM統計ログの出力判断処理に不備があったため。 |
10 |
4.1.0-1
/ 4.0.0-1
|
SAP NetWeaver 用サンプルスクリプトを利用したカスタムモニタリソースの障害検出時において、SAP サービスの停止処理中に SAP サービスの開始処理が行われる。 |
小 |
SAP サービスの停止処理に時間が掛かる場合に発生する。 |
SAP サービス停止用スクリプトにおいて、SAP サービスの停止完了を待ち合わせていないため。 |
11 |
4.1.0-1
/ 4.0.0-1
|
AWS で使用するタグの内容にASCII 文字以外が含まれる場合、AWS 仮想 IP リソースの活性に失敗する。 |
小 |
AWS で使用するタグの内容に ASCII 文字以外が含まれる場合、必ず発生する。 |
AWS で使用するタグに ASCII文字以外が含まれる場合に対する考慮漏れ。 |
12 |
4.1.0-1
/ 4.0.0-1
|
CLUSTERPRO の言語設定に「英語」以外が選択された場合、SAP NetWeaver 用 SAP連携コネクタが正常に動作しない。 |
小 |
「英語」 以外が選択された場合、必ず発生する。 |
クラスタの状態確認処理に不備があったため。 |
13 |
4.1.0-1
/ 4.0.0-1
|
SQLServer モニタにおいて、DB のキャッシュに SQL 文が残り、性能に問題が出る可能性がある。 |
小 |
監視レベル 2 の場合に発生する。 |
監視の度に毎回異なる updateの SQL を発行していたため。 |
14 |
4.1.0-1
/ 4.0.0-1
|
SQLServer モニタで、監視ユーザ名を不正にした場合などの警告になるべきケースが、監視異常になる。 |
小 |
監視パラメータの設定不備がある場合に発生する。 |
監視パラメータの設定不備に対する考慮漏れがあったため。 |
15 |
4.1.0-1
/ 4.0.0-1
|
ODBC 監視で、監視ユーザ名を不正にした場合などの警告になるべきケースが、監視異常になる。 |
小 |
監視パラメータの設定不備がある場合に発生する。 |
監視パラメータの設定不備に対する考慮漏れあったため。 |
16 |
4.1.0-1
/ 4.0.0-1
|
Database Agent で監視異常時の回復動作が 30 秒遅れて実行される。 |
小 |
回復動作実行時に必ず発生する。 |
回復動作実行時の処理に不備があったため。 |
17 |
4.1.0-1
/ 4.0.0-1
|
Database Agent で、clptoratio コマンドによるタイムアウト倍率の設定が効かない。 |
小 |
必ず発生する。 |
タイムアウト倍率値の取得処理に不備があったため。 |
18 |
4.1.0-1
/ 4.0.0-1
|
クラスタサスペンドがタイムアウトすることがある。 |
中 |
クラスタリジューム処理中にクラスタサスペンド操作を実行した場合に、稀に発生する。 |
クラスタサスペンド・リジューム操作が競合した場合の処理に不備があったため。 |
19
|
4.1.0-1
/ 4.0.0-1
|
手動起動に設定されたフェイルオーバグループのフェイルオーバ時に、フェイルオーバ元で起動されていなかったグループリソースが、フェイルオーバ先で起動されることがある。
|
小
|
下記の状態遷移により発生する。
|
グループリソースの状態を保持する情報の初期化に不備があったため。 |
20 |
4.1.0-1
/ 4.0.0-1
|
clpstat コマンドで、クラスタ停止処理中のステータスが適切に表示されない。 |
小 |
クラスタ停止実行直後からクラスタ停止完了までの間で clpstat コマンドを実行した場合に発生する。 |
クラスタ停止処理中のステータス判定処理に不備があったため。 |
21 |
4.1.0-1
/ 4.0.0-1
|
停止処理の完了していないグループリソースのステータスが停止状態となる場合がある。
|
中
|
停止処理が失敗した状態のグループリソースに対し、下記の操作を行うと発生する場合がある。
|
異常状態のグループリソースに対する起動・停止操作によるステータス変更処理に不備があったため。 |
22 |
4.1.0-1
/ 4.0.0-1
|
シャットダウン監視によるサーバリセットよりも前にフェイルオーバが開始されることがある。 |
大 |
システム高負荷により、シャットダウン監視の動作が遅延した場合に、稀に発生する。 |
ハートビートを停止するタイミングに考慮漏れがあったため。 |
23 |
4.1.0-1
/ 4.0.0-1
|
強制停止機能の設定変更時に、適切な反映方法 (クラスタのサスペンド / リジューム) が実行されない場合がある。 |
小 |
仮想マシン強制停止設定の初回反映時に発生する。 |
仮想マシン強制停止設定が追加された場合の反映方法を判定するための定義情報に誤りがあったため。 |
24 |
4.1.0-1
/ 4.0.0-1
|
クラスタプロパティの 「ログの通信方法」 の設定変更が反映されないことがある。 |
小 |
クラスタの初回構築時に、「ログの通信方法」 を「UNIXドメイン」 以外へ変更した場合に発生する。 |
設定変更時の反映方法の判定処理に不備があったため。 |
25 |
4.1.0-1
/ 4.0.0-1
|
exec リソース、カスタムモニタリソースのスクリプトログにて下記の問題が発生する。
・非同期スクリプトのログ出力時刻がすべてプロセス終了時刻になる。
・ログの一時保存ファイルが残存することがある。
|
小 |
スクリプトのログローテート機能が有効である場合に発生する。 |
ログ出力処理に不備があったため。 |
26 |
4.1.0-1
/ 4.0.0-1
|
ミラーディスクリソースおよびハイブリッドディスクリソースの作成時に 「初期ミラー構築を行わない」 を指定すると最初のミラー復帰が必ずフルコピーになる。 |
小 |
「初期ミラー構築を行わない」 を指定すると必ず発生する。 |
「初期ミラー構築を行わない」 を指定した場合の処理に不備があったため。 |
27 |
4.1.0-1
/ 4.0.0-1
|
ミラーディスク / ハイブリッドディスクの起動 / 停止 / 監視処理に遅延が発生する。 |
小 |
ミラーディスクリソース / ハイブリッドディスクリソース数の合計がおよそ16個以上の場合に発生する。 |
内部に不適切な待ち合わせ処理があったため。 |
28 |
4.1.0-1
/ 4.0.0-1
|
ディスクモニタリソースにおいて、タイムアウトを検出しても異常とならず警告となる。 |
中 |
ディスクモニタリソースでタイムアウトを検出した場合に発生することがある。 |
タイムアウト検出時の判定処理に不備があったため。 |
29 |
4.1.1-1
/ 4.1.0-1
|
Cluster WebUI の設定モードへの切替に失敗する。 |
小 |
特定のブラウザから HTTPS で Cluster WebUI に接続すると発生する。 |
特定ブラウザからのデータ送信パターンに対応できていない箇所があったため。 |
30 |
4.1.1-1
/ 4.1.0-1
|
ミラーディスクリソースまたはハイブリッドディスクリソースにて非同期モードを使用している場合、現用系サーバダウンおよび差分コピーが実行されると現用系と待機系のデータに不整合が発生する。 |
大 |
現用系サーバダウンおよび差分コピーが実行されると発生することがある。 |
差分コピーの対象となる領域を確定する処理に、不備があったため。 |
31 |
4.1.1-1
/ 4.1.0-1
|
LVMの論理ボリュームをミラーディスクリソースまたはハイブリッドディスクリソースのデータパーティションに指定した場合、初期ミラー構築およびミラー復帰が完了しない。 |
大 |
LVMの論理ボリュームをデータパーティションに指定すると発生する。 |
初期ミラー構築およびミラー復帰処理において、LVMの論理ボリュームに対する処理に考慮漏れがあったため。 |
32 |
4.1.2-1
/ 4.1.0-1
|
ネットワーク警告灯の設定時に、以下の項目の設定値が構成情報に保存されない。
- ネットワーク警告灯を使用する
- サーバ起動時に音声ファイルの再生を行う
- 音声ファイル番号
- サーバ停止時に音声ファイルの再生を行う
- 音声ファイル番号
|
小 |
ネットワーク警告灯を設定する場合に必ず発生する。 |
ネットワーク警告灯の設定値の保存処理に漏れがあったため。 |
33 |
4.2.2-1
/ 4.0.0-1~4.2.0-1
|
ミラー再構築中に残り時間が正しく表示されない場合がある。 |
小 |
ミラー再構築中の残り時間が1時間以上の場合に発生する。 |
ミラー再構築中の残り時間の表示処理に不備があったため。 |
34 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
ミラー復帰中に、ミラーディスクモニタリソース/ハイブリッドディスクモニタリソースのステータスが警告にならないことがある。 |
小 |
ミラーディスクモニタリソース/ハイブリッドディスクモニタリソースのステータスが異常の状態からミラー復帰を開始した場合に発生する。 |
監視リソースのステータス表示改善に伴う修正の際に、ミラー復帰に対する考慮が漏れていたため。 |
35 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
clpstatコマンドにて以下の不正なエラーメッセージが表示されることがある。
Could not connect to the server.
Internal error.Check if memory or OS resources are sufficient.
|
小 |
クラスタ起動直後にclpstatコマンドを実行した場合に、稀に発生する。 |
エラー処理に不備があったため。 |
36 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
構成情報の反映時に不要な操作(WebManagerサーバ再起動)が表示されることがある。 |
小 |
反映方法に「クラスタシャットダウン・再起動」が必要な設定変更と、「WebManagerサーバ再起動」が必要な設定変更を同時に行った場合に発生する。 |
反映方法の判定処理に不備があったため。 |
37 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
グループおよびグループリソースのカレントサーバ情報に不整合が生じることがある。 |
中 |
手動フェイルオーバを設定している場合、インタコネクトの断線復帰後に稀に発生する。 |
インタコネクト復帰時のカレントサーバ情報更新処理に不備があったため。 |
38 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
構成情報の反映時に不要な操作(サスペンド/リジューム)が要求されることがある。 |
小 |
自動登録されたモニタリソースのプロパティを参照した場合に発生することがある。 |
当該の内部処理に不備があったため。 |
39 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
マルチターゲットモニタリソースにて、異常しきい値および警告しきい値の設定通りに動作しないことがある。 |
小 |
|
設定値の取得処理に不備があったため。 |
40 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
ダイナミックDNSリソースの活性に失敗することがある。 |
中 |
リソース名とホスト名の合計が124バイト以上の場合に稀に発生する。 |
文字列を格納するバッファのサイズが不十分であったため。 |
41 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
Cluster WebUIで、ミラーディスクアクションが正常に動作しないことがある。 |
小 |
ミラーエージェントポート番号を変更した場合に発生する。 |
ミラーエージェントポート番号を変更し際に必要な反映方法に誤りがあったため。 |
42 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
clpstat コマンドで不正な項目名が表示されることがある。
|
小 |
ディスクハートビートリソースが存在する環境で clpstat --hb --detail を実行した場合に発生する。 |
表示する項目名に誤りがあったため。 |
43 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
rpcbind サービスが意図せず起動することがある。 |
小 |
ログ収集時に発生することがある。 |
ログ収集時に実行するrpcinfoコマンドにより rpcbindサービスが起動されるため。 |
44 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
clusterpro_evtサービスがnfsより先に起動することがある。 |
小 |
init.d環境において発生する。 |
起動スクリプトの記載内容に誤りがあったため。 |
45 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
CLUSTERPRO Web Alertサービスが異常終了することがある。 |
小 |
特定の条件によらず、ごく稀に発生することがある。 |
変数の初期化漏れがあったため。 |
46 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
仮想マシン強制停止機能のタイムアウト設定が機能しないことがある。 |
中 |
仮想マシン強制停止機能を使用し、強制停止処理に時間を要する場合に発生する。 |
完了待ち合わせ処理に不備があったため。 |
47 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
クラスタ再起動時、グループが起動しないことがある。 |
中 |
クラスタ再起動時、現用系のグループ停止処理中に、待機系サーバが先行して再起動した場合に稀に発生することがある。 |
サーバ間でグループ停止の待ち合わせ処理が失敗した場合における処理の考慮漏れがあったため。 |
48 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
サーバの停止処理に時間がかかることがある。 |
小 |
クラスタ停止時にごく稀に発生することがある。 |
クラスタ停止処理のタイミングがサーバ間でずれた場合のおける処理の考慮漏れがあったため。 |
49 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
グループ、リソースの非活性に失敗した場合でも非活性成功のアラートが出力されることがある。 |
小 |
緊急シャットダウン時に発生することがある。 |
緊急シャットダウン時にグループ、リソースの非活性結果に関係なく成功のアラートを出力していたため。 |
50 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
サーバダウン検出時にグループがフェイルオーバしないことがある。 |
中 |
サーバ起動時の内部情報の同期処理中にサーバダウンを検出した場合に発生することがある。 |
サーバステータスの更新処理に不備があったため。 |
51 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
PIDモニタリソースで、監視対象のプロセスが消滅した場合に異常検出できない場合がある。 |
小 |
監視インターバルの間に、消滅したプロセスと同じプロセスIDで新規にプロセスが起動された場合。 |
PIDモニタリソースではプロセスIDをキーにしてチェックを行っているため。 |
52 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
プロセスリソースモニタリソースの[オープンファイル数の監視(カーネル上限値)]で、設定値通りに異常検出が行われない。 |
小 |
[オープンファイル数の監視(カーネル上限値)]をオンにした場合、必ず発生する。 |
チェックに使用しているカーネル上限値が不適切なため。 |
53 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
EXECリソースが、停止時に他のプロセスを強制終了させてしまうことがある。 |
中 |
EXECリソースで以下の条件をすべて満たす場合に発生する。
|
EXECリソースではプロセスIDをキーにしてチェックを行っているため。 |
54 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
ミラーディスクリソースおよびハイブリッドディスクリソースで、活性側サーバのミラーディスク状態が異常になる。 |
大 |
以下の遷移が実行されると発生する。
|
左記の遷移発生時におけるミラーディスク状態確定処理に考慮漏れがあったため。 |
55 |
4.2.0-1
/ 4.0.0-1~4.1.2-1
|
ボリュームマネージャーモニタリソースの監視対象がLVMミラーである場合に、LVMミラーの縮退状態が監視異常となる。
|
小 |
LVMミラーが縮退状態になると発生する。 |
LVMミラー縮退状態に対する考慮漏れがあったため。 |
56 |
4.2.2-1
/ 4.1.0-1~4.2.0-1
|
ミラー通信専用インタコネクトのIPアドレスを変更できない。 |
小 |
クラスタ構築時、優先順位が低いサーバを優先順位が高いサーバより先に追加した場合に発生する。 |
当該箇所の内部処理に不備があったため。 |
57 |
4.2.2-1
/ 4.2.0-1
|
クラスタ構成情報チェック機能で、ポート番号の特定範囲の確認が正しく行われない。 |
小 |
チェック対象のポート番号が下記の範囲である場合に発生する。
エフェメラルポート最大値 < 対象ポート番号 <= ポート番号最大値(65535)
|
条件判定に不備があったため。 |
58 |
4.2.2-1
/ 4.2.0-1
|
クラスタ構成情報チェック機能で、AWSCLIコマンドのチェックが失敗する。 |
小 |
以下のグループリソースが設定された環境でクラスタ構成情報チェックを実行した場合に発生する。
・AWS Elastic IPリソース
・AWS 仮想IPリソース
・AWS DNS リソース
|
AWSCLIコマンドの実行に必要な環境変数の設定が不足していたため。 |
59 |
4.2.2-1
/ 4.2.0-1
|
クラスタ起動後にクラスタ構成情報チェックを実行すると、フローティングIPリソースおよび仮想IPリソースのチェックが失敗する。 |
小 |
フローティングIPリソースおよび仮想IPリソースを起動した状態で、クラスタ構成情報チェックを実行した場合に発生する。 |
フローティングIPリソースおよび仮想IPリソースの起動状態に対する考慮漏れのため。 |
60 |
4.2.2-1
/ 4.1.0-1~4.2.0-1
|
Oracle Clusterware 同期管理モニタリソースが起動しない。 |
小 |
Oracle Clusterware 同期管理モニタリソースの設定時、回復動作を既定値から変更していない場合に発生する。 |
Oracle Clusterware 同期管理モニタリソースの回復動作の既定値が不適切であったため。 |
61 |
4.2.2-1
/ 4.0.0-1
|
Cluster WebUI の細かな不具合を修正しました。 |
小 |
Cluster WebUI 使用時に発生する。 |
Cluster WebUI の内部処理に不備があったため。 |
6. 注意制限事項¶
本章では、注意事項や既知の問題とその回避策について説明します。
本章で説明する項目は以下の通りです。
6.1. システム構成検討時¶
HW の手配、オプション製品ライセンスの手配、システム構成、共有ディスクの構成時に留意すべき事項について説明します。
6.1.1. 機能一覧と必要なライセンス¶
下記オプション製品はサーバ台数分必要となります。
ライセンスが登録されていないリソース・モニタリソースはCluster WebUIの一覧に表示されません。
使用したい機能 |
必要なライセンス |
---|---|
ミラーディスクリソース |
CLUSTERPRO X Replicator 4.2 3 |
ハイブリッドディスクリソース |
CLUSTERPRO X Replicator DR 4.2 4 |
Oracle モニタリソース |
CLUSTERPRO X Database Agent 4.2 |
DB2 モニタリソース |
CLUSTERPRO X Database Agent 4.2 |
PostgreSQL モニタリソース |
CLUSTERPRO X Database Agent 4.2 |
MySQL モニタリソース |
CLUSTERPRO X Database Agent 4.2 |
Sybase モニタリソース |
CLUSTERPRO X Database Agent 4.2 |
SQL Server モニタリソース |
CLUSTERPRO X Database Agent 4.2 |
ODBC モニタリソース |
CLUSTERPRO X Database Agent 4.2 |
Samba モニタリソース |
CLUSTERPRO X File Server Agent 4.2 |
NFS モニタリソース |
CLUSTERPRO X File Server Agent 4.2 |
HTTP モニタリソース |
CLUSTERPRO X Internet Server Agent 4.2 |
SMTP モニタリソース |
CLUSTERPRO X Internet Server Agent 4.2 |
POP3 モニタリソース |
CLUSTERPRO X Internet Server Agent 4.2 |
IMAP4 モニタリソース |
CLUSTERPRO X Internet Server Agent 4.2 |
FTP モニタリソース |
CLUSTERPRO X Internet Server Agent 4.2 |
Tuxedo モニタリソース |
CLUSTERPRO X Application Server Agent 4.2 |
Weblogic モニタリソース |
CLUSTERPRO X Application Server Agent 4.2 |
Websphere モニタリソース |
CLUSTERPRO X Application Server Agent 4.2 |
WebOTX モニタリソース |
CLUSTERPRO X Application Server Agent 4.2 |
JVM モニタリソース |
CLUSTERPRO X Java Resource Agent 4.2 |
システムモニタリソース |
CLUSTERPRO X System Resource Agent 4.2 |
プロセスリソースモニタリソース |
CLUSTERPRO X System Resource Agent 4.2 |
メール通報機能 |
CLUSTERPRO X Alert Service 4.2 |
ネットワーク警告灯 |
CLUSTERPRO X Alert Service 4.2 |
ライセンスが登録されていない機能・モニタリソースはCluster WebUI の一覧に表示されません。
使用したい機能 |
必要なライセンス |
---|---|
Oracle Clusterware 連携機能 |
CLUSTERPRO X High-End Server Option 4.2 |
Oracle Clusterware 同期管理モニタリソース |
CLUSTERPRO X High-End Server Option 4.2 |
BMC モニタリソース |
CLUSTERPRO X High-End Server Option 4.2 |
I/O Fencing 機能 |
CLUSTERPRO X High-End Server Option 4.2 |
6.1.2. ミラーディスクの要件について¶
Linux の md によるストライプセット、ボリュームセット、ミラーリング、パリティ付ストライプセットを、ミラーディスクリソースのクラスタパーティションやデータパーティションに使用することはできません。
- Linux の LVM によるボリュームをクラスタパーティションやデータパーティションに使用することは可能です。ただし、SuSEでは、LVM や MultiPath によるボリュームをデータパーティションに使用することはできません。(SuSEでは、それらのボリュームに対する ReadOnly,ReadWrite の制御を CLUSTERPRO が行うことができないため。)
ミラーディスクリソースを、Linux の md や LVM によるストライプセット、ボリュームセット、ミラーリング、パリティ付ストライプセットの対象とすることはできません。
ミラーディスクリソースを使用するにはミラー用のパーティション (データパーティションとクラスタパーティション) が必要です。
ミラー用のパーティションの確保の方法は以下の 2 つがあります。
OS (root パーティションや swap パーティション) と同じディスク上にミラー用のパーティション (クラスタパーティションとデータパーティション) を確保する
OS とは別のディスク (またはLUN) を用意 (追加) してミラー用のパーティションを確保する
以下を参考に上記を選定してください。
- 障害時の保守性、性能を重視する場合- OS とは別にミラー用のディスクを用意することを推奨します。
- H/W Raid の仕様の制限で LUN の追加ができない場合H/W Raid のプリインストールモデルで LUN 構成変更が困難な場合- OS と同じディスクにミラー用のパーティションを確保します。
- ミラーディスクリソースを複数使用する場合には、さらにミラーディスクリソース毎に個別のディスクを用意(追加) することを推奨します。同一のディスク上に複数のミラーディスクリソースを確保すると性能の低下やミラー復帰に時間がかかることがあります。これらの現象は Linux OS のディスクアクセスの性能に起因するものです。
ミラー用のディスクとして使用するにはディスクをサーバ間で同じにする必要があります。
ディスクのインターフェイス
両サーバのミラーディスクまたは、ミラー用のパーティションを確保するディスクは、ディスクのインターフェイスを同じにしてください。
例)
組み合わせ
サーバ1
サーバ2
OK
SCSI
SCSI
OK
IDE
IDE
NG
IDE
SCSI
ディスクのタイプ
両サーバのミラーディスクまたは、ミラー用のパーティションを確保するディスクは、ディスクのタイプを同じにしてください。
例)
組み合わせ
サーバ1
サーバ2
OK
HDD
HDD
OK
SSD
SSD
NG
HDD
SSD
ディスクのセクタサイズ
両サーバのミラーディスクまたは、ミラー用のパーティションを確保するディスクは、ディスクの論理セクタサイズを同じにしてください。
例)
組み合わせ
サーバ1
サーバ2
OK
論理セクタ512B
論理セクタ512B
OK
論理セクタ4KB
論理セクタ4KB
NG
論理セクタ512B
論理セクタ4KB
ミラー用のディスクとして使用するディスクのジオメトリがサーバ間で異なる場合の注意
fdisk コマンドなどで確保したパーティションサイズはシリンダあたりのブロック (ユニット) 数でアラインされます。
データパーティションのサイズと初期ミラー構築の方向の関係が以下になるようにデータパーティションを確保してください。
コピー元のサーバ ≦ コピー先のサーバ
コピー元のサーバとは、ミラーディスクリソースが所属するフェイルオーバグループのフェイルオーバポリシーが高いサーバを指します。コピー先のサーバとは、ミラーディスクリソースが所属するフェイルオーバグループのフェイルオーバポリシーが低いサーバを指します。
また、データパーティションのサイズは、コピー元側とコピー先側とで 32GiB, 64GiB, 96GiB, … (32GiBの倍数) を跨がないように注意してください。32GiBの倍数を跨ぐサイズの場合、初期ミラー構築に失敗することがあります。データパーティションは同程度のサイズで確保するようにしてください。
例)
組み合わせ
データパーティションのサイズ
説明
サーバ1側
サーバ2側
OK
30GiB
31GiB
両方とも0~32GiB未満の範囲内にあるのでOK
OK
50GiB
60GiB
両方とも32GiB以上~64GiB未満の範囲内にあるのでOK
NG
30GiB
39GiB
32GiBを跨いでいるのでNG
NG
60GiB
70GiB
64GiBを跨いでいるのでNG
6.1.4. ハイブリッドディスクとして使用するディスクの要件について¶
Linux の md によるストライプセット、ボリュームセット、ミラーリング、パリティ付ストライプセットを、ハイブリッドディスクリソースのクラスタパーティションやデータパーティションに使用することはできません。
- Linux の LVM によるボリュームをクラスタパーティションやデータパーティションに使用することは可能です。ただし、SuSEでは、LVM や MultiPath によるボリュームをデータパーティションに使用することはできません。(SuSEでは、それらのボリュームに対する ReadOnly,ReadWrite の制御を CLUSTERPRO が行うことができないため。)
ハイブリッドディスクリソースを、Linux の md や LVM によるストライプセット、ボリュームセット、ミラーリング、パリティ付ストライプセットの対象とすることはできません。
ハイブリッドディスクリソースを使用するにはハイブリッドディスク用のパーティション (データパーティションとクラスタパーティション) が必要です。
さらにハイブリッドディスク用のディスクを共有ディスク装置で確保する場合には、共有ディスク装置を共有するサーバ間のディスクハートビートリソース用のパーティションが必要です。
ハイブリッドディスク用のディスクを共有ディスク装置でないディスクから確保する場合、パーティションの確保の方法は以下の 2 つがあります。
OS (rootパーティションやswapパーティション) と同じディスク上にハイブリッドディスク用のパーティション (クラスタパーティションとデータパーティション) を確保する
OS とは別のディスク (またはLUN) を用意 (追加) してハイブリッドディスク用のパーティションを確保する
以下を参考に上記を選定してください。
- 障害時の保守性、性能を重視する場合- OS とは別にハイブリッドディスク用のディスクを用意することを推奨します。
- H/W Raid の仕様の制限で LUN の追加ができない場合H/W Raid のプリインストールモデルで LUN 構成変更が困難な場合- OS と同じディスクにハイブリッドディスク用のパーティションを確保します。
- ハイブリッドディスクリソースを複数使用する場合には、さらにハイブリッドディスクリソース毎に個別の LUN を用意 (追加) することを推奨します。同一のディスク上に複数のハイブリッドディスクリソースを確保すると性能の低下やミラー復帰に時間がかかることがあります。これらの現象は Linux OS のディスクアクセスの性能に起因するものです。
ハイブリッドディスクリソースを確保する装置
必要なパーティション
共有ディスク装置
共有型でないディスク装置
データパーティション
必要
必要
クラスタパーティション
必要
必要
ディスクハートビート用パーティション
必要
不要
OSと同じディスク(LUN)上での確保
-
可能
ハイブリッドディスク用のディスクとして使用するディスクのタイプやジオメトリがサーバ間で異なる場合の注意
データパーティションのサイズと初期ミラー構築の方向の関係が以下になるようにデータパーティションを確保してください。
コピー元のサーバ ≦ コピー先のサーバ
コピー元のサーバとは、ハイブリッドディスクリソースが所属するフェイルオーバグループのフェイルオーバポリシーが高いサーバを指します。コピー先のサーバとは、ハイブリッドディスクリソースが所属するフェイルオーバグループのフェイルオーバポリシーが低いサーバを指します。
また、データパーティションのサイズは、コピー元側とコピー先側とで 32GiB, 64GiB, 96GiB, … (32GiBの倍数) を跨がないように注意してください。32GiBの倍数を跨ぐサイズの場合、初期ミラー構築に失敗することがあります。データパーティションは同程度のサイズで確保するようにしてください。
例)
組み合わせ
データパーティションのサイズ
説明
サーバ1側
サーバ2側
OK
30GiB
31GiB
両方とも0~32GiB未満の範囲内にあるのでOK
OK
50GiB
60GiB
両方とも32GiB以上~64GiB未満の範囲内にあるのでOK
NG
30GiB
39GiB
32GiBを跨いでいるのでNG
NG
60GiB
70GiB
64GiBを跨いでいるのでNG
6.1.5. IPv6 環境について¶
下記の機能はIPv6環境では使用できません。
BMCハートビートリソース
AWS Elastic IP リソース
AWS 仮想 IP リソース
AWS DNS リソース
Azure プローブポートリソース
Azure DNS リソース
Google Cloud 仮想 IP リソース
Oracle Cloud 仮想 IP リソース
AWS Elastic IP モニタリソース
AWS 仮想 IP モニタリソース
AWS AZ モニタリソース
AWS DNS モニタリソース
Azure プローブポートモニタリソース
Azure ロードバランスモニタリソース
Azure DNS モニタリソース
Google Cloud 仮想 IP モニタリソース
Google Cloud ロードバランスモニタリソース
Oracle Cloud 仮想 IP モニタリソース
Oracle Cloud ロードバランスモニタリソース
下記の機能はリンクローカルアドレスを使用できません。
LAN ハートビートリソース
カーネルモード LAN ハートビートリソース
ミラーディスクコネクト
PING ネットワークパーティション解決リソース
FIP リソース
VIP リソース
6.1.7. モニタリソース回復動作の「最終動作前にスクリプトを実行する」について¶
6.1.8. NIC Link Up/Down モニタリソース¶
ethtool eth0
Settings for eth0:
Supported ports: [ TP ]
Supported link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Supports auto-negotiation: Yes
Advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Advertised auto-negotiation: Yes
Speed: 1000Mb/s
Duplex: Full
Port: Twisted Pair
PHYAD: 0
Transceiver: internal
Auto-negotiation: on
Supports Wake-on: umbg
Wake-on: g
Current message level: 0x00000007 (7)
Link detected: yes
ethtool コマンドの結果で LAN ケーブルのリンク状況 ("Link detected: yes") が表示されない場合
CLUSTERPRO の NIC Link Up/Down モニタリソースが動作不可能な可能性が高いです。IP モニタリソースで代替してください。
ethtool コマンドの結果で LAN ケーブルのリンク状況 ("Link detected: yes") が表示される場合
多くの場合 CLUSTERPRO の NIC Link Up/Down モニタリソースが 動作可能ですが、希に動作不可能な場合があります。
特に以下のようなハードウェアでは動作不可能な場合があります。IP モニタリソースで代替してください。
ブレードサーバのように実際の LAN のコネクタと NIC のチップとの間にハードウェアが実装されている場合
監視対象のNICがBonding環境の場合、MII Polling Interval の設定値が0以上に設定されているか確認してください。
実機で CLUSTERPRO を使用して NIC Link Up/Down モニタリソースの使用可否を確認する場合には以下の手順で動作確認を行ってください。
- NIC Link Up/Down モニタリソースを構成情報に登録してください。NIC Link Up/Down モニタリソースの異常検出時回復動作の設定は「何もしない」を選択してください。
- クラスタを起動してください。
- NIC Link Up/Down モニタリソースのステータスを確認してください。LAN ケーブルのリンク状態が正常状態時に NIC Link Up/Down モニタリソースのステータスが異常となった場合、NIC Link Up/Down モニタリソースは動作不可です。
- LAN ケーブルのリンク状態を異常状態 (リンクダウン状態) にしたときに NIC Link Up/Down モニタリソースのステータスが異常となった場合、NIC Link Up/Down モニタリソースは動作可能です。ステータスが正常のまま変化しない場合、NIC Link Up/Down モニタリソースは動作不可です。
6.1.9. ミラーディスクリソース、ハイブリッドディスクリソースの write 性能について¶
- ミラーディスク、ハイブリッドディスクリソースの write 処理はネットワークを経由して相手サーバのディスクへ write、自サーバのディスクへ write を行います。read は自サーバ側のディスクからのみ read します。
- 上記の理由により、クラスタ化していない単体サーバと比べて write 性能が劣化します。write に単体サーバ並みに高スループットが要求されるシステム (更新系が多いデータベースシステムなど) には、共有ディスク使用をご提案ください。
6.1.10. ミラーディスクリソース、ハイブリッドディスクリソースを syslog の出力先にしない¶
ミラーディスクコネクトのパス冗長化の方法として、bonding を利用する。
ユーザ空間監視のタイムアウト値やミラー関連のタイムアウト値を調整する。
6.1.11. ミラーディスクリソース、ハイブリッドディスクリソース終了時の注意点¶
- ミラーディスクリソースやハイブリッドディスクリソースをマウントしたディレクトリやサブディレクトリやファイルへアクセスするプロセスがある場合は、シャットダウン時やフェイルオーバ時など各ディスクリソースが非活性になる際に、終了スクリプト等を使って各ディスクリソースへのアクセスを終了した状態にしてください。各ディスクリソースの設定によっては、アンマウント時の異常検出時動作 (各ディスクリソースにアクセスしたままのプロセスを強制終了する) が行われたり、アンマウントが失敗して非活性異常時の復旧動作 (OSシャットダウン等) が行われたりすることがあります。
- ミラーディスクリソースやハイブリッドディスクリソースをマウントしたディレクトリやサブディレクトリやファイルに対して大量のアクセスを行った場合、ディスクリソース非活性時のアンマウントにて、ファイルシステムのキャッシュがディスクへ書き出されるのに長い時間がかかることがあります。このような場合には、ディスクへの書き出しが正常に完了するよう、アンマウントのタイムアウト時間を余裕を持った設定にしてください。
- 上記の設定については、『リファレンスガイド』の「グループリソースの詳細」に記載されている、[復旧動作] タブや、[詳細] タブの [調整] プロパティ [アンマウント] タブを、参照してください。
6.1.12. 複数の非同期ミラー間のデータ整合性について¶
6.1.13. ミラー同期を中断した場合の同期先のミラーデータ参照について¶
6.1.14. ミラーディスク、ハイブリッドディスクリソースに対する O_DIRECT について¶
6.1.15. ミラーディスク、ハイブリッドディスクリソースに対する初期ミラー構築時間について¶
ext2/ext3/ext4 と、その他のファイルシステムとでは、初期ミラー構築や全面ミラー復帰にかかる時間が異なります。
6.1.16. ミラーディスク、ハイブリッドディスクコネクトについて¶
ミラーディスク、ハイブリッドディスクコネクトを冗長化する場合には両方のIPアドレスのバージョンをそろえてください。
ミラーディスクコネクトのIPアドレスはすべて、IPv4またはIPv6のどちらかにそろえてください。
6.1.17. JVM モニタリソースについて¶
同時に監視可能なJava VMは最大25個です。同時に監視可能なJava VMとはCluster WebUI ([監視(固有)]タブ-[識別名])で一意に識別するJava VM数のことです。
Java VMとJava Resource Agent間のコネクションはSSLには対応していません。
スレッドのデッドロックは検出できない場合があります。これは、Java VMの既知で発生している不具合です。詳細は、OracleのBug Databaseの「Bug ID: 6380127 」を参照してください。
JVMモニタリソースが監視できるJava VMは、JVMモニタリソースが動作中のサーバと同じサーバ内のみです。
JVMモニタリソースが監視できるJBoss のサーバインスタンスは、1 サーバに1 つまでです。
Cluster WebUI (クラスタプロパティ-[JVM監視]タブ-[Javaインストールパス])で設定したJavaインストールパスは、クラスタ内のサーバにおいて、共通の設定となります。JVM監視が使用するJava VMのバージョンおよびアップデートは、クラスタ内のサーバにおいて、同じものにしてください。
Cluster WebUI (クラスタプロパティ-[JVM監視]タブ-[接続設定]ダイアログ-[管理ポート番号])で設定した管理ポート番号は、クラスタ内のサーバにおいて、共通の設定となります。
x86_64版OS上においてIA32版の監視対象のアプリケーションを動作させている場合、監視を行うことはできません。
Cluster WebUI (クラスタプロパティ-[JVM監視]タブ-[最大Javaヒープサイズ])で設定した最大Javaヒープサイズを3000など大きな値に設定すると、JVMモニタリソースが起動に失敗します。システム環境に依存するため、システムのメモリ搭載量を元に決定してください。
ロードバランサ連携の監視対象Java VMの負荷算出機能を利用する場合は、SingleServerSafeでの利用を推奨します。また、Red Hat Enterprise Linuxでのみ動作可能です。
- 監視対象Java VMの起動オプションに「-XX:+UseG1GC」が付加されている場合、Java 7以前ではJVMモニタリソースの[プロパティ]-[監視(固有)] タブ-[調整]プロパティ-[メモリ]タブ内の設定項目は監視できません。Java 8以降ではJVMモニタリソースの[プロパティ]-[監視(固有)] タブ- [JVM種別]に[Oracle Java(usage monitoring)]を選択すれば監視可能です。
6.1.18. メール通報について¶
メール通報機能は、STARTTLSやSSLに対応していません。
6.1.19. ネットワーク警告灯の要件について¶
「警子ちゃんミニ」、「警子ちゃん 4G」を使用する場合、警告灯にパスワードを設定しないで下さい。
- 音声ファイルの再生による警告を行う場合、あらかじめ音声ファイル再生に対応したネットワーク警告灯に音声ファイルを登録しておく必要があります。音声ファイルの登録に関しては、各ネットワーク警告灯の取扱説明書を参照して下さい。
ネットワーク警告灯にクラスタ内のサーバからの rsh コマンド実行を許可するように設定してください。
6.2. OS インストール前、OS インストール時¶
OS をインストールするときに決定するパラメータ、リソースの確保、ネーミングルールなどで留意して頂きたいことです。
6.2.1. /opt/nec/clusterpro のファイルシステムについて¶
システムの対障害性の向上のために、ジャーナル機能を持つファイルシステムを使用することを推奨します。Linux(カーネルバージョン 2.6 以降)がサポートしているジャーナリングファイルシステムには、ext3、ext4、JFS、ReiserFS、XFSなどがあります。ジャーナリングシステムに対応していないファイルシステムを使用した場合、サーバやOSの停止(正常なシャットダウンが行えなかった場合)から再起動した場合、インタラクティブなコマンドの実行(rootファイルシステムのfsckの実行)が必要になります。
6.2.2. ミラー用のディスクについて¶
ディスクのパーティション
例) 両サーバに 1つの SCSI ディスクを増設して 1つのミラーディスクのペアにする場合
例) 両サーバの OS が格納されている IDE ディスクの空き領域を使用してミラーディスクのペアにする場合
ミラーパーティションデバイスは CLUSTERPRO のミラーリングドライバが上位に提供するデバイスです。
クラスタパーティションとデータパーティションの 2 つのパーティションをペアで確保してください。
OS (root パーティションや swap パーティション) と同じディスク上にミラーパーティション (クラスタパーティション、データパーティション) を確保することも可能です。
- 障害時の保守性、性能を重視する場合OS (root パーティションや swap パーティション) と別にミラー用のディスクを用意することを推奨します。
- H/W Raid の仕様の制限で LUN の追加ができない場合H/W Raid のプリインストールモデルで LUN 構成変更が困難な場合
OS (rootパーティションやswapパーティション) と同じディスクにミラーパーティション(クラスタパーティション、データパーティション)を確保することも可能です。
ディスクの配置
ミラーディスクとして複数のディスクを使用することができます。
また 1 つのディスクに複数のミラーパーティションデバイスを割り当てて使用することができます。
例) 両サーバに2つの SCSI ディスクを増設して2つのミラーディスクのペアにする場合。
1 つのディスク上にクラスタパーティションとデータパーティションをペアで確保してください。
データパーティションを 1 つ目のディスク、クラスタパーティションを 2 つ目のディスクとするような使い方はできません。
6.2.3. ハイブリッドディスクリソース用のディスクについて¶
ディスクのパーティション
共有ディスクまたは共有型でないディスク (サーバ内蔵、サーバ間で共有していない外付型ディスク筐体など) を使用することができます。
例) 2 台のサーバで共有ディスクを使用し 3 台目のサーバでサーバに内蔵したディスクを使用する場合
ミラーパーティションデバイスは CLUSTERPRO のミラーリングドライバが上位に提供するデバイスです。
クラスタパーティションとデータパーティションの 2 つのパーティションをペアで確保してください。
共有型でないディスク (サーバ内蔵、サーバ間で共有していない外付型ディスク筐体など) を使用する場合には OS (rootパーティションや swap パーティション) と同じディスク上にミラーパーティション (クラスタパーティション、データパーティション) を確保することも可能です。
- 障害時の保守性、性能を重視する場合OS (root パーティションや swap パーティション) と別にミラー用のディスクを用意することを推奨します。
- H/W Raid の仕様の制限で LUN の追加ができない場合H/W Raid のプリインストールモデルで LUN 構成変更が困難な場合OS (rootパーティションやswapパーティション) と同じディスクにミラーパーティション(クラスタパーティション、データパーティション)を確保することも可能です。
さらにハイブリッドディスク用のディスクを共有ディスク装置で確保する場合には、共有ディスク装置を共有するサーバ間のディスクハートビートリソース用のパーティションを確保してください。
ディスクに対して Linux の md によるストライプセット、ボリュームセット、ミラーリング、パリティ付きストライプセットの機能はサポートしていません。
6.2.5. 依存するドライバ¶
softdog
ユーザ空間モニタリソースの監視方法が softdog の場合、このドライバが必要です。
ローダブルモジュール構成にしてください。スタティックドライバでは動作しません。
6.2.7. ミラードライバのメジャー番号¶
- ミラードライバはメジャー番号 218 を使用します。他のデバイスドライバでは、メジャー番号の 218 を使用しないでください。
6.2.8. カーネルモード LAN ハートビートドライバ、キープアライブドライバのメジャー番号¶
カーネルモード LAN ハートビートドライバは、メジャー番号 10、マイナ番号 240 を使用します。
キープアライブドライバは、メジャー番号 10、マイナ番号 241 を使用します。
他のドライバが上記のメジャー及びマイナ番号を使用していないことを確認してください。
6.2.9. ディスクモニタリソースの RAW 監視用のパーティション確保¶
ディスクモニタリソースの RAW 監視を設定する場合、監視専用のパーティションを用意してください。パーティションサイズは 10MB 確保してください。
6.2.10. SELinuxの設定¶
SELinux の設定は permissive または disabled にしてください。
enforcing に設定すると CLUSTERPRO で必要な通信が行えない場合があります。
6.2.11. NetworkManagerの設定¶
Red Hat Enterprise Linux 6 環境で NetworkManager サービスが動作している場合、ネットワークの切断時に意図しない動作(通信経路の迂回、ネットワークインターフェイスの消失など)となる場合があるため、NetworkManager サービスを停止する設定を推奨します。
6.2.12. LVM メタデータデーモンの設定¶
- Red Hat Enterprise Linux 7 以降の環境で、ボリュームマネージャリソース、およびボリュームマネージャモニタリソースにて LVM の制御/監視を行う場合、LVM メタデータデーモンを無効にする必要があります。メタデータデーモンを無効化する手順は以下の通りです。
以下のコマンドにて LVM メタデータデーモンを停止してください。
# systemctl stop lvm2-lvmetad.service
/etc/lvm/lvm.conf を編集し、use_lvmetad の値を 0 に設定してください。
6.3. OS インストール後、CLUSTERPRO インストール前¶
OS のインストールが完了した後、OS やディスクの設定を行うときに留意して頂きたいことです。
6.3.1. 通信ポート番号¶
サーバにファイアウォールの設定を行う場合には、下記のポート番号にアクセスできるようにしてください。
AWS環境 の場合は、ファイアウォールの設定の他にセキュリティグループ設定においても、下記のポート番号にアクセスできるようにしてください。
[サーバ・サーバ間] [サーバ内ループバック]
From
To
備考
サーバ
自動割り当て 5
サーバ
29001/TCP
内部通信
サーバ
自動割り当て
サーバ
29002/TCP
データ転送
サーバ
自動割り当て
サーバ
29002/UDP
ハートビート
サーバ
自動割り当て
サーバ
29003/UDP
アラート同期
サーバ
自動割り当て
サーバ
29004/TCP
ミラーエージェント間通信
サーバ
自動割り当て
サーバ
29006/UDP
ハートビート(カーネルモード)
サーバ
自動割り当て
サーバ
29008/TCP
クラスタ情報管理
サーバ
自動割り当て
サーバ
29010/TCP
Restful API 内部通信
サーバ
自動割り当て
サーバ
XXXX 6 /TCP
ミラーディスクリソースデータ同期
サーバ
自動割り当て
サーバ
XXXX 7 /TCP
ミラードライバ間通信
サーバ
自動割り当て
サーバ
XXXX 8 /TCP
ミラードライバ間通信
サーバ
icmp
サーバ
icmp
ミラードライバ間キープアライブ、FIP/VIPリソースの重複確認、ミラーエージェントサーバ
自動割り当て
サーバ
XXXX 9 /UDP
内部ログ用通信
[サーバ・クライアント間]
From
To
備考
Restful API クライアント
自動割り当て
サーバ
29009/TCP
http通信
[サーバ・Cluster WebUI 間]
From
To
備考
Cluster WebUI
自動割り当て
サーバ
29003/TCP
http通信
[その他]
From
To
備考
サーバ
自動割り当て
ネットワーク警告灯
各製品のマニュアルを参照
ネットワーク警告灯制御
サーバ
自動割り当て
サーバのBMCのマネージメントLAN
623/UDP
BMC制御 (強制停止/筐体ランプ連携)
サーバのBMCのマネージメントLAN
自動割り当て
サーバ
162/UDP
BMC 連携用に設定された外部連携モニタの監視先
サーバのBMCのマネージメントLAN
自動割り当て
サーバのBMCのマネージメントLAN
5570/UDP
BMC HB通信
サーバ
自動割り当て
Witness サーバ
Cluster WebUI で設定した通信ポート番号
Witness ハートビートリソースの接続先ホスト
サーバ
icmp
監視先
icmp
IPモニタ
サーバ
icmp
NFSサーバ
icmp
NASリソースのNFSサーバ死活確認
サーバ
icmp
監視先
icmp
Ping方式ネットワークパーティション解決リソースの監視先
サーバ
自動割り当て
監視先
Cluster WebUI で設定した通信ポート番号
HTTP方式ネットワークパーティション解決リソースの監視先
サーバ
自動割り当て
サーバ
Cluster WebUI で設定した管理ポート番号 10
JVMモニタ
サーバ
自動割り当て
監視先
Cluster WebUIで設定した接続ポート番号 10
JVMモニタ
サーバ
自動割り当て
サーバ
Cluster WebUIで設定したロードバランサ連携 管理ポート番号 10
JVMモニタ
サーバ
自動割り当て
BIG-IP LTM
Cluster WebUIで設定した通信ポート番号 10
JVMモニタ
サーバ
自動割り当て
サーバ
Cluster WebUIで設定したプローブ ポート番号 11
Azure プローブポートリソース
サーバ
自動割り当て
AWS リージョンエンドポイント
443/tcp 12
AWS Elastic IP リソースAWS 仮想 IP リソースAWS DNS リソースAWS Elastic IP モニタリソースAWS 仮想 IP モニタリソースAWS AZ モニタリソースAWS DNS モニタリソースサーバ
自動割り当て
Azure エンドポイント
443/tcp 13
Azure DNS リソース
サーバ
自動割り当て
Azure の権威DNSサーバ
53/udp
Azure DNS モニタリソース
サーバ
自動割り当て
サーバ
Cluster WebUIで設定したポート番号 11
Google Cloud 仮想 IP リソース
サーバ
自動割り当て
サーバ
Cluster WebUIで設定したポート番号 11
Oracle Cloud 仮想 IP リソース
- 5
自動割り当てでは、その時点で使用されていないポート番号が割り当てられます。
- 6
- ミラーディスク、ハイブリッドディスクリソースごとに使用するポート番号です。ミラーディスクリソース、ハイブリッドディスク作成時に設定します。初期値として 29051 が設定されます。また、ミラーディスクリソース、ハイブリッドディスクの追加ごとに 1 を加えた値が自動的に設定されます。変更する場合は、Cluster WebUI の [ミラーディスクリソースプロパティ] - [詳細] タブ、[ハイブリッドディスクリソースプロパティ] - [詳細] タブで設定します。詳細については『リファレンスガイド』の「グループリソースの詳細」を参照してください。
- 7
- ミラーディスクリソース、ハイブリッドディスクごとに使用するポート番号です。ミラーディスクリソース、ハイブリッドディスク作成時に設定します。初期値として 29031 が設定されます。また、ミラーディスクリソース、ハイブリッドディスクの追加ごとに 1 を加えた値が自動的に設定されます。変更する場合は、Cluster WebUI の [ミラーディスクリソースプロパティ] - [詳細] タブ、[ハイブリッドディスクリソースプロパティ] - [詳細] タブで設定します。詳細については『リファレンスガイド』の「グループリソースの詳細」を参照してください。
- 8
- ミラーディスクリソース、ハイブリッドディスクごとに使用するポート番号です。ミラーディスクリソース、ハイブリッドディスク作成時に設定します。初期値として 29071 が設定されます。また、ミラーディスクリソース、ハイブリッドディスクの追加ごとに 1 を加えた値が自動的に設定されます。変更する場合は、Cluster WebUI の [ミラーディスクリソースプロパティ] - [詳細] タブ、[ハイブリッドディスクリソースプロパティ] - [詳細] タブで設定します。詳細については『リファレンスガイド』の「グループリソースの詳細」を参照してください。
- 9
[クラスタプロパティ] - [ポート番号 (ログ)] タブでログの通信方法に [UDP] を選択し、ポート番号で設定したポート番号を使用します。デフォルトのログの通信方法 [UNIXドメイン] では通信ポートは使用しません。
- 10(1,2,3,4)
JVMモニタリソースでは以下の4つのポート番号を使用します。
管理ポート番号はJVMモニタリソースが内部で使用するためのポート番号です。Cluster WebUIの [クラスタプロパティ]-[JVM監視] タブ-[接続設定] ダイアログで設定します。詳細については『リファレンスガイド』の「パラメータの詳細」を参照してください。
接続ポート番号は監視先(WebLogic Server, WebOTX)のJava VMと接続するためのポート番号です。Cluster WebUI の該当するJVMモニタリソース名の[プロパティ]-[監視(固有)]タブで設定します。詳細については『リファレンスガイド』の「モニタリソースの詳細」を参照してください。
ロードバランサ連携管理ポート番号はロードバランサ連携を行う場合に使用するためのポート番号です。ロードバランサ連携を使用しない場合は、設定不要です。Cluster WebUIの [クラスタのプロパティ]-[JVM監視] タブ-[ロードバランサ連携設定] ダイアログで設定します。詳細については『リファレンスガイド』の「パラメータの詳細」を参照してください。
通信ポート番号はBIG-IP LTMによるロードバランサ連携を行う場合に使用するためのポート番号です。ロードバランサ連携を使用しない場合は、設定不要です。Cluster WebUIの [クラスタプロパティ]-[JVM監視] タブ-[ロードバランサ連携設定] ダイアログで設定します。詳細については『リファレンスガイド』の「パラメータの詳細」を参照してください。
- 11(1,2,3)
ロードバランサが、各サーバの死活監視に使用するポート番号です。
- 12
AWS Elastic IP リソース、AWS 仮想 IP リソース、AWS DNS リソース、AWS Elastic IP モニタリソース、AWS 仮想 IP モニタリソース、AWS AZ モニタリソース、AWS DNS モニタリソースでは、AWS CLI を実行します。AWS CLI では上記のポート番号を使用します。
- 13
Azure DNS リソースでは、Azure CLI を実行します。Azure CLI では上記のポート番号を使用します。
6.3.2. 通信ポート番号の自動割り当て範囲の変更¶
OS が管理している通信ポート番号の自動割り当ての範囲と CLUSTERPRO が使用する通信ポート番号と重複する場合があります。
通信ポート番号の自動割り当ての範囲と CLUSTERPRO が使用する通信ポート番号が重複する場合には、重複しないように OS の設定を変更してください。
OS の設定状態の確認例/表示例
通信ポート番号の自動割り当ての範囲はディストリビューションに依存します。
# cat /proc/sys/net/ipv4/ip_local_port_range 1024 65000これは、アプリケーションが OS へ通信ポート番号の自動割り当てを要求した場合、1024 ~ 65000 の範囲でアサインされる状態です。
# cat /proc/sys/net/ipv4/ip_local_port_range 32768 61000これは、アプリケーションが OS へ通信ポート番号の自動割り当てを要求した場合、32768 ~ 61000 の範囲でアサインされる状態です。
OS の設定の変更例
/etc/sysctl.conf に以下の行を追加します。(30000 ~ 65000 に変更する場合)
net.ipv4.ip_local_port_range = 30000 65000この設定はOS再起動後に有効になります。
/etc/sysctl.confを修正後、下記のコマンドを実行することで即時反映することができます。
# sysctl -p
6.3.3. ポート数不足を回避する設定について¶
6.3.4. 時刻同期の設定¶
クラスタシステムでは、複数のサーバの時刻を定期的に同期する運用を推奨します。ntp などを使用してサーバの時刻を同期させてください。
6.3.5. NIC デバイス名について¶
ifconfig コマンドの仕様により、NIC デバイス名が短縮される場合、CLUSTERPRO で扱えるNIC デバイス名の長さもそれに依存します。
6.3.7. ミラー用のディスクについて¶
ミラーディスクリソース管理用パーティション (クラスタパーティション) とミラーディスクリソースで使用するパーティション (データパーティション) を設定します。
- ミラーディスク上のファイルシステムは CLUSTERPRO が制御します。ミラーディスクのファイルシステムを OS の /etc/fstab にエントリしないでください。(ミラーパーティションデバイスやミラーのマウントポイント、クラスタパーティションやデータパーティションを、OS の /etc/fstab にエントリしないでください。)(ignore オプション付きでも /etc/fstab へのエントリは行わないでください。ignore でエントリした場合、mount の実行時にはエントリが無視されますが、fsck 実行時にはエラーが発生することがあります。)(また、noauto オプションでの /etc/fstab へのエントリも、誤って手動でマウントしてしまう場合や、何らかのアプリケーションがマウントしてしまう可能性もないとは言えず、おすすめできません。)
クラスタパーティションは 1024MB (1024*1024*1024 バイト) 以上確保してください。(1024MB ちょうどを指定しても、ディスクのジオメトリの違いにより実際には 1024MB より大きなサイズが確保されますが、問題ありません)。また、クラスタパーティションにはファイルシステムを構築しないでください。
ミラー用ディスクの設定手順は『インストール&設定ガイド』を参照してください。
6.3.8. ハイブリッドディスクリソース用のディスクについて¶
ハイブリッドディスクリソースの管理用パーティション (クラスタパーティション) とハイブリッドディスクリソースで使用するパーティション (データパーティション) を設定します。
さらにハイブリッドディスク用のディスクを共有ディスク装置で確保する場合には、共有ディスク装置を共有するサーバ間のディスクハートビートリソース用のパーティションを確保します。
- ハイブリッドディスク上のファイルシステムは CLUSTERPRO が制御します。ハイブリッドディスクのファイルシステムを OS の /etc/fstab にエントリしないでください。(ミラーパーティションデバイスやミラーのマウントポイント、クラスタパーティションやデータパーティションを、OS の /etc/fstab にエントリしないでください。)(ignore オプション付きでの /etc/fstab へのエントリも行わないでください。ignore でエントリした場合、mount の実行時にはエントリが無視されますが、fsck 実行時にはエラーが発生することがあります。)(また、noauto オプションでの /etc/fstab へのエントリも、誤って手動でマウントしてしまう場合や、何らかのアプリケーションがマウントしてしまう可能性もないとは言えず、おすすめできません。)
クラスタパーティションは 1024MB (1024*1024*1024 バイト) 以上確保してください。(1024MB ちょうどを指定しても、ディスクのジオメトリの違いにより実際には 1024MB より大きなサイズが確保されますが、問題ありません)。また、クラスタパーティションにはファイルシステムを構築しないでください。
ハイブリッドディスク用ディスクの設定手順は『インストール&設定ガイド』を参照してください。
本バージョンでは、ハイブリッドディスクリソースで使用するデータパーティションにファイルシステムを手動で作成する必要があります。作成し忘れた場合の手順については、『インストール&設定ガイド』の「システム構成を決定する」の「ハードウェア構成後の設定」を参照してください。
6.3.9. ミラーディスクリソース、ハイブリッドディスクリソースで ext3またはext4 を使用する場合¶
6.3.9.1. Block sizeについて¶
ミラーディスクリソース、またはハイブリッドディスクリソースのデータパーティションに対し、mkfsコマンドを手動で実行してext3またはext4ファイルシステムを構築する場合、Block sizeを1024に指定しないでください。
ミラーディスクリソースおよびハイブリッドディスクリソースはBlock size 1024に対応しておりません。明示的にBlock sizeを指定する場合は、2048か4096を指定してください。
6.3.9.2. featureについて¶
ミラーディスクリソース、またはハイブリッドディスクリソースのデータパーティションに対し、mkfsコマンドを手動で実行してext3またはext4ファイルシステムを構築する場合、以下の3つのfeatureは無効にしてください。
feature |
対応ファイルシステム |
説明 |
---|---|---|
uninit_bg |
ext4 |
過去に使用したディスクを再利用する場合にこのfeatureを有効にすると、初期ミラー構築や全面ミラー復帰の所要時間が、実際のディスク使用量以上にかかることがあります。
|
64bit |
ext4 |
ミラーディスクリソースおよびハイブリッドディスクリソースはこのfeatureに対応していません。 |
meta_bg |
ext3, ext4 |
ミラーディスクリソースおよびハイブリッドディスクリソースはこのfeatureに対応していません。 |
具体的には、以下に記載のとおりmkfsを実行してください(ext4の場合)。
RHEL7, Asianux Server 7, SLES 12, Oracle Linux 7, Ubuntu, Amazon Linux 2 の場合:
mkfs -t ext4 -O -64bit,-uninit_bg <パーティションデバイス>上記以外のOSの場合 (RHEL6 等):
mkfs -t ext4 -O -uninit_bg <パーティションデバイス>
featureは、mkfsコマンドの -O オプションで、有効/無効を明示的に指定できます。
64bit featureは一部のOSにのみ存在し(上述のRHEL7, Asianux Server7 など)、既定値は「有効」なので、これらのOSを使用している場合は、上記のように明示的にfeatureを無効化してください。それ以外のOSでは64bit feature自体が存在しないので、指定は不要です。
uninit_bg featureは既定値が「有効」なので、明示的に無効化してください。
meta_bg featureは既定値が「無効」なので、明示的に指定する必要はありません。
なお、以下のいずれかの条件の場合に、上記の対応が必要となります。
ミラーディスクリソースの設定にて [初期mkfsを行う] をオフにしている場合。
ハイブリッドディスクリソースの場合。
ext4 で 64bit が有効になっている場合には、初期ミラー構築や全面ミラー復帰がエラーとなり、SYSLOG に下記のメッセージが記録されます。
kernel: [I] <type: liscal><event: 271> NMPx FS type is EXT4 (64bit=ON, desc_size=xx). kernel: [I] <type: liscal><event: 270> NMPx this FS type (EXT4 with 64bit option) is not supported for high speed full copy.
同様に、meta_bg が有効になっている場合は、初期ミラー構築や全面ミラー復帰がエラーとなり、SYSLOG に下記のメッセージが記録されます。
(ext4の場合)
kernel: [I] <type: liscal><event: 270> NMPx this FS type (EXT4 with meta_bg option) is not supported for high speed full copy.(ext3の場合)
kernel: [I] <type: liscal><event: 270> NMPx this FS type (EXT3 with meta_bg option) is not supported for high speed full copy.
6.3.10. OS 起動時間の調整¶
電源が投入されてから、OS が起動するまでの時間が、下記の 2 つの時間より長くなるように調整してください。
共有ディスクを使用する場合に、ディスクの電源が投入されてから使用可能になるまでの時間
ハートビートタイムアウト時間
設定手順は『インストール&設定ガイド』を参照してください。
6.3.11. ネットワークの確認¶
インタコネクトやミラーディスクコネクトで使用するネットワークの確認をします。クラスタ内のすべてのサーバで確認します。
設定手順は『インストール&設定ガイド』を参照してください。
6.3.12. OpenIPMI について¶
以下の機能で OpenIPMI を使用します。
グループリソースの活性異常時/非活性異常時の最終アクション
モニタリソースの異常時アクション
ユーザ空間モニタリソース
シャットダウン監視
物理マシンの強制停止機能
- 筐体 ID ランプ連携
CLUSTERPRO に OpenIPMI は添付しておりません。ユーザ様ご自身で別途OpenIPMI の rpm ファイルをインストールしてください。
ご使用予定のサーバ (ハードウェア) の OpenIPMI 対応可否についてはユーザ様にて事前に確認ください。
ハードウェアとして IPMI 規格に準拠している場合でも実際には OpenIPMI が動作しない場合がありますので、ご注意ください。
- サーバベンダが提供するサーバ監視ソフトウェアを使用する場合には ユーザ空間モニタリソースとシャットダウンストール監視の監視方法に IPMI を選択しないでください。これらのサーバ監視ソフトウェアと OpenIPMI は共にサーバ上の BMC (Baseboard Management Controller) を使用するため競合が発生して正しく監視が行うことができなくなります。
6.3.13. ユーザ空間モニタリソース、シャットダウン監視 (監視方法softdog) について¶
- 監視方法に softdog を設定する場合、softdogドライバを使用します。CLUSTERPRO以外でsoftdogドライバを使用する機能を動作しない設定にしてください。例えば、以下のような機能が該当することが確認されています。
OS 標準添付の heartbeat
i8xx_tco ドライバ
iTCO_WDT ドライバ
- systemd の watchdog機能, シャットダウン監視機能
監視方法に softdog を設定する場合、OS 標準添付の heartbeat を動作しない設定にしてください。
SUSE LINUX 11 では監視方法に softdog を設定する場合、i8xx_tco ドライバと同時に使用することができません。i8xx_tco ドライバを使用しない場合は、i8xx_tco をロードしない設定にしてください。
Red Hat Enterprise Linux 6 では監視方法に softdog を設定する場合、iTCO_WDT ドライバと同時に使用することができません。iTCO_WDT ドライバを使用しない場合は、iTCO_WDT をロードしない設定にしてください。
6.3.14. ログ収集について¶
- SUSE LINUX では CLUSTERPRO のログ収集機能で OS の syslog を採取する場合、ローテートされた syslog (message) ファイルのサフィックスが異なるため syslog の世代の指定機能が動作しません。ログ収集機能の syslog の世代の指定を行うためには syslog のローテートの設定を下記のように変更して運用する必要があります。
/etc/logrotate.d/syslog ファイルの compress と dateext をコメントアウトする
各サーバでログの総サイズが2GBを超えた場合、ログ収集が失敗することがあります。
6.3.15. nsupdate,nslookup について¶
以下の機能で nsupdate と nslookup を使用します。
グループリソースのダイナミック DNS リソース (ddns)
モニタリソースのダイナミック DNS モニタリソース (ddnsw)
CLUSTERPRO に nsupdate と nslookup は添付しておりません。ユーザ様ご自身で別途 nsupdate と nslookup の rpm ファイルをインストールしてください。
nsupdate、nslookup に関する以下の事項について、弊社は対応いたしません。ユーザ様の判断、責任にてご使用ください。
nsupdate、nslookup 自体に関するお問い合わせ
nsupdate、nslookup の動作保証
nsupdate、nslookup の不具合対応、不具合が原因の障害
各サーバの nsupdate、nslookup の対応状況のお問い合わせ
6.3.16. FTP モニタリソースについて¶
FTPサーバに登録するバナーメッセージや接続時のメッセージが長い文字列または複数行の場合、監視異常となる場合があります。FTPモニタリソースで監視する場合は、バナーメッセージや接続時のメッセージを登録しないようにしてください。
6.3.17. Red Hat Enterprise Linux 7 利用時の注意事項¶
- ミラーディスクリソース/ハイブリッドディスクリソースでは、ext4 ファイルシステム の 64bit featureおよびmeta_bg featureをサポートしていません。手動で mkfs を実行する場合には、64bit およびmeta_bg featureを無効に指定して実施してください。詳細については、「 6.3.9. ミラーディスクリソース、ハイブリッドディスクリソースで ext3またはext4 を使用する場合」の項を参照してください。
メール通報機能では OS 提供の [mail] コマンドを利用しています。最小構成では [mail] コマンドがインストールされないため、以下のいずれかを実施してください
クラスタプロパティの[アラートサービス]タブで[メール送信方法]に[SMTP] を選択。
mailx をインストール。
6.3.18. Ubuntu 利用時の注意事項¶
CLUSTERPRO 関連コマンドを実行する時は root ユーザで実行してください。
- ミラーディスクリソース/ハイブリッドディスクリソースでは、ext4 ファイルシステム の 64bit オプションをサポートしていません。手動で mkfs を実行する場合には、64bit オプションを無効に指定して実施してください。詳細については、「 ミラーディスクリソース、ハイブリッドディスクリソースで ext3またはext4 を使用する場合 」の項を参照してください。
Application Server AgentはWebsphereモニタのみ動作可能です。これは他のアプリケーションサーバがUbuntuをサポートしていないためです。
メール通報機能では OS 提供の [mail] コマンドを利用しています。最小構成では [mail] コマンドがインストールされないため、以下のいずれかを実施してください
クラスタプロパティの[アラートサービス]タブで[メール送信方法]に[SMTP] を選択。
mailutils をインストール。
SNMP による情報取得機能は動作しません。
6.3.19. AWS 環境における時刻同期¶
6.3.20. AWS環境におけるIAMの設定について¶
それぞれの方針のメリット・デメリットは以下のとおりです。
メリット |
デメリット |
|
---|---|---|
IAMロールを使用する方針 |
セキュリティ上安全
キー情報の管理が簡単
|
IAMロールを変更できないため、後からインスタンス別のアクセス権限設定ができない。 |
IAMユーザを使用する方針 |
後からインスタンス別のアクセス権限設定が可能 |
キー情報漏えいのリスクが高い
キー情報の管理が煩雑
|
IAMの設定手順は次の通りです。
IAMポリシーの作成
AWS の EC2 や S3 などのサービスへのアクションに対するアクセス許可を記述したポリシーを作成します。CLUSTERPRO の AWS 関連リソースおよびモニタリソースが AWS CLI を実行するために許可が必要なアクションは以下のとおりです。
必要なポリシーは将来変更される可能性があります。
AWS 仮想IPリソース/AWS 仮想IPモニタリソース
アクション
説明
ec2:DescribeNetworkInterfacesec2:DescribeVpcsec2:DescribeRouteTablesVPC、ルートテーブル、ネットワークインタフェースの情報を取得する時に必要です。
ec2:ReplaceRoute
ルートテーブルを更新する時に必要です。
AWS Elastic IPリソース/AWS Elastic IPモニタリソース
アクション
説明
ec2:DescribeNetworkInterfacesec2:DescribeAddressesEIP、ネットワークインタフェースの情報を取得する時に必要です。
ec2:AssociateAddress
EIPをENIに割り当てる際に必要です。
ec2:DisassociateAddress
EIPをENIから切り離す際に必要です。
AWS AZモニタリソース
アクション
説明
ec2:DescribeAvailabilityZones
アベイラビリティゾーンの情報を取得する時に必要です。
AWS DNS リソース/AWS DNS モニタリソース
アクション
説明
route53:ChangeResourceRecordSets
リソースレコードセットの追加、削除、設定内容の更新をする時に必要です。
route53:ListResourceRecordSets
リソースレコードセット の情報を取得する時に必要です。
以下のカスタムポリシーの例では全てのAWS 関連リソースおよびモニタリソースが使用するアクションを許可しています。
{ "Version": "2012-10-17", "Statement": [ { "Action": [ "ec2:Describe*", "ec2:ReplaceRoute", "ec2:AssociateAddress", "ec2:DisassociateAddress", "route53:ChangeResourceRecordSets", "route53:ListResourceRecordSets" ], "Effect": "Allow", "Resource": "*" } ] }IAM Management Console の [Policies] - [Create Policy] で カスタムポリシーを作成できます。
インスタンスの設定 - IAMロールを使用する
IAM ロールを作成し、インスタンスに付与することでAWS CLIを実行可能にする方法です。
IAM ロールを作成します。作成したロールに IAM ポリシーをアタッチします。IAM Management Console の [Roles] - [Create New Role] で IAM ロールを作成できます。インスタンス作成時に、「IAM Role」に作成した IAM ロールを指定します。
インスタンスにログオンします。
Pythonをインストールします。CLUSTERPRO が必要とする Python をインストールします。まず、Pythonがインストールされていることを確認します。もし未インストールであれば、yumコマンドなどでインストールします。pythonコマンドのインストールパスは、以下のいずれかにする必要があります。環境変数PATHにおいて、最初に見つかったpythonコマンドを使用します。/sbin、/bin、/usr/sbin、/usr/bin
Python3のみインストールされており /usr/bin/python が存在しない場合、/usr/bin/python3.x (xはバージョン) もしくは /usr/bin/python3 に対し /usr/bin/python のシンボリックリンクを作成してください。シェルからpipコマンドを実行し、 AWS CLI をインストールします。
$ pip install awsclipip コマンドに関する詳細は下記を参照してください。AWS CLI のインストールパスは、以下のいずれかにする必要があります。/sbin、/bin、/usr/sbin、/usr/bin、/usr/local/binAWS CLI のセットアップ方法に関する詳細は下記を参照してください。(PythonまたはAWS CLIのインストールを行った時点ですでにCLUSTERPROがインストール済の場合は、OSを再起動してからCLUSTERPROの操作を行ってください。)
シェルから以下のコマンドを実行します。
$ sudo aws configure質問に対して AWS CLI の実行に必要な情報を入力します。AWS アクセスキー ID、AWS シークレットアクセスキーは入力しないことに注意してください。
AWS Access Key ID [None]: (Enterのみ) AWS Secret Access Key [None]: (Enterのみ) Default region name [None]: <既定のリージョン名> Default output format [None]: text"Default output format"は、"text" 以外を指定することも可能です。もし誤った内容を設定してしまった場合は、/root/.aws をディレクトリごと消去してから上記操作をやり直してください。
インスタンスの設定 - IAMユーザを使用する
IAM ユーザを作成し、そのアクセスキーID、シークレットアクセスキーをインスタンス内に保存することでAWS CLIを実行可能にする方法です。インスタンス作成時の IAM ロールの付与は不要です。
IAM ユーザを作成します。作成したユーザに IAM ポリシーをアタッチします。IAM Management Console の [Users] - [Create New Users] で IAM ユーザを作成できます。インスタンスにログインします。
Pythonをインストールします。CLUSTERPRO が必要とする Python をインストールします。まず、Pythonがインストールされていることを確認します。もし未インストールであれば、yumコマンドなどでインストールします。python コマンドのインストールパスは、以下のいずれかにする必要があります。環境変数PATHにおいて、最初に見つかったpythonコマンドを使用します。/sbin、/bin、/usr/sbin、/usr/binPython3のみインストールされており /usr/bin/python が存在しない場合、/usr/bin/python3.x (xはバージョン) もしくは /usr/bin/python3 に対し/usr/bin/python のシンボリックリンクを作成してください。
シェルからpipコマンドを実行し、AWS CLI をインストールします。
$ pip install awsclipip コマンドに関する詳細は下記を参照してください。AWS CLI のインストールパスは、以下のいずれかにする必要があります。/sbin、/bin、/usr/sbin、/usr/bin、/usr/local/binAWS CLI のセットアップ方法に関する詳細は下記を参照してください。(PythonまたはAWS CLIのインストールを行った時点ですでにCLUSTERPROがインストール済の場合は、OSを再起動してからCLUSTERPROの操作を行ってください。)シェルから以下のコマンドを実行します。
$ sudo aws configure質問に対して AWS CLI の実行に必要な情報を入力します。AWS アクセスキー ID、AWS シークレットアクセスキーは作成した IAM ユーザの詳細情報画面から取得したものを入力します。
AWS Access Key ID [None]: <AWS アクセスキー> AWS Secret Access Key [None]: <AWS シークレットアクセスキー> Default region name [None]: <既定のリージョン名> Default output format [None]: text"Default output format"は、"text"以外を指定することも可能です。もし誤った内容を設定してしまった場合は、/root/.aws をディレクトリごと消去してから上記操作をやり直してください。
6.3.21. Azure DNS リソースについて¶
Azure CLI のインストール、サービス プリンシパルの作成の手順は、『CLUSTERPRO X Microsoft Azure 向け HAクラスタ 構築ガイド』を参照してください。
Azure DNS リソースが利用するため、Azure CLI および Python のインストールが必要です。Python は、Redhat Enterprise Linux/Cent OS など OS に同梱されています。Azure CLI の詳細については、以下のWeb サイトを参照してください。
Microsoft Azure のドキュメント:Azure DNS リソースが利用するため、Azure DNS のサービスが必要です。Azure DNS の詳細については、以下のWeb サイトを参照してください。
CLUSTERPRO が Microsoft Azure と連携するためには、Microsoft Azure の組織アカウントが必要となります。組織アカウント以外のアカウントは Azure CLI 実行時に対話形式でのログインが必要となるため使用できません。
- Azure CLI を使用して、サービス プリンシパルを作成する必要があります。Azure DNS リソースは Microsoft Azure にログインし、DNS ゾーンへの登録を実行します。Microsoft Azure へのログイン時、サービス プリンシパルによる Azure ログインを利用します。サービスプリンシパルや詳細な手順については、以下のWeb サイトを参照してください。Azure CLI 2.0 を使用してログインする:Azure CLI 2.0 で Azure サービス プリンシパルを作成する:作成されたサービスプリンシパルのロールを既定のContributor(共同作成者)から別のロールに変更する場合、Actions プロパティとして以下のすべての操作へのアクセス権を持つロールを選択してください。この条件を満たさないロールに変更した場合、Azure DNS リソースの起動がエラーにより失敗します。
Azure CLI 1.0の場合
Microsoft.Network/dnsZones/readMicrosoft.Network/dnsZones/A/writeMicrosoft.Network/dnsZones/A/readMicrosoft.Network/dnsZones/A/deleteMicrosoft.Network/dnsZones/NS/readAzure CLI 2.0の場合
Microsoft.Network/dnsZones/A/writeMicrosoft.Network/dnsZones/A/deleteMicrosoft.Network/dnsZones/NS/read Azure プライベート DNS には未対応です。
6.3.22. Samba モニタリソースについて¶
Samba モニタリソースはSMBプロトコルバージョン 2.0以降やNTLM認証やSMB署名に対応するために内部バージョン 4.1.0-1 より共有ライブラリの libsmbclient.so.0 を利用しています。libsmbclient.so.0 は libsmbclient パッケージに含まれるため、インストールされているか確認してください。
libsmbclient のバージョンが 3 以下の場合(例.RHEL 6 に同梱の libsmbclient)、[ポート番号]は139もしくは445しか指定できません。smb.conf の smb ports に含まれるポート番号を指定してください。
Samba モニタリソースがサポートするSMBプロトコルのバージョンはインストールされている libsmbclient に依存します。libsmbclient でのサポート可否は、各ディストリビュータが提供する smbclient コマンドで監視対象の共有への接続を試行することで確認することができます。
6.3.23. HTTP ネットワークパーティション解決リソース、Witness ハートビートリソースについて¶
- HTTP ネットワークパーティション解決リソース、Witness ハートビートリソースでは、SSLを使用する場合に OpenSSL 1.0/1.1 を使用します。既定の設定で使用するライブラリは以下の通りです。
libssl.so.10 (CLUSTERPRO の rpm パッケージをインストールした場合)
libssl.so.1.0.0 (CLUSTERPRO の deb パッケージをインストールした場合)
使用するライブラリを変更する場合は、クラスタプロパティの暗号化タブで [SSLライブラリ] および [Cryptoライブラリ] を設定してください。
6.4. CLUSTERPRO の情報作成時¶
CLUSTERPRO の構成情報の設計、作成前にシステムの構成に依存して確認、留意が必要な事項です。
6.4.1. CLUSTERPRO インストールパス配下のディレクトリ、ファイルについて¶
6.4.2. 環境変数¶
環境変数が 256 個以上設定されている環境では、下記の処理を実行できません。下記の機能またはリソースを使用する場合は、環境変数を 255 個以下に設定してください。
グループの起動/停止処理
exec リソースが活性/非活性時に実行する開始/停止スクリプト
カスタムモニタリソースが監視時に実行するスクリプト
グループリソース、モニタリソース異常検出後の最終動作実行前スクリプト
グループリソースの活性/非活性前後スクリプト
強制停止スクリプト
注釈
システムに設定されている環境変数とCLUSTERPROで設定される環境変数を合わせて255個以下になるように設定してください。CLUSTERPROが設定する環境変数は約30個です。
6.4.3. 強制停止機能、筐体 ID ランプ連携¶
強制停止機能、筐体IDランプ連携を使用する場合、各サーバのBMCのIPアドレス、ユーザ名、パスワードの設定が必須です。ユーザ名には必ずパスワード登録されているものを設定してください。
6.4.4. サーバのリセット、パニック、パワーオフ¶
CLUSTERPROが「サーバのリセット」または「サーバのパニック」、または「サーバのパワーオフ」を行う場合、サーバが正常にシャットダウンされません。そのため下記のリスクがあります。
マウント中のファイルシステムへのダメージ
保存していないデータの消失
OS のダンプ採取の中断
「サーバのリセット」または「サーバのパニック」が発生する設定は下記です。
グループリソース活性時/非活性時異常時の動作
sysrq パニック
keepalive リセット
keepalive パニック
BMC リセット
BMC パワーオフ
BMC サイクル
BMC NMI
- I/O Fencing(High-End Server Option)
モニタリソース異常検出時の最終動作
sysrq パニック
keepalive リセット
keepalive パニック
BMC リセット
BMC パワーオフ
BMC サイクル
BMC NMI
- I/O Fencing(High-End Server Option)
ユーザ空間監視のタイムアウト検出時動作
監視方法 softdog
監視方法 ipmi
監視方法 ipmi(High-End Server Option)
- 監視方法 keepalive
注釈
「サーバのパニック」は監視方法が keepalive の場合のみ設定可能です。
シャットダウンストール監視
監視方法 softdog
監視方法 ipmi
監視方法 ipmi(High-End Server Option)
- 監視方法 keepalive
注釈
「サーバのパニック」は監視方法が keepalive の場合のみ設定可能です。
強制停止機能の動作
BMC リセット
BMC パワーオフ
BMC サイクル
BMC NMI
- VMware vSphere パワーオフ
6.4.5. グループリソースの非活性異常時の最終アクション¶
6.4.6. VxVM が使用する RAW デバイスの確認¶
ボリューム RAW デバイスの実 RAW デバイスについて事前に調べておいてください。
CLUSTERPRO をインストールする前に、片サーバで活性しうる全てのディスクグループをインポートし、全てのボリュームを起動した状態にします。
以下のコマンドを実行します。
例) ディスクグループ名、ボリューム名がそれぞれ以下の場合
ディスクグループ名 dg1
dg1 配下のボリューム名 vol1、vol2
以下のコマンドを実行します。
(2) と (3) のメジャー/マイナ番号が等しいことを確認します。
これにより確認された RAW デバイス (1) はCLUSTERPRO のディスクハートビートリソース、Disk タイプが「VxVM」以外のディスクリソース、監視方法が READ (VxVM) 以外のディスクモニタリソースでは絶対に設定しないでください。
6.4.7. ミラーディスクのファイルシステムの選択について¶
現在動作確認を完了しているファイルシステムは下記の通りです。
ext3
ext4
xfs
reiserfs
jfs
vxfs
none(ファイルシステムなし)
6.4.8. ハイブリッドディスクのファイルシステムの選択について¶
現在動作確認を完了しているファイルシステムは下記の通りです。
ext3
ext4
xfs
reiserfs
none(ファイルシステムなし)
6.4.9. ミラーディスク、ハイブリッドディスク使用時の監視リソースの動作設定について¶
6.4.10. ミラーディスクを多く定義した場合の単体サーバ起動時間について¶
6.4.11. ディスクモニタリソースの RAW 監視について¶
ディスクモニタリソースの RAW 監視を設定する場合、既に mount しているパーティションまたは mount する可能性のあるパーティションの監視はできません。また、既にmount しているパーティションまたは mount する可能性のあるパーティションのwhole device(ディスク全体を示すデバイス)をデバイス名に設定して監視することもできません。
監視専用のパーティションを用意してディスクモニタリソースの RAW 監視に設定してください。
6.4.12. 遅延警告割合¶
遅延警告割合を 0 または、100 に設定すれば以下のようなことを行うことが可能です。
- 遅延警告割合に 0 を設定した場合監視毎に遅延警告がアラート通報されます。この機能を利用し、サーバが高負荷状態での監視リソースへのポーリング時間を算出し、監視リソースの監視タイムアウト時間を決定することができます。
- 遅延警告割合に 100 を設定した場合遅延警告の通報を行いません。テスト運用以外で、0% 等の低い値を設定しないように注意してください。
6.4.13. ディスクモニタリソースの監視方法 TUR について¶
- SCSI の Test Unit Ready コマンドや SG_IO コマンドをサポートしていないディスク、ディスクインターフェイス (HBA) では使用できません。ハードウェアがサポートしている場合でもドライバがサポートしていない場合があるのでドライバの仕様も合わせて確認してください。
- S-ATA インターフェイスのディスクの場合には、ディスクコントローラのタイプや使用するディストリビューションにより、OS に IDE インターフェイスのディスク (hd) として認識される場合と SCSI インターフェイスのディスク (sd) として認識される場合があります。IDE インターフェイスとして認識される場合には、すべての TUR 方式は使用できません。SCSI インターフェイスとして認識される場合には、TUR (legacy) が使用できます。TUR (generic) は使用できません。
Read 方式に比べて OS やディスクへの負荷は小さくなります。
Test Unit Ready では、実際のメディアへの I/Oエラーは検出できない場合があります。
6.4.14. LAN ハートビートの設定について¶
LAN ハートビートリソースまたはカーネルモード LAN ハートビートリソースは、どちらか一方を最低一つは設定する必要があります。
インタコネクト専用の LAN を LAN ハートビートリソースとして登録し、さらにパブリックLAN も LAN ハートビートリソースとして登録することを推奨します (LAN ハートビートリソースを 2 つ以上設定することを推奨します)。
ハイブリッドディスクリソースを使用する場合にはサーバダウン通知を使用しないでください。
6.4.15. カーネルモード LAN ハートビートの設定について¶
LAN ハートビートリソースまたはカーネルモード LAN ハートビートリソースは、どちらか一方を最低一つは設定する必要があります。
カーネルモード LAN ハートビートが使用できるディストリビューション,カーネルの場合には カーネルモード LAN ハートビートの利用を推奨します。
6.4.16. COM ハートビートの設定について¶
ネットワークが断線した場合に両系で活性することを防ぐため、COM が使用できる環境であれば COM ハートビートリソースを使用することを推奨します。
6.4.17. BMC ハートビートの設定について¶
BMC のハードウェアやファームウェアが BMC ハートビートに対応している必要があります。利用可能な BMC については本ガイドの「4. CLUSTERPRO の動作環境」の「4.1.2. NX7700x シリーズとの連携に対応したサーバ」「4.1.3. Express5800/A1080a,A1040a シリーズとの連携に対応したサーバ」を参照してください。
6.4.18. BMC モニタリソースの設定について¶
BMC のハードウェアやファームウェアが BMC モニタリソースに対応している必要があります。利用可能な BMC については本ガイドの「4. CLUSTERPRO の動作環境」の「4.1.2. NX7700x シリーズとの連携に対応したサーバ」を参照してください。
6.4.19. スクリプトのコメントなどで取り扱える 2 バイト系文字コードについて¶
CLUSTERPRO では、Linux 環境で編集されたスクリプトは EUC、Windows 環境で編集されたスクリプトは Shift-JIS として扱われます。その他の文字コードを利用した場合、環境によっては文字化けが発生する可能性があります。
6.4.20. 仮想マシングループのフェイルオーバ排他属性の設定について¶
仮想マシングループに設定したグループは排他ルールへ設定しないでください。
6.4.21. システムモニタリソースの設定について¶
- リソース監視の検出パターンSystem Resource Agent では、「しきい値」、「監視継続時間」という2つのパラメータを組み合わせて検出を行います。各システムリソース(オープンファイル数、ユーザプロセス数、スレッド数、メモリ使用量、CPU 使用率、仮想メモリ使用量)を継続して収集し、一定時間(継続時間として指定した時間)しきい値を超えていた場合に異常を検出します。
6.4.22. 外部連携モニタリソースの設定について¶
外部連携モニタリソースに異常を通知するには、[clprexec] コマンドを用いる方法、BMC 連携機能を用いる方法、サーバ管理基盤連携機能を用いる方法の三つの方法があります。
[clprexec] コマンドを用いる場合は CLUSTERPRO CD に同梱されているファイルを利用します。通知元サーバの OS やアーキテクチャに合わせて利用してください。また、通知元サーバと通知先サーバの通信が可能である必要があります。
BMC 連携機能を利用する場合、BMC のハードウェアやファームウェアが対応している必要があります。また、BMC の管理用 IP アドレスから OS の IP アドレスへの通信が可能である必要があります。
サーバ管理基盤連携機能については、『ハードウェア連携ガイド』の「サーバ管理基盤との連携」を参照してください。
6.4.23. JVM 監視の設定について¶
監視対象がWebLogic Serverの場合、JVMモニタリソースの以下の設定値については、システム環境(メモリ搭載量など)により、設定範囲の上限に制限がかかることがあります。
[ワークマネージャのリクエストを監視する]-[リクエスト数]
[ワークマネージャのリクエストを監視する]-[平均値]
[スレッドプールのリクエストを監視する]-[待機リクエスト リクエスト数]
[スレッドプールのリクエストを監視する]-[待機リクエスト 平均値]
[スレッドプールのリクエストを監視する]-[実行リクエスト リクエスト数]
[スレッドプールのリクエストを監視する]-[実行リクエスト 平均値]
監視対象のJRockit JVM が64bit 版の場合、JRockit JVMから取得した各最大メモリ量がマイナスとなり使用率が計算できないため、以下のパラメータが監視できません。
[ヒープ使用率を監視する]- [領域全体]
[ヒープ使用率を監視する]- [Nursery Space]
[ヒープ使用率を監視する]- [Old Space]
[非ヒープ使用率を監視する]- [領域全体]
[非ヒープ使用率を監視する]- [ClassMemory]
JVMモニタリソースを使用するには、「4. CLUSTERPRO の動作環境」の「4.2.5. JVM モニタの動作環境」に記載しているJRE(Java Runtime Environment)をインストールしてください。監視対象(WebLogic ServerやWebOTX)が使用するJREと同じ物件を使用することも、別の物件を使用することも可能です。
モニタリソース名に空白を含まないでください。
異常検出時に障害原因別にコマンドを実行するための[コマンド]とロードバランサ連携機能は併用できません。
6.4.24. ボリュームマネージャリソース利用時の CLUSTERPRO 起動処理について¶
6.4.25. AWS Elastic IP リソースの設定について¶
IPv6はサポートしていません。
AWS 環境では、フローティング IP リソース、フローティング IP モニタリソース、仮想 IP リソース、仮想 IP モニタリソースは利用できません。
AWS Elastic IPリソースはASCII文字以外の文字に対応していません。下記のコマンドの実行結果にASCII文字以外の文字が含まれないことを確認してください。
aws ec2 describe-addresses --allocation-ids <EIP ALLOCATION ID>
6.4.26. AWS 仮想 IP リソースの設定について¶
IPv6はサポートしていません。
AWS 環境では、フローティング IP リソース、フローティング IP モニタリソース、仮想 IP リソース、仮想 IP モニタリソースは利用できません。
- AWS 仮想 IPリソースはASCII文字以外の文字に対応していません。下記のコマンドの実行結果にASCII文字以外の文字が含まれないことを確認してください。
aws ec2 describe-vpcs --vpc-ids <VPC ID> aws ec2 describe-route-tables --filters Name=vpc-id,Values=<VPC ID> aws ec2 describe-network-interfaces --network-interface-ids <ENI ID>
AWS 仮想IPリソースは、VPC ピアリング接続を経由してのアクセスが必要な場合では利用することができません。これは、VIP として使用する IP アドレスが VPC の範囲外であることを前提としており、このような IP アドレスは VPC ピアリング接続では無効とみなされるためです。VPC ピアリング接続を経由してのアクセスが必要な場合は、Amazon Route 53 を利用する AWS DNS リソースを使用してください。
インスタンスが使用するルーティングテーブルに、仮想 IP が使用する IP アドレス、ENI定義がされていない場合でもAWS 仮想 IPリソースは正常に起動します。この動作は仕様どおりです。AWS 仮想 IP リソースは活性化時において、指定されたIPアドレスのエントリが存在するルートテーブルに対してのみその内容を更新します。ルートテーブルが一つも見つからなかった場合でも更新対象なしとして正常と判断します。どのルートテーブルにエントリが存在する必要があるかはシステムの構成で決まるため、AWS 仮想 IP リソースとしては正常性の判断対象とはしていません。
6.4.27. AWS DNS リソースの設定について¶
IPv6はサポートしていません。
AWS 環境では、フローティング IP リソース、フローティング IP モニタリソース、仮想 IP リソース、仮想 IP モニタリソースは利用できません。
[リソースレコードセット名] にエスケープコードを含む場合、監視が異常になります。エスケープコードを含まない [リソースレコードセット名] を設定してください。
AWS DNS リソースの活性時、DNS 設定の変更がすべての Amazon Route 53 DNS サーバーに伝播済みとなるまでは待ち合わせません。これは Route 53 の仕様上、リソースレコードセットの変更が全体に適用されるまでに時間が掛かるためです。「AWS DNS モニタリソースの設定について」も参照してください。
AWS DNS リソースはアカウントに紐づいています。そのため、複数のアカウントやAWS アクセスキーID、AWS シークレットアクセスキーを使い分ける運用はできません。その場合は、EXECリソースなどで AWS CLI を実行するスクリプトによる運用を検討してください。
6.4.28. AWS DNS モニタリソースの設定について¶
AWS DNS モニタリソースは、監視時に AWS CLI を実行します。実行する AWS CLI のタイムアウトは、AWS DNS リソースで設定した [AWS CLI タイムアウト] を利用します。
AWS DNS リソースの活性直後、以下の事象により AWS DNS モニタリソースによる監視が失敗する可能性があります。この場合、AWS DNS モニタリソースの [監視開始待ち時間] を Amazon Route 53 における DNS 設定の変更が反映される時間より長く設定してください(https://aws.amazon.com/jp/route53/faqs/)。
AWS DNS リソースの活性時、リソースレコードセットの追加や更新をする。
Amazon Route 53 における DNS 設定の変更が反映される前に、AWS DNS モニタリソースが監視を実行すると名前解決ができないため監視に失敗する。DNS リゾルバキャッシュが有効な間は、その後も AWS DNS モニタリソースは監視に失敗する。
Amazon Route 53 における DNS 設定の変更が反映される。
AWS DNS リソースの [TTL] の有効期間が経過すると名前解決に成功するため、AWS DNS モニタリソースの監視が成功する。
6.4.29. Azure プローブポートリソースの設定について¶
IPv6はサポートしていません。
Microsoft Azure 環境では、フローティング IP リソース、フローティング IP モニタリソース、仮想 IP リソース、仮想 IP モニタリソースは利用できません。
6.4.30. Azure ロードバランスモニタリソースの設定について¶
Azure ロードバランスモニタリソースが異常を検知した場合、Azureのロードバランサからの現用系と待機系の切り替えが正しく行われない可能性があります。そのため、Azure ロードバランスモニタリソースの[最終動作]には[クラスタサービス停止と OS シャットダウン]を選択することを推奨とします。
6.4.31. Azure DNS リソースの設定について¶
IPv6はサポートしていません。
Microsoft Azure 環境では、フローティング IP リソース、フローティング IP モニタリソース、仮想 IP リソース、仮想 IP モニタリソースは利用できません。
6.4.32. Google Cloud 仮想 IP リソースの設定について¶
IPv6はサポートしていません。
6.4.33. Google Cloud ロードバランスモニタリソースの設定について¶
Google Cloud ロードバランスモニタリソースが異常を検知した場合、ロードバランサからの現用系と待機系の切り替えが正しく行われない可能性があります。そのため、Google Cloud ロードバランスモニタリソースの [最終動作] には [クラスタサービス停止と OS シャットダウン] を選択することを推奨します。
6.4.34. Oracle Cloud 仮想 IP リソースの設定について¶
IPv6はサポートしていません。
6.4.35. Oracle Cloud ロードバランスモニタリソースの設定について¶
Oracle Cloud ロードバランスモニタリソースが異常を検知した場合、ロードバランサからの現用系と待機系の切り替えが正しく行われない可能性があります。そのため、Oracle Cloud ロードバランスモニタリソースの [最終動作] には [クラスタサービス停止と OS シャットダウン] を選択することを推奨します。
6.4.36. クラスタのリソースとして iSCSI デバイスを使用する場合の注意点¶
6.4.37. ディスク I/O 閉塞の設定を反映する場合の注意点¶
クラスタの新規作成時、または構成変更時にディスク I/O 閉塞の設定を変更して構成情報のアップロードを実行した場合、反映方法として "OS再起動" が表示されないことがあります。ディスク I/O 閉塞の設定を変更した場合は構成情報を反映するために OS の再起動を行ってください。
6.5. CLUSTERPRO 運用後¶
クラスタとして運用を開始した後に発生する事象で留意して頂きたい事項です。
6.5.1. udev 環境等でのミラードライバロード時のエラーメッセージについて¶
udev 環境等でミラードライバのロード時に、以下のようなログが messages ファイルにエントリされることがあります。
kernel: [I] <type: liscal><event: 141> NMPx device does not exist. (liscal_make_request) kernel: [I] <type: liscal><event: 141> - This message can be recorded on udev environment when liscal is initializing NMPx. kernel: [I] <type: liscal><event: 141> - Ignore this and following messages 'Buffer I/O error on device NMPx' on udev environment. kernel: Buffer I/O error on device NMPx, logical block xxxx
kernel: <liscal liscal_make_request> NMPx device does not exist. kernel: Buffer I/O error on device NMPx, logical block xxxx
ファイル名:50-liscal-udev.rules
ACTION=="add", DEVPATH=="/block/NMP*", OPTIONS+="ignore_device"
ACTION=="add", DEVPATH=="/devices/virtual/block/NMP*", OPTIONS+="ignore_device"
6.5.2. ミラーパーティションデバイスに対するバッファ I/O エラーのログについて¶
ミラーディスクリソースやハイブリッドディスクリソースが非活性の状態の時に、ミラーパーティションデバイスがアクセスされると、以下のようなログがmessagesファイルに記録されます。
kernel: [W] <type: liscal><event: 144> NMPx I/O port has been closed, mount(0), io(0). (PID=xxxxx) kernel: [I] <type: liscal><event: 144> - This message can be recorded on hotplug service starting when NMPx is not active. kernel: [I] <type: liscal><event: 144> - This message can be recorded by fsck command when NMPx becomes active. kernel: [I] <type: liscal><event: 144> - Ignore this and following messages 'Buffer I/O error on device NMPx' on such environment. : kernel: Buffer I/O error on device /dev/NMPx, logical block xxxx kernel: [W] <type: liscal><event: 144> NMPx I/O port has been closed, mount(0), io(0). (PID=xxxx) : kernel: [W] <type: liscal><event: 144> NMPx I/O port has been closed, mount(0), io(0). (PID=xxxx)
kernel: <liscal liscal_make_request> NMPx I/O port is close, mount(0), io(0). kernel: Buffer I/O error on device /dev/NMPx, logical block xxxx
(x や xxxx には任意の数字が入ります)
udev環境によるもの
この場合は、ミラードライバのロード時に『kernel: Buffer I/O error on device /dev/NMPx, logical block xxxx』のメッセージとともに『kernel: [I] <type: liscal><event: 141>』のメッセージが記録されます。
本メッセージは異常を示すものではなく、CLUSTERPRO の動作には影響ありません。
- この詳細については、『6.5.1. udev 環境等でのミラードライバロード時のエラーメッセージについて』を参照してください。
OS の情報収集コマンド(sosreport, sysreport, blkid コマンド等)が実行された時とき
この場合は、本メッセージは異常を示すものではなく、CLUSTERPRO の動作には影響ありません。
OS が提供する情報収集コマンドが実行されると、OS が認識しているデバイスへのアクセスが行われます。この時、非活性状態のミラーディスクにもアクセスが行われ、その結果として、上記のメッセージが記録されます。
- このメッセージをCLUSTERPROの設定等で抑止する方法はありません。
ミラーディスクのアンマウントがタイムアウトしたとき
この場合は、ミラーディスクリソースのアンマウントがタイムアウトしたことを示すメッセージとともに、本メッセージが記録されます。
CLUSTERPRO の動作としては、ミラーディスクリソースの『非活性異常検出の復旧動作』がおこなわれます。また、ファイルシステムに不整合が発生している可能性があります。
- この詳細については、『6.5.3. 大量 I/O によるキャッシュ増大』を参照してください。
ミラーディスク非活性時にマウントされたままの状態となっている場合
この場合は、以下の流れの後に、上記のメッセージが記録されます。
ミラーディスクリソースが活性状態になった後、ユーザやアプリケーション(NFSなど)により、ミラーパーティションのデバイス(/dev/NMPx)やミラーディスクリソースのマウントポイント内に対して、追加でマウントを行った。
その後、1で追加されたマウントポイントをアンマウントしないまま、ミラーディスクリソースを非活性にした。
CLUSTERPRO の動作には影響ありませんが、ファイルシステムに不整合が発生している可能性があります。
- この詳細については、『6.5.4. ミラーディスクリソース等に複数のマウントをおこなった場合』を参照してください。
複数のミラーディスクリソースを設定している場合
2つ以上のミラーディスクリソースを設定している場合、活性時に、一部のディストリビューションにて fsck の挙動によって、上記のメッセージが出力されることがあります。
- この詳細については、『6.5.5. 複数のミラーディスクリソース、ハイブリッドディスクリソース使用時のsyslog メッセージについて』を参照してください。
その他、何らかのアプリケーションによりアクセスされたとき
上記以外のケースの場合、何らかのアプリケーションが非活性状態のミラーディスクリソースにアクセスしようとしたことが考えられます。
ミラーディスクリソースが活性していない状態であれば、CLUSTERPRO の動作には影響ありません。
6.5.3. 大量 I/O によるキャッシュ増大¶
- ミラーディスクリソースやハイブリッドディスクリソースに対してディスクの性能を上回る大量の書き込みを行うと、ミラーの通信が切断等されていないにもかかわらず、書き込みから制御が戻らないことや、メモリの確保エラーが発生することがあります。処理性能を上回る I/O 要求が大量にある場合、ファイルシステムがキャッシュを大量に確保して、キャッシュやユーザー空間用のメモリ (HIGHMEMゾーン) が不足すると、カーネル空間用のメモリ (NORMALゾーン) も使用されることがあります。このような場合には、下記のカーネルパラメータを変更して、カーネル空間用のメモリがキャッシュに利用されるのを抑制してください。sysctl コマンド等を使用して OS 起動時にパラメータが変更されるように設定してください。
/proc/sys/vm/lowmem_reserve_ratio
- ミラーディスクリソースやハイブリッドディスクリソースに対して大量のアクセスを行った場合、ディスクリソース非活性時のアンマウントにて、ファイルシステムのキャッシュがディスクへ書き出されるのに長い時間がかかることがあります。また、このとき、ファイルシステムからディスクへの書き出しが完了する前に、アンマウントタイムアウトが発生すると、下記の様な、I/Oエラーのメッセージや、アンマウント失敗のメッセージが記録されることがあります。このような場合には、ディスクへの書き出しが正常に完了するよう、該当ディスクリソースのアンマウントのタイムアウト時間を余裕を持った値に設定してください。
≪例1≫
clusterpro: [I] <type: rc><event: 40> Stopping mdx resource has started. kernel: [I] <type: liscal><event: 193> NMPx close I/O port OK. kernel: [I] <type: liscal><event: 195> NMPx close mount port OK. kernel: [I] <type: liscal><event: 144> NMPx I/O port has been closed, mount(0), io(0). kernel: [I] <type: liscal><event: 144> - This message can be recorded on hotplug service starting when NMPx is not active. kernel: [I] <type: liscal><event: 144> - This message can be recorded by fsck command when NMPx becomes active. kernel: [I] <type: liscal><event: 144> - Ignore this and following messages 'Buffer I/O error on device NMPx' on such environment. kernel: Buffer I/O error on device NMPx, logical block xxxxkernel: [I] <type: liscal><event: 144> NMPx I/O port has been closed, mount(0), io(0). kernel: Buffer I/O error on device NMPx, logical block xxxx :
≪例2≫
clusterpro: [I] <type: rc><event: 40> Stopping mdx resource has started. kernel: [I] <type: liscal><event: 148> NMPx holder 1. (before umount) clusterpro: [E] <type: md><event: 46> umount timeout. Make sure that the length of Unmount Timeout is appropriate. (Device:mdx) : clusterpro: [E] <type: md><event: 4> Failed to deactivate mirror disk. Umount operation failed.(Device:mdx) kernel: [I] <type: liscal><event: 148> NMPx holder 1. (after umount) clusterpro: [E] <type: rc><event: 42> Stopping mdx resource has failed.(83 : System command timeout (umount, timeout=xxx)) :
6.5.4. ミラーディスクリソース等に複数のマウントをおこなった場合¶
- ミラーディスクリソースやハイブリッドディスクリソースが活性した後に、そのミラーパーティションデバイス(/dev/NMPx)やマウントポイント(のファイル階層の一部)に対して、mount コマンドで別の場所にも追加でマウントした場合には、そのディスクリソースが非活性になる前に、必ずその追加したマウントポイントをアンマウントしてください。もしも、追加したマウントポイントをアンマウントしないままで非活性がおこなわれると、メモリ上に残っているファイルシステムのデータがディスクに完全には書き出されないことがあるため、ディスク上のデータが不完全な状態のままディスクへのI/Oが閉ざされ非活性が完了してしまいます。また、このとき、非活性後もファイルシステムがディスクへ書き込みをおこない続けようとするため、下記の様なI/Oエラーのメッセージが記録されることがあります。また、その後のサーバ停止時などで、ミラーエージェント停止の際にミラードライバを終了できずにミラーエージェントの停止に失敗して、サーバが再起動することがあります。
≪例≫
clusterpro: [I] <type: rc><event: 40> Stopping mdx resource has started. kernel: [I] <type: liscal><event: 148> NMP1 holder 1. (before umount) kernel: [I] <type: liscal><event: 148> NMP1 holder 1. (after umount) kernel: [I] <type: liscal><event: 193> NMPx close I/O port OK. kernel: [I] <type: liscal><event: 195> NMPx close mount port OK. clusterpro: [I] <type: rc><event: 41> Stopping mdx resource has completed. kernel: [I] <type: liscal><event: 144> NMPx I/O port has been closed, mount(0), io(0). kernel: [I] <type: liscal><event: 144> - This message can be recorded on hotplug service starting when NMPx is not active. kernel: [I] <type: liscal><event: 144> - This message can be recorded by fsck command when NMPx becomes active. kernel: [I] <type: liscal><event: 144> - Ignore this and following messages 'Buffer I/O error on device NMPx' on such environment. kernel: Buffer I/O error on device NMPx, logical block xxxxx kernel: lost page write due to I/O error on NMPx kernel: [I] <type: liscal><event: 144> NMPx I/O port has been closed, mount(0), io(0). kernel: Buffer I/O error on device NMPx, logical block xxxxx kernel: lost page write due to I/O error on NMPx :
6.5.5. 複数のミラーディスクリソース、ハイブリッドディスクリソース使用時のsyslog メッセージについて¶
kernel: [I] <type: liscal><event: 144> NMPx I/O port has been closed, mount(0), io(0). kernel: [I] <type: liscal><event: 144> - This message can be recorded by fsck command when NMPx becomes active. kernel: [I] <type: liscal><event: 144> - This message can be recorded on hotplug service starting when NMPx is not active. kernel: [I] <type: liscal><event: 144> - Ignore this and following messages 'Buffer I/O error on device NMPx' on such environment. kernel: Buffer I/O error on device /dev/NMPx, logical block xxxx
kernel: <liscal liscal_make_request> NMPx I/O port is close, mount(0), io(0). kernel: Buffer I/O error on device /dev/NMPx, logical block xxxx
CLUSTERPRO としては問題はありません。messages ファイルを圧迫するなどの問題がある場合にはミラーディスクリソース、ハイブリッドディスクリソースの以下の設定を変更してください。
Mount 実行前の fsck アクションを「実行しない」
Mount 失敗時の fsck アクションを「実行する」
6.5.6. ドライバロード時のメッセージについて¶
ミラードライバを load した際に、以下のようなメッセージがコンソール、syslog に表示されることがあります。この現象は異常ではありません。
kernel: liscal: no version for "xxxxx" found: kernel tainted. kernel: liscal: module license 'unspecified' taints kernel.
(xxxxx には任意の文字列が入ります)
同様に、clpka ドライバ, clpkhb ドライバを load した際に、以下のようなメッセージがコンソール、syslog に表示されることがあります。この現象は異常ではありません。
kernel: clpkhb: no version for "xxxxx" found: kernel tainted. kernel: clpkhb: module license 'unspecified' taints kernel.
kernel: clpka: no version for "xxxxx" found: kernel tainted. kernel: clpka: module license 'unspecified' taints kernel.
(xxxxx には任意の文字列が入ります)
6.5.7. ミラーディスクリソース、ハイブリッドディスクリソースへの最初の I/O 時のメッセージについて¶
ミラーディスクリソースやハイブリッドディスクリソースをマウント後の最初の read/write の際に、以下のようなメッセージがコンソール、syslog に表示されることがあります。この現象は異常ではありません。
kernel: JBD: barrier-based sync failed on NMPx - disabling barriers (x には任意の数字が入ります)
6.5.8. X-Window 上のファイル操作ユーティリティについて¶
X-Window 上で動作する一部のファイル操作ユーティリティ (GUI でファイルやディレクトリのコピーや移動などの操作を行うもの) に以下の挙動をするものがあります。
ブロックデバイスが使用可能であるかサーチする
サーチの結果、マウントが可能なファイルシステムがあればマウントする
6.5.9. ipmi のメッセージについて¶
ユーザ空間モニタリソースに IPMI を使用する場合、syslog に下記の kernel モジュール警告ログが多数出力されます。
modprobe: modprobe: Can't locate module char-major-10-173
このログ出力を回避したい場合は、/dev/ipmikcs を rename してください。
6.5.10. 回復動作中の操作制限¶
モニタリソースの異常検出時の設定で回復対象にグループリソース (ディスクリソース、EXECリソース、...) を指定し、モニタリソースが異常を検出した場合の回復動作遷移中 (再活性化 → フェイルオーバ → 最終動作) には、以下のコマンドまたは、Cluster WebUI からのクラスタ及びグループへの制御は行わないでください。
クラスタの停止 / サスペンド
グループの開始 / 停止 / 移動
6.5.11. コマンド編に記載されていない実行形式ファイルやスクリプトファイルについて¶
6.5.12. fsck の実行について¶
- ディスクリソース/ミラーディスクリソース/ハイブリッドディスクリソースの活性時に fsckを実行するよう設定している場合、ext2/ext3/ext4 ファイルシステムを mount する際に、設定に応じて fsck が実行されます。しかし、ファイルシステムのサイズや使用量、実行状況によっては、fsck に時間がかかり、fsck のタイムアウトを超過してマウントが失敗することがあります。これは、fsck の実行に下記の様なパターンがあるためです。
- ジャーナルのチェックのみを簡易的に行うパターン。短時間で完了します。
- ファイルシステム全体の整合性チェックを行うパターン。OS で保持している情報「180 日以上チェックしていない」や「30 回 (前後の)マウント後に行う」に該当した場合。ファイルシステムのサイズや使用量などによっては長い時間を要します。
このような場合には、タイムアウトが発生しないよう、該当するディスクリソースの fsck タイムアウト時間を余裕を持った設定にしてください。 ディスクリソース/ミラーディスクリソース/ハイブリッドディスクリソースの活性時に fsckを実行しないよう設定している場合、ext2/ext3/ext4 ファイルシステムを mount する際に、OSで保持している fsck 実行推奨 mount 回数等を超過すると、システムログやコンソールに以下の警告が出力されることがあります。
EXT3-fs warning: xxxxx, running e2fsck is recommended (注) xxxxx の部分は複数のパターンがあります。
この警告が出力された場合、ファイルシステムに対してfsckを実行することを推奨します。
fsck を手動で実行する場合は、以下の手順で行ってください。なお、以下の手順は必ず、該当ディスクリソースが活性しているサーバ上にて実行してください。該当ディスクリソースが所属するグループを、clpgrp コマンド等で非活性にしてください。
ディスクが mount されていないことを、mount コマンドや df コマンドを使用して確認します。
該当ディスクリソースの種類に応じて、以下の該当するコマンドを実行してディスクを Read Only から Read Write の状態にします。
(ディスクリソースの場合の例) デバイス名が /dev/sdb5 の場合
# clproset -w -d /dev/sdb5 /dev/sdb5 : success
(ミラーディスクリソースの場合の例) リソース名が md1 の場合
# clpmdctrl --active -nomount md1 <md1@server1>: active successfully
(ハイブリッドディスクリソースの場合の例) リソース名が hd1 の場合
# clphdctrl --active -nomount hd1 <hd1@server1>: active successfully
- fsck を実行します。(ミラーディスクリソースやハイブリッドディスクリソースの場合、fsckにデバイス名を指定する場合には、そのリソースに対応するミラーパーティションデバイス名(/dev/NMPx)を指定してください。)
該当ディスクリソースの種類に応じて、以下の該当するコマンドを実行して、ディスクを Read Write から Read Only の状態にします。
(ディスクリソースの場合の例) デバイス名が /dev/sdb5 の場合
# clproset -o -d /dev/sdb5 /dev/sdb5 : success
(ミラーディスクリソースの場合の例) リソース名が md1 の場合
# clpmdctrl --deactive md1 <md1@server1>: deactive successfully
(ハイブリッドディスクリソースの場合の例) リソース名が hd1 の場合
# clphdctrl --deactive hd1 <hd1@server1>: deactive successfully
該当ディスクリソースが所属するグループを、clpgrp コマンド等で活性にしてください。
もしも、fsck を実行することなしに警告を出力しないようにする必要がある場合には、ext2, ext3,ext4 の場合、最大 mount 回数の変更を tune2fs コマンドを使用して、該当ディスクリソースが活性しているサーバ上にて実行してください。
以下のコマンドを実行してください。
(ディスクリソースの場合の例) デバイス名が /dev/sdb5 の場合
# tune2fs -c -1 /dev/sdb5 tune2fs 1.42.9 (28-Dec-2013) Setting maximal mount count to -1
(ミラーディスクリソースの場合の例) ミラーパーティションデバイス名が /dev/NMP1 の場合
# tune2fs -c -1 /dev/NMP1 tune2fs 1.42.9 (28-Dec-2013) Setting maximal mount count to -1
(ハイブリッドディスクリソースの場合の例) ミラーパーティションデバイス名が /dev/NMP1 の場合
# tune2fs -c -1 /dev/NMP1 tune2fs 1.42.9 (28-Dec-2013) Setting maximal mount count to -1
最大 mount 回数が変更されたことを確認してください。
(例) デバイス名が /dev/sdb5 の場合
# tune2fs -l /dev/sdb5 tune2fs 1.42.9 (28-Dec-2013) Filesystem volume name: <none> : Maximum mount count: -1 :
6.5.13. xfs_repair の実行について¶
xfsを使用しているディスクリソース/ミラーディスクリソース/ハイブリッドディスクリソースの活性時に、xfsに関する警告がコンソールに出力される場合は、xfs_repairを実行してファイルシステムを修復することを推奨します。
xfs_repiarは、以下の手順で実行してください。
リソースが活性していないことを確認してください。活性している場合は、Cluster WebUIなどで非活性状態にしてください。
デバイスを書き込み可能にします。
(ディスクリソースの例) デバイス名が /dev/sdb1である場合
# clproset -w -d /dev/sdb1 /dev/sdb1 : success(ミラーディスクリソースの例) リソース名がmd1の場合
# clpmdctrl --active -nomount md1 <md1@server1>: active successfully(ハイブリッドディスクリソースの例) リソース名がhd1の場合
# clphdctrl --active -nomount hd1 <hd1@server1>: active successfullyデバイスをマウントします。
(ディスクリソースの例) デバイス名が /dev/sdb1である場合
# mount /dev/sdb1 /mnt
(ミラーディスクリソース/ハイブリッドディスクリソースの例) ミラーパーティションデバイス名が /dev/NMP1 の場合
# mount /dev/NMP1 /mnt
デバイスをアンマウントします。
# umount /mnt
注釈
xfs_repair ユーティリティは、ダーティログを持つファイルシステムを修復できません。ログをクリアするために、一度マウントしてアンマウントする処置が必要となります。
xfs_repair を実行します。
(ディスクリソースの例) デバイス名が /dev/sdb1である場合
# xfs_repair /dev/sdb1
(ミラーディスクリソース/ハイブリッドディスクリソースの例) ミラーパーティションデバイス名が /dev/NMP1 の場合
# xfs_repair /dev/NMP1
デバイスを書き込み禁止にします。
(ディスクリソースの例) デバイス名が /dev/sdb1である場合
# clproset -o -d /dev/sdb1 /dev/sdb1 : success(ミラーディスクリソースの例) リソース名がmd1の場合
# clpmdctrl --deactive md1 <md1@server1>: deactive successfully(ハイブリッドディスクリソースの例) リソース名がhd1の場合
# clphdctrl --deactive hd1 <hd1@server1>: deactive successfully
以上で、xfsファイルシステムの修復は終了です。
6.5.14. ログ収集時のメッセージ¶
ログ収集を実行した場合、コンソールに以下のメッセージが表示されることがありますが、異常ではありません。ログは正常に収集されています。なお、以下のメッセージはiptables コマンドが出力しているものでありCLUSTERPROから抑制することはできません。
hd#: bad special flag: 0x03 ip_tables: (C) 2000-2002 Netfilter core team
(hd# にはサーバ上に存在する IDE のデバイス名が入ります)
kernel: Warning: /proc/ide/hd?/settings interface is obsolete, and will be removed soon!
6.5.15. ミラー復帰中のフェイルオーバや活性について¶
- ミラーディスクリソースやハイブリッドディスクリソースがミラー復帰中の状態の時には、非活性状態のミラーディスクリソースやハイブリッドディスクリソースを活性できません。ミラー復帰中に、該当ディスクリソースを含むフェイルオーバグループの移動はできません。ミラー復帰中に、フェイルオーバが発生した場合、コピー先のサーバが最新の状態を保持していないため、コピー先サーバやコピー先サーバグループへのフェイルオーバに失敗します。また、モニタリソース異常検出時の動作等によって、ハイブリッドディスクリソースが同じサーバグループ内のサーバへフェイルオーバする場合も、カレント権が移動せずフェイルオーバに失敗します。なお、タイミングによってフェイルオーバ中や移動中や活性中にミラー復帰が終了した場合には、成功することがあります。
- 構成情報登録後の最初のミラー起動時や、障害発生等でミラー用のディスクを交換した後の最初のミラー起動時には、初期ミラー構築がおこなわれます。初期ミラー構築では、ミラー活性直後に現用系サーバ側から、待機系サーバ側のミラー用ディスクへ、ディスクのコピー(全面ミラー復帰)がおこなわれます。この初期ミラー構築(全面ミラー復帰)が完了してミラーが正常な同期状態になるまでは、待機系へのフェイルオーバや待機系へのグループ移動をおこなわないでください。このディスクのコピー途中でフェイルオーバやグループ移動を行うと、待機系のミラーディスクが不完全な状態のままで待機系で活性してしまい、待機系へコピーされていないデータが失われたり、ファイルシステムに不整合が発生したりする可能性があります。
6.5.16. クラスタシャットダウン・クラスタシャットダウンリブート(ミラーディスクリソース、ハイブリッドディスクリソース)¶
6.5.17. 特定サーバのシャットダウン、リブート (ミラーディスクリソース、ハイブリッドディスクリソース)¶
6.5.18. サービス起動/停止用スクリプトについて¶
init.d 環境では以下の場合に、サービスの起動/停止スクリプトでエラーが出力されます。systemd環境ではエラーは出力されません。
- クラスタ構築前OS 起動時に下記のサービス起動スクリプトでエラーが出力されます。クラスタ未構築が原因で出力されるエラーのため問題はありません。
clusterpro_md
- 以下の場合に、サービスの停止スクリプトが不正な順序で実行されます。サービスを無効化した後の OS シャットダウンCLUSTERPRO のサービスを無効化した後、OS シャットダウン時に CLUSTERPROのサービスが不正な順序で停止されます。OS シャットダウン時に無効化したCLUSTERPRO のサービスが停止されないことが原因で発生します。Cluster WebUI から実行するクラスタシャットダウンや、clpstdn コマンドなどCLUSTERPRO のコマンドを使用してのクラスタシャットダウンの場合は不正な順序で停止されても問題ありません。
6.5.19. サービス起動時間について¶
CLUSTERPRO の各サービスは、起動時の待ち合わせ処理の有無により時間がかかる場合があります。
- clusterpro_evtマスタサーバ以外のサーバは、マスタサーバの構成情報をダウンロードする処理を最大 2 分間待ち合わせます。マスタサーバが起動済みの場合、通常数秒以内に終了します。マスタサーバはこの処理で待ち合わせは発生しません。
- clusterpro_trn特に待ち合わせ処理はありません。通常数秒以内に終了します。
- clusterpro_ib特に待ち合わせ処理はありません。通常数秒以内に終了します。
- clusterpro_api特に待ち合わせ処理はありません。通常数秒以内に終了します。
- clusterpro_mdミラーディスクリソースもしくはハイブリッドディスクリソースが存在する場合のみ、本サービスが起動します。ミラーエージェントが正常に起動するのを最長 1 分間待ち合わせます。通常数秒以内に終了します。
- clusterpro特に待ち合わせ処理はありませんが、CLUSTERPRO の起動に時間がかかる場合数十秒かかります。通常数秒以内に終了します。
- clusterpro_webmgr特に待ち合わせ処理はありません。通常数秒以内に終了します。
- clusterpro_alertsync特に待ち合わせ処理はありません。通常数秒以内に終了します。
6.5.20. systemd 環境でのサービス状態確認について¶
6.5.21. EXEC リソースで使用するスクリプトファイルについて¶
EXEC リソースで使用するスクリプトファイルは各サーバ上の下記のディレクトリに配置されます。
/インストールパス/scripts/グループ名/EXECリソース名/
クラスタ構成変更時に下記の変更を行った場合、変更前のスクリプトファイルはサーバ上からは削除されません。
EXEC リソースを削除した場合や EXEC リソース名を変更した場合
EXEC リソースが所属するグループを削除した場合やグループ名を変更した場合
変更前のスクリプトファイルが必要ない場合は、削除しても問題ありません。
6.5.22. 活性時監視設定のモニタリソースについて¶
活性時監視設定のモニタリソースの一時停止/再開には下記の制限事項があります。
モニタリソースの一時停止後、監視対象リソースを停止させた場合モニタリソースは 停止状態となります。そのため、監視の再開はできません。
モニタリソースを一時停止後、監視対象リソースを停止/起動させた場合、監視対象リソースが起動したタイミングで、モニタリソースによる監視が開始されます。
6.5.23. Cluster WebUI について¶
接続先と通信できない状態で操作を行うと、制御が戻ってくるまでしばらく時間が必要な場合があります。
Proxy サーバを経由する場合は、Cluster WebUI のポート番号を中継できるように、Proxy サーバの設定をしてください。
Reverse Proxy サーバを経由する場合、Cluster WebUI は正常に動作しません。
- CLUSTERPRO のアップデートを行った場合、起動している全てのブラウザを一旦終了してください。ブラウザ側のキャッシュをクリアして、ブラウザを起動してください。
本製品より新しいバージョンで作成されたクラスタ構成情報は、本製品で利用することはできません。
Web ブラウザを終了すると (ウィンドウフレームの [X] 等)、確認ダイアログが表示される場合があります。
設定を続行する場合は [ページに留まる] を選択してください。
Web ブラウザをリロードすると (メニューの [最新の情報に更新] やツールバーの [現在のページを再読み込み] 等)、確認ダイアログが表示される場合があります。
設定を続行する場合は [ページに留まる] を選択してください。
上記以外の Cluster WebUI の注意制限事項についてはオンラインマニュアルを参照してください。
6.5.24. ミラーディスク、ハイブリッドディスクリソースのパーティションサイズ変更¶
運用を開始した後で、ミラーパーティションのサイズを変更したい場合は、『メンテナンスガイド』の「保守情報」の「ミラーディスクリソースのパーティションのオフセットやサイズを変更する」を参照してください。
6.5.25. カーネルダンプの設定変更について¶
- Red Hat Enterprise Linux 6 等にて、クラスタが稼働している状態で、「カーネルダンプの設定」 (system-config-kdump) で kdump の設定を変更して「適用」しようとすると、以下の様なエラーメッセージが出る場合があります。この様な場合は一旦、クラスタの停止(ミラーディスクリソースやハイブリッドディスクリソースを使用している場合には、クラスタの停止とミラーエージェントの停止)をおこなってから、カーネルダンプの設定を実行してください。※ 下記の {ドライバ名} の部分は、clpka, clpkhb, liscal のいずれかになります。
No module {ドライバ名} found for kernel {カーネルバージョン}, aborting
6.5.26. フローティング IP、仮想 IP リソースについて¶
フローティング IP リソースまたは仮想 IP リソースを設定している場合、これらのリソースが活性しているサーバでネットワーク再起動は実行しないでください。ネットワークを再起動すると各リソースによって追加された IP アドレスが削除されます。
6.5.27. システムモニタリソース、プロセスリソースモニタリソースについて¶
設定内容の変更時にはクラスタサスペンドを行う必要があります。
モニタリソースの遅延警告には対応していません。
- SELinux の設定は permissive または disabled にしてください。enforcing に設定すると CLUSTERPRO で必要な通信が行えない場合があります。
動作中に OS の日付/時刻を変更した場合、10分間隔で行っている解析処理のタイミングが日付/時刻変更後の最初の一回だけずれてしまいます。以下のようなことが発生するため、必要に応じてクラスタのサスペンド・リジュームを行ってください。
異常として検出する経過時間を過ぎても、異常検出が行われない。
異常として検出する経過時間前に、異常検出が行われる。
システムモニタリソースのディスクリソース監視機能で同時に監視できる最大のディスク数は64台です。
6.5.28. JVM モニタリソースについて¶
監視対象のJava VMを再起動する場合はクラスタサスペンドするか、クラスタ停止を行った後に行ってください。
設定内容の変更時にはクラスタサスペンドを行う必要があります。
モニタリソースの遅延警告には対応していません。
6.5.29. HTTP モニタリソースについて¶
HTTPモニタリソースでは以下いずれかのOpenSSLの共有ライブラリのシンボリックリンクを利用しています。
libssl.so
libssl.so.1.1 (OpenSSL 1.1.1 の共有ライブラリ)
libssl.so.10 (OpenSSL 1.0の共有ライブラリ)
- libssl.so.6 (OpenSSL 0.9の共有ライブラリ)
OSのディストリビューションやバージョン、およびパッケージのインストール状況によっては、上記のシンボリックリンクが存在しない場合があります。HTTP モニタリソースでは、上記のシンボリックリンクが見つけられない場合は、以下のようなエラーが発生します。Detected an error in monitoring <Monitor Resource Name>. (1 :Can not found library. (libpath=libssl.so, errno=2))
このため、上記のエラーが発生した場合は、/usr/lib または /usr/lib64 配下などに上記のシンボリックリンクが存在しているか確認をお願いします。また、上記のシンボリックリンクが存在しない場合は、下記のコマンド例のようにシンボリックリンク libssl.so を作成頂きますようお願いします。
コマンド例:cd /usr/lib64 # /usr/lib64 へ移動 ln -s libssl.so.1.0.1e libssl.so # シンボリックリンクの作成
6.5.30. AWS 環境における AMI のリストアについて¶
AWS 仮想 IP リソースや AWS Elastic IP リソースの [ENI ID] にプライマリネットワークインターフェイスの ENI ID を設定している場合、AMI などからのリストア時には、AWS 仮想 IP リソースや AWS Elastic IP リソースの設定を変更する必要があります。なお、セカンダリネットワークインターフェイスの ENI ID を設定している場合、AMI などからのリストア時にはデタッチ/アタッチ処理によって同一 ENI ID の引き継ぎが可能なため、AWS 仮想 IP リソースや AWS Elastic IP リソースの再設定は不要です。
6.6. CLUSTERPROの構成変更時¶
クラスタとして運用を開始した後に構成を変更する場合に発生する事象で留意して頂きたい事項です。
6.6.1. グループ共通プロパティの排他ルールについて¶
6.6.2. リソースプロパティの依存関係について¶
6.6.3. グループリソースの追加、削除について¶
例) フローティングIPリソース fip1 をグループ failover1 から別のグループ failover2 に移す場合
グループ failover1 から fip1 を削除します。
設定の反映を行います。
fip1 をグループ failover2 へ追加します。
設定の反映を行います。
6.6.4. ディスクリソースの削除について¶
ディスクリソースを削除した場合、該当デバイスが Read Only となることがあります。
clprosetコマンドを使用して該当デバイスを Read Write の状態にしてください。
6.6.5. 外部連携モニタリソースのクラスタ統計情報の設定について¶
モニタリソースのクラスタ統計情報の設定を変更した場合、サスペンド・リジュームを実行しても外部連携モニタリソースにはクラスタ統計情報の設定が反映されません。外部連携モニタリソースにもクラスタ統計情報の設定を反映させる場合は、OS の再起動を行ってください。
6.7. CLUSTERPROバージョンアップ時¶
クラスタとして運用を開始した後にCLUSTERPRO をバージョンアップする際に留意して頂きたい事項です。
6.7.1. 機能変更一覧¶
各バージョンで変更された機能について、以下に示します。
内部バージョン 4.0.0-1
管理ツールについて既定の管理ツールを Cluster WebUI に変更しました。従来の WebManager をご利用の場合は、http://管理用グループの管理IPアドレスまたは CLUSTERPRO Server をインストールしたサーバの実IPアドレス:ポート番号 (既定値29003)/main.htm を Web ブラウザに指定してください。 ミラーディスクリソース/ハイブリッドディスクリソースについてクラスタパーティションの最低サイズが1GiBとなっています。アップグレード時には、十分なサイズのクラスタパーティションを事前にご準備ください。
内部バージョン 4.1.0-1
設定ツールについて既定の設定ツールを Cluster WebUI に変更しました。Cluster WebUI によるクラスタの管理および設定を可能にしました。 非同期モードのミラーディスクリソース/ハイブリッドディスクリソースについて非同期モードでは、送信キューが溢れた場合もミラーブレイク状態とせず、溢れた分を履歴ファイルとして一時的に書き出すようになりました。この機能強化に伴い、以下の設定値の入力が必要です。
履歴ファイル格納ディレクトリ
履歴ファイルサイズ制限
※アップデート直後はこれらの設定値は空白となっています。この場合、「履歴ファイル格納ディレクトリ」はCLUSTERPROをインストールしたディレクトリ、「履歴ファイルサイズ制限」は無制限として取り扱います。
本設定値については『リファレンスガイド』の「グループリソースの詳細」、「ミラーディスクリソースを理解する」を参照してください。
システムモニタリソースについて
システムモニタリソース内で設定していた「System Resource Agent プロセス設定」 部分を新規モニタリソースとして分離しました。「System Resource Agent プロセス設定」で監視設定を行っている場合、本監視の設定は無効となります。アップデート後も本監視を継続する場合は、アップデート後に新規にプロセスリソースモニタリソースを登録し、監視設定を行ってください。プロセスリソースモニタリソースの監視設定の詳細は『リファレンスガイド』の「モニタリソースの詳細」、「プロセスリソースモニタリソースを理解する」を参照してください。
内部バージョン 4.2.0-1
AWS AZ モニタリソースについてAWS CLI を使って取得できるAZの状態が available の場合は正常、information や impaired の場合は警告、unavailable の場合は異常に変更しました。以前は AWS CLI を使って取得できるAZの状態が available 以外の場合、異常でした。
6.7.3. パラメータ削除一覧¶
Cluster WebUI で設定可能なパラメータのうち、各バージョンで削除されたものについて、以下の表に示します。
内部バージョン 4.0.0-1
クラスタ
パラメータ
既定値
クラスタのプロパティ
アラートサービスタブ
アラート拡張機能を使用する
オフ
WebManager タブ
WebManager Mobile の接続を許可する
オフ
WebManager Mobile 用パスワード
操作用パスワード
-
参照用パスワード
-
JVM モニタリソース
パラメータ
既定値
JVMモニタリソースのプロパティ
監視 (固有) タブ
メモリタブ ([JVM種別]に [Oracle Java]選択時)
仮想メモリ使用量を監視する
2048 [メガバイト]
メモリタブ ([JVM種別]に [Oracle JRockit]選択時)
仮想メモリ使用量を監視する
2048 [メガバイト]
メモリタブ ([JVM種別]に [Oracle Java(usage monitoring)]選択時)
仮想メモリ使用量を監視する
2048 [メガバイト]
内部バージョン 4.1.0-1
クラスタ
パラメータ
既定値
クラスタのプロパティ
WebManager タブ
WebManager 調整プロパティ
動作タブ
アラートビューア最大レコード数
300
クライアントデータ更新方法
Real Time
6.7.4. 既定値変更一覧¶
Cluster WebUI で設定可能なパラメータのうち、各バージョンで既定値が変更されたものについて、以下の表に示します。
バージョンアップ後も [変更前の既定値] の設定を継続したい場合は、バージョンアップ後に改めてその値に再設定してください。
[変更前の既定値] 以外の値を設定していた場合、バージョンアップ後もそれ以前の設定値が継承されます。再設定の必要はありません。
内部バージョン 4.0.0-1
クラスタ
パラメータ
変更前の既定値
変更後の既定値
クラスタのプロパティ
監視タブ
監視方法
softdog
keepalive
JVM監視タブ
最大Javaヒープサイズ
7[MB]
16[MB]
Execリソース
パラメータ
変更前の既定値
変更後の既定値
Exec リソースのプロパティ
依存関係タブ
既定の依存関係に従う
オン・フローティング IP リソース・仮想 IP リソース・ディスクリソース・ミラーディスクリソース・ハイブリッドディスクリソース・NAS リソース・ダイナミック DNS リソース・ボリュームマネージャリソース・AWS Elastic IPリソース・AWS 仮想IPリソース・Azure プローブポートリソース オン・フローティング IP リソース・仮想 IP リソース・ディスクリソース・ミラーディスクリソース・ハイブリッドディスクリソース・NAS リソース・ダイナミック DNS リソース・ボリュームマネージャリソース・AWS Elastic IPリソース・AWS 仮想IPリソース・AWS DNS リソース・Azure プローブポートリソース・Azure DNS リソースディスクリソース
パラメータ
変更前の既定値
変更後の既定値
ディスクリソースのプロパティ
依存関係タブ
既定の依存関係に従う
オン・フローティング IP リソース・仮想 IP リソース・ダイナミック DNS リソース・ボリュームマネージャリソース・AWS Elastic IPリソース・AWS 仮想IPリソース・Azure プローブポートリソース オン・フローティング IP リソース・仮想 IP リソース・ダイナミック DNS リソース・ボリュームマネージャリソース・AWS Elastic IPリソース・AWS 仮想IPリソース・AWS DNS リソース・Azure プローブポートリソース・Azure DNS リソース詳細タブ
ディスクリソース調整プロパティ
マウントタブ
タイムアウト
60 [秒]
180 [秒]
xfs_repair タブ([ファイルシステム]に[xfs]選択時)
Mount 失敗時の xfs_repair アクション実行するオン
オフ
NAS リソース
パラメータ
変更前の既定値
変更後の既定値
NAS リソースのプロパティ
依存関係タブ
既定の依存関係に従う
オン・フローティング IP リソース・仮想 IP リソース・ダイナミック DNS リソース・AWS Elastic IPリソース・AWS 仮想IPリソース・Azure プローブポートリソース オン・フローティング IP リソース・仮想 IP リソース・ダイナミック DNS リソース・AWS Elastic IPリソース・AWS 仮想IPリソース・AWS DNS リソース・Azure プローブポートリソース・Azure DNS リソースミラーディスクリソース
パラメータ
変更前の既定値
変更後の既定値
ミラーディスクリソースのプロパティ
依存関係タブ
既定の依存関係に従う
オン・フローティング IP リソース・仮想 IP リソース・AWS Elastic IPリソース・AWS 仮想IPリソース・Azure プローブポートリソース オン・フローティング IP リソース・仮想 IP リソース・AWS Elastic IPリソース・AWS 仮想IPリソース・AWS DNS リソース・Azure プローブポートリソース・Azure DNS リソース詳細タブ
ミラーディスクリソース調整プロパティ
xfs_repair タブ([ファイルシステム]に[xfs]選択時)
Mount 失敗時の xfs_repair アクション実行するオン
オフ
ハイブリッドディスクリソース
パラメータ
変更前の既定値
変更後の既定値
ハイブリッドディスクリソースのプロパティ
依存関係タブ
既定の依存関係に従う
オン・フローティング IP リソース・仮想 IP リソース・AWS Elastic IPリソース・AWS 仮想IPリソース・Azure プローブポートリソース オン・フローティング IP リソース・仮想 IP リソース・AWS Elastic IPリソース・AWS 仮想IPリソース・AWS DNS リソース・Azure プローブポートリソース・Azure DNS リソース詳細タブ
ハイブリッドディスクリソース調整プロパティ
xfs_repair タブ([ファイルシステム]に[xfs]選択時)
Mount 失敗時の xfs_repair アクション実行するオン
オフ
ボリュームマネージャリソース
パラメータ
変更前の既定値
変更後の既定値
ボリュームマネージャリソースのプロパティ
依存関係タブ
既定の依存関係に従う
オン・フローティング IP リソース・仮想 IP リソース・ダイナミック DNS リソース・AWS Elastic IPリソース・AWS 仮想IPリソース・Azure プローブポートリソース オン・フローティング IP リソース・仮想 IP リソース・ダイナミック DNS リソース・AWS Elastic IPリソース・AWS 仮想IPリソース・AWS DNS リソース・Azure プローブポートリソース・Azure DNS リソース
仮想IPモニタリソース
パラメータ
変更前の既定値
変更後の既定値
仮想 IP モニタリソースのプロパティ
監視 (共通) タブ
タイムアウト
30 [秒]
180 [秒]
PIDモニタリソース
パラメータ
変更前の既定値
変更後の既定値
PIDモニタリソースのプロパティ
監視 (共通) タブ
監視開始待ち時間
0 [秒]
3 [秒]
タイムアウト発生時にリトライしない
オフ
オン
タイムアウト発生時に回復動作を実行しない
オフ
オン
ユーザ空間モニタリソース
パラメータ
変更前の既定値
変更後の既定値
ユーザ空間モニタリソースのプロパティ
監視 (固有) タブ
監視方法
softdog
keepalive
NIC Link Up/Downモニタリソース
パラメータ
変更前の既定値
変更後の既定値
NIC Link Up/Down モニタリソースのプロパティ
監視 (共通) タブ
タイムアウト
60 [秒]
180 [秒]
タイムアウト発生時にリトライしない
オフ
オン
タイムアウト発生時に回復動作を実行しない
オフ
オン
ARPモニタリソース
パラメータ
変更前の既定値
変更後の既定値
ARP モニタリソースのプロパティ
監視 (共通) タブ
タイムアウト発生時にリトライしない
オフ
オン
タイムアウト発生時に回復動作を実行しない
オフ
オン
ダイナミック DNS モニタリソース
パラメータ
変更前の既定値
変更後の既定値
ダイナミックDNSモニタリソースのプロパティ
監視 (共通) タブ
タイムアウト
100 [秒]
180 [秒]
プロセス名モニタリソース
パラメータ
変更前の既定値
変更後の既定値
プロセス名モニタリソースのプロパティ
監視 (共通) タブ
監視開始待ち時間
0 [秒]
3 [秒]
タイムアウト発生時にリトライしない
オフ
オン
タイムアウト発生時に回復動作を実行しない
オフ
オン
DB2モニタリソース
パラメータ
変更前の既定値
変更後の既定値
DB2 モニタリソースのプロパティ
監視 (固有) タブ
パスワード
ibmdb2
-
ライブラリパス
/opt/IBM/db2/V8.2/lib/libdb2.so
/opt/ibm/db2/V11.1/lib64/libdb2.so
MySQL モニタリソース
パラメータ
変更前の既定値
変更後の既定値
MySQL モニタリソースのプロパティ
監視 (固有) タブ
ストレージエンジン
MyISAM
InnoDB
ライブラリパス
/usr/lib/mysql/libmysqlclient.so.15
/usr/lib64/mysql/libmysqlclient.so.20
Oracle モニタリソース
パラメータ
変更前の既定値
変更後の既定値
Oracle モニタリソースのプロパティ
監視 (固有) タブ
パスワード
change_on_install
-
ライブラリパス
/opt/app/oracle/product/10.2.0/db_1/lib/libclntsh.so.10.1
/u01/app/oracle/product/12.2.0/dbhome_1/lib/libclntsh.so.12.1
PostgreSQL モニタリソース
パラメータ
変更前の既定値
変更後の既定値
PostgreSQL モニタリソースのプロパティ
監視 (固有) タブ
ライブラリパス
/usr/lib/libpq.so.3.0
/opt/PostgreSQL/10/lib/libpq.so.5.10
Sybase モニタリソース
パラメータ
変更前の既定値
変更後の既定値
Sybase モニタリソースのプロパティ
監視 (固有) タブ
ライブラリパス
/opt/sybase/OCS-12_5/lib/libsybdb.so
/opt/sap/OCS-16_0/lib/libsybdb64.so
Tuxedoモニタリソース
パラメータ
変更前の既定値
変更後の既定値
Tuxedo モニタリソースのプロパティ
監視 (固有) タブ
ライブラリパス
/opt/bea/tuxedo8.1/lib/libtux.so
/home/Oracle/tuxedo/tuxedo12.1.3.0.0/lib/libtux.so
Weblogic モニタリソース
パラメータ
変更前の既定値
変更後の既定値
Weblogic モニタリソースのプロパティ
監視 (固有) タブ
ドメイン環境ファイル
/opt/bea/weblogic81/samples/domains/examples/setExamplesEnv.sh
/home/Oracle/product/Oracle_Home/user_projects/domains/base_domain/bin/setDomainEnv.sh
JVM モニタリソース
パラメータ
変更前の既定値
変更後の既定値
JVMモニタリソースのプロパティ
監視 (共通)タブ
タイムアウト
120 [秒]
180 [秒]
フローティングIP モニタリソース
パラメータ
変更前の既定値
変更後の既定値
フローティングIP モニタリソースのプロパティ
監視 (共通) タブ
タイムアウト
60 [秒]
180 [秒]
タイムアウト発生時にリトライしない
オフ
オン
タイムアウト発生時に回復動作を実行しない
オフ
オン
AWS Elastic IP モニタリソース
パラメータ
変更前の既定値
変更後の既定値
AWS Elastic IPモニタリソースのプロパティ
監視 (共通) タブ
タイムアウト
100 [秒]
180 [秒]
タイムアウト発生時にリトライしない
オフ
オン
タイムアウト発生時に回復動作を実行しない
オフ
オン
AWS 仮想 IP モニタリソース
パラメータ
変更前の既定値
変更後の既定値
AWS 仮想IPモニタリソースのプロパティ
監視 (共通) タブ
タイムアウト
100 [秒]
180 [秒]
タイムアウト発生時にリトライしない
オフ
オン
タイムアウト発生時に回復動作を実行しない
オフ
オン
AWS AZ モニタリソース
パラメータ
変更前の既定値
変更後の既定値
AWS AZモニタリソースのプロパティ
監視 (共通) タブ
タイムアウト
100 [秒]
180 [秒]
タイムアウト発生時にリトライしない
オフ
オン
タイムアウト発生時に回復動作を実行しない
オフ
オン
Azure プローブポートモニタリソース
パラメータ
変更前の既定値
変更後の既定値
Azure プローブポートモニタリソースのプロパティ
監視 (共通) タブ
タイムアウト
100 [秒]
180 [秒]
タイムアウト発生時にリトライしない
オフ
オン
タイムアウト発生時に回復動作を実行しない
オフ
オン
Azure ロードバランスモニタリソース
パラメータ
変更前の既定値
変更後の既定値
Azure ロードバランスモニタリソースのプロパティ
監視 (共通) タブ
タイムアウト
100 [秒]
180 [秒]
タイムアウト発生時にリトライしない
オフ
オン
タイムアウト発生時に回復動作を実行しない
オフ
オン
内部バージョン 4.1.0-1
クラスタ
パラメータ
変更前の既定値
変更後の既定値
クラスタのプロパティ
監視タブ
シャットダウン監視
常に実行する
グループ非活性処理に失敗した場合のみ実行する
内部バージョン 4.2.0-1
AWS Elastic IP モニタリソース
パラメータ
変更前の既定値
変更後の既定値
AWS Elastic IPモニタリソースのプロパティ
監視 (固有) タブ
AWS CLI コマンド応答取得失敗時動作
回復動作を実行しない(警告を表示する)
回復動作を実行しない(警告を表示しない)
AWS 仮想 IP モニタリソース
パラメータ
変更前の既定値
変更後の既定値
AWS 仮想 IPモニタリソースのプロパティ
監視 (固有) タブ
AWS CLI コマンド応答取得失敗時動作
回復動作を実行しない(警告を表示する)
回復動作を実行しない(警告を表示しない)
AWS AZ モニタリソース
パラメータ
変更前の既定値
変更後の既定値
AWS AZモニタリソースのプロパティ
監視 (固有) タブ
AWS CLI コマンド応答取得失敗時動作
回復動作を実行しない(警告を表示する)
回復動作を実行しない(警告を表示しない)
AWS DNS モニタリソース
パラメータ
変更前の既定値
変更後の既定値
AWS DNS モニタリソースのプロパティ
監視 (固有) タブ
AWS CLI コマンド応答取得失敗時動作
回復動作を実行しない(警告を表示する)
回復動作を実行しない(警告を表示しない)
6.7.5. パラメータ移動一覧¶
Cluster WebUI で設定可能なパラメータのうち、各バージョンで設定箇所が変更されたものについて、以下の表に示します。
変更前の設定箇所 |
変更後の設定箇所 |
---|---|
[クラスタのプロパティ]-[リカバリタブ]-[最大再起動回数] |
[クラスタのプロパティ]-[拡張タブ]-[最大再起動回数] |
[クラスタのプロパティ]-[リカバリタブ]-[最大再起動回数をリセットする時間] |
[クラスタのプロパティ]-[拡張タブ]-[最大再起動回数をリセットする時間] |
[クラスタのプロパティ]-[リカバリタブ]-[強制停止機能を使用する] |
[クラスタのプロパティ]-[拡張タブ]-[強制停止機能を使用する] |
[クラスタのプロパティ]-[リカバリタブ]-[強制停止アクション] |
[クラスタのプロパティ]-[拡張タブ]-[強制停止アクション] |
[クラスタのプロパティ]-[リカバリタブ]-[強制停止タイムアウト] |
[クラスタのプロパティ]-[拡張タブ]-[強制停止タイムアウト] |
[クラスタのプロパティ]-[リカバリタブ]-[仮想マシン強制停止設定] |
[クラスタのプロパティ]-[拡張タブ]-[仮想マシン強制停止設定]] |
[クラスタのプロパティ]-[リカバリタブ]-[強制停止スクリプトを実行する] |
[クラスタのプロパティ]-[拡張タブ]-[強制停止スクリプトを実行する] |
[クラスタのプロパティ]-[省電力タブ]-[CPU クロック制御機能を使用する] |
[クラスタのプロパティ]-[拡張タブ]-[CPU クロック制御機能を使用する] |
[クラスタのプロパティ]-[リカバリタブ]-[ダウン後自動起動する] |
[クラスタのプロパティ]-[拡張タブ]-[ダウン後自動起動する] |
[クラスタのプロパティ]-[排他タブ]-[マウント、アンマウントコマンド排他] |
[クラスタのプロパティ]-[拡張タブ]-[マウント、アンマウントコマンドを排他する]] |
[クラスタプロパティ]-[リカバリタブ]-[モニタリソース異常時の回復動作を抑制する] |
[クラスタプロパティ]-[拡張タブ]-[クラスタ動作の無効化]-[モニタリソースの異常時の回復動作] |
[グループのプロパティ]-[属性タブ]- [フェイルオーバ排他属性] |
[グループ共通のプロパティ] -[排他タブ] |
7. アップグレード手順¶
本章では、CLUSTERPRO のアップデート手順について説明します。
本章で説明する項目は以下の通りです。
参考
X4.0/4.1 から X 4.2 へのアップデート手順は、『アップデート手順書』を参照してください。
7.1. CLUSTERPRO X のアップグレード手順¶
7.1.1. X 3.0/3.1/3.2/3.3 から X 4.2 へのアップグレード¶
まず、以下の注意事項をご確認ください。
ミラーディスクリソース/ハイブリッドディスクリソースを使用している場合、クラスタパーティションのサイズとして 1024MB 以上の領域が必要になります。また、ミラーディスクリソース/ハイブリッドディスクリソースのフルコピーが必要となります。
ミラーディスクリソース/ハイブリッドディスクリソースを使用している場合、事前にデータのバックアップを取ることを推奨します。バックアップ手順については『インストール&設定ガイド』の「動作チェックを行う」の「バックアップ手順を確認する」、「バックアップ手順を確認する」を参照してください。
CLUSTERPRO Server は rootユーザでアップデートしてください。
以下、CLUSTERPRO X 3.0/3.1/3.2/3.3 for Linux からアップグレードする場合の手順について説明します。
アップデートを開始する前に、クラスタ運用中の各サーバの状態、および全リソースの状態が正常状態であることを WebManager またはコマンドから確認してください。
クラスタ構成情報をバックアップします。クラスタ構成情報は作成時に Builder で保存する他に、clpcfctrl コマンドでバックアップを作成することもできます。詳細は『リファレンスガイド』の「CLUSTERPRO コマンドリファレンス」- 「クラスタ構成情報変更、クラスタ構成情報バックアップ、クラスタ構成情報チェックを実行する (clpcfctrl コマンド)」 - 「クラスタ構成情報をバックアップする」を参照してください。
クラスタを構成する全サーバで CLUSTERPRO をアンインストールします。アンインストール手順は『インストール&設定ガイド』の「CLUSTERPRO をアンインストール/再インストールする」 - 「アンインストール手順」 - 「CLUSTERPRO Server のアンインストール」を参照してください。
クラスタを構成するサーバで CLUSTERPROを新規インストールします。新規インストール手順は『インストール&設定ガイド』の「CLUSTERPRO をインストールする」および「ライセンスを登録する」を参照してください。
ミラーリソース/ハイブリッドディスクリソースを使用している場合は、クラスタパーティションとして 1024MB 以上のサイズのパーティションを準備します。
- 以下にアクセスしWebManagerを起動します。
http:// インストールしたサーバの実 IP アドレス :29003/main.htm
クラスタ構成情報をインポートし、バックアップした構成情報を読み込みます。ミラーディスクリソース/ハイブリッドディスクリソース用のクラスタパーティションが構成情報と異なる場合は、構成情報を変更します。また、ミラーディスクリソース/ハイブリッドディスクリソースが所属するグループの [プロパティ] の [属性] タブにある [グループ起動属性] が自動起動となっている場合には手動起動に設定します。 ミラーディスクリソースを使用している場合は、各ミラーディスクリソースに対して以下の手順を実行します。
リソースの [プロパティ] の [詳細] タブを開き、[調整] ボタンをクリックして [ミラーディスクリソース調整プロパティ] を表示させます。
[ミラーディスクリソース調整プロパティ] の [ミラー] タブを開き、[初期mkfsを行う] のチェックをオフにします。
構成情報を反映します。
期限付きライセンスを使用している場合は、以下のコマンドを実行します。# clplcnsc --distribute
ミラーディスクリソース/ハイブリッドディスクリソースを使用している場合は、各ミラーディスクリソース/ハイブリッドディスクリソースに対して、全てのサーバ上で以下のコマンドを実行してください。クラスタパーティションが初期化されます。(ミラーディスクリソースの場合)
# clpmdinit --create force <ミラーディスクリソース名>
(ハイブリッドディスクリソースの場合)
# clphdinit --create force <ハイブリッドディスクリソース名>
Cluster WebUI を起動し、クラスタを開始します。
ミラーディスクリソース/ハイブリッドディスクリソースを使用している場合は、ミラーディスクリストから最新情報を保有しているサーバをコピー元として、フルコピーを行います。
グループを起動し、各リソースが正常に起動することを確認します。
手順 6 および手順 7 で [グループ起動属性] および [初期mkfsを行う] の設定を変更した場合は、Cluster WebUI を起動して設定を戻し、[設定の反映] をクリックして クラスタ構成情報をクラスタに反映します。
以上で CLUSTERPRO Server のアップデートは完了です。クラスタを開始し、Cluster WebUI またはclpstat コマンドで、各サーバが、クラスタとして正常に動作していることを確認してください。
8. 用語集¶
- インタコネクト
- クラスタ サーバ間の通信パス(関連) プライベート LAN、パブリック LAN
- 仮想 IP アドレス
遠隔地クラスタを構築する場合に使用するリソース(IP アドレス)
- 管理クライアント
Cluster WebUI が起動されているマシン
- 起動属性
- クラスタ起動時、自動的にフェイルオーバグループを起動するか、手動で起動するかを決定するフェイル オーバ グループの属性管理クライアントより設定が可能
- 共有ディスク
複数サーバよりアクセス可能なディスク
- 共有ディスク型クラスタ
共有ディスクを使用するクラスタシステム
- 切替パーティション
- 複数のコンピュータに接続され、切り替えながら使用可能なディスクパーティション(関連) ディスクハートビート用パーティション
- クラスタシステム
複数のコンピュータを LAN などでつないで、1 つのシステムのように振る舞わせるシステム形態
- クラスタシャットダウン
クラスタシステム全体 (クラスタを構成する全サーバ)をシャットダウンさせること
- クラスタパーティション
- ミラーディスク、ハイブリッドディスクに設定するパーティション。ミラーディスク、ハイブリッドディスクの管理に使用する。(関連) ディスクハートビート用パーティション
- 現用系
- ある 1 つの業務セットについて、業務が動作しているサーバ(関連) 待機系
- セカンダリ (サーバ)
- 通常運用時、フェイルオーバグループがフェイルオーバする先のサーバ(関連) プライマリ (サーバ)
- 待機系
- 現用系ではない方のサーバ(関連) 現用系
- ディスクハートビート用パーティション
共有ディスク型クラスタで、ハートビート通信に使用するためのパーティション
- データパーティション
- 共有ディスクの切替パーティションのように使用することが可能なローカルディスクミラーディスク、ハイブリッドディスクに設定するデータ用のパーティション(関連) クラスタパーティション
- ネットワークパーティション
- 全てのハートビートが途切れてしまうこと(関連) インタコネクト、ハートビート
- ノード
クラスタシステムでは、クラスタを構成するサーバを指す。ネットワーク用語では、データを他の機器に経由することのできる、コンピュータやルータなどの機器を指す。
- ハートビート
- サーバの監視のために、サーバ間で定期的にお互いに通信を行うこと(関連) インタコネクト、ネットワークパーティション
- パブリック LAN
- サーバ / クライアント間通信パスのこと(関連) インタコネクト、プライベート LAN
- フェイルオーバ
障害検出により待機系が、現用系上の業務アプリケーションを引き継ぐこと
- フェイルバック
- あるサーバで起動していた業務アプリケーションがフェイルオーバにより他のサーバに引き継がれた後、業務アプリケーションを起動していたサーバに再び業務を戻すこと
- フェイルオーバグループ
業務を実行するのに必要なクラスタリソース、属性の集合
- フェイルオーバグループの移動
ユーザが意図的に業務アプリケーションを現用系から待機系に移動させること
- フェイルオーバポリシー
フェイルオーバ可能なサーバリストとその中でのフェイルオーバ優先順位を持つ属性
- プライベート LAN
- クラスタを構成するサーバのみが接続された LAN(関連) インタコネクト、パブリック LAN
- プライマリ (サーバ)
- フェイルオーバグループでの基準で主となるサーバ(関連) セカンダリ (サーバ)
- フローティング IP アドレス
- フェイルオーバが発生したとき、クライアントのアプリケーションが接続先サーバの切り替えを意識することなく使用できる IP アドレスクラスタサーバが所属する LAN と同一のネットワークアドレス内で、他に使用されていないホストアドレスを割り当てる
- マスタサーバ
Cluster WebUI の [サーバ共通のプロパティ]-[マスタサーバ] で先頭に表示されているサーバ
- ミラーディスクコネクト
ミラーディスク、ハイブリッドディスクでデータのミラーリングを行うために使用する LAN。プライマリインタコネクトと兼用で設定することが可能。
- ミラーディスクシステム
- 共有ディスクを使用しないクラスタシステムサーバのローカルディスクをサーバ間でミラーリングする