モニタリングを行なうための設定および情報の採取方法について説明します。
統計情報の値(WebOTX統計MBeanの属性値)を参照するには以下の方法があります。
統合運用管理ツールより参照する場合はドメインツリー上の[統計情報]ノードにWebOTX統計MBeanがツリーとして管理されています。 該当するノードを選択するとその統計情報の値を参照できます。 さらに統合運用管理ツールではその統計情報を定期的に取得しグラフ表示したり、 ファイルに保存したりすることができます。 なお具体的な設定方法に関しては[ 運用ツールガイド > 2. 統合運用管理ツール(WebOTX Administrator) > 2.5. 統計情報 ] を参照してください。
運用管理コマンドで参照する場合は、getコマンドを-monitorオプションをつけて参照することができます。
例1) 全ての統計情報の表示
otxadmin> get --monitor *
例2) アプリケーショングループ”apg”、プロセスグループ”pg”の現在のキューイング数の取得
otxadmin> get --monitor tpsystem.applicationGroups.apg.processGroups.pg.queueingCount-Current
別の方法として、monitorコマンドによって定期的に任意の統計情報を参照することができます。
例) エージェントプロセスの JVM に対する統計情報を 10 秒間隔で定期的に取得
otxadmin> monitor --type jvm --interval 10 server
モニタリングの設定についてはWebOTX統合運用管理ツールより行なうことが出来ます。 具体的な設定方法については[ 運用ツールガイド > 2. 統合運用管理ツール(WebOTX Administrator) > 2.5. 統計情報 ] を参照してください。
モニタリング機能を使ったWebOTXの監視を利用することによりAPサーバの稼動状況を監視でき、 障害発生時にリアルタイム通知を発生させることが可能となります。 以下に有用なモニタリング使用例について説明します。
JVMヒープサイズを監視することにより、エージェントプロセスのメモリ不足を検出することができます。 メモリ不足により予期せぬエラーが発生することを予防できます。
JDBCデータソースのJDBCコネクション数を監視することにより、 解放漏れによるDBコネクションの増加を検出することができます。 DBコネクション増加によりDBアクセスが出来なくなる事象を予防できます。
最大キューイング数の監視を行なうことにより、処理の滞留によるレスポンス遅延を検出することができます。 早期に検出することでレスポンス遅延がシステム全体に影響してしまうことを予防できます。
接続クライアント数の監視を行なうことにより、 ファイルディスクリプタなどのリソースの枯渇でクライアントからの接続ができなくなることを予防できます。 とくにリッチクライアント構成の場合、ゴーストセッションの増大によるセッション数の増加を検出できます。
JVMヒープサイズを監視することにより、エージェントプロセスのメモリ不足を検出することができます。 メモリ不足により予期せぬエラーが発生することを予防できます。
注意:モニタリング可能なプロセスはWebOTXのエージェントプロセスです。 Standard/Enterpriseでプロセスグループから起動されるプロセスはモニタリングできません。
JVMのWebOTX統計MBean(CLIName: server.jvm 統合運用管理ツール: [統計情報]-[ドメイン名]-[アプリケーションサーバ]-[JVM])の ヒープサイズ(JvmHeapSize)のカレント値の閾値上限を設定してモニタリングします。
JDBCデータソースのJDBCコネクション数を監視することにより、解放漏れによるDBコネクションの増加を検出することができます。 DBコネクション増加によりDBアクセスが出来なくなる事象を予防できます。
次のWebOTX統計MBeanの使用中コネクション数(NumConnUsed)のカレント値について、カウンタモニタで閾値上限を設定し、モニタリングします。
エージェントプロセスで動作する場合
CLIName: server.resources.jdbc-datasource.datasource-name
統合運用管理ツールからのツリー: [統計情報]-[ドメイン名]-[アプリケーションサーバ]-[リソース]- [jdbc-datasource.datasource-name]
Standard/Enterprise のプロセスグループで動作する場合
CLIName: tpsystem.applicationGroups.apg_name.processGroups.pg_name.processes.pid.resources.jdbc-datasource.datasource_name
統合運用管理ツールからのツリー: [統計情報]-[ドメイン名]- [TPシステム]-[アプリケーショングループ]- [apg_name] -[プロセスグループ]-[pg_name]-[processes]-[pid]-[resources]- [jdbc-datasource.datasource_name]
最大キューイング数の監視を行なうことにより、処理の滞留によるレスポンス遅延を検出することができます。 早期に検出することでレスポンス遅延がシステム全体に影響してしまうことを予防できます。
キューイング数の設定はシステムレベルとプロセスグループレベルで行なうことが可能です。
システムレベルでの設定:
WebOTX統計MBean(CLIName: tpsystem.Queue統合運用管理ツール: [統計情報]-[TPシステム]-[キュー] )の最大キュー滞留数(MaxStayMsgNum)のカレント値の閾値上限を設定してモニタリングします。
プロセスグループレベルでの設定:
WebOTX統計MBean(CLIName: tpsystem.applicationGroups.apg_name.processGroups.pg_name統合運用管理ツール: [統計情報]-[ドメイン名]-[TPシステム]-[アプリケーショングループ]-[apg_name]-[プロセスグループ]-[pg_name])の キュー滞留数(queueingCount)のカレント値の閾値上限を設定してモニタリングします
接続クライアント数の監視を行なうことにより、ファイルディスクリプタなどのリソースの枯渇でクライアントからの接続ができなくなることを予防できます。 とくにリッチクライアント構成の場合、ゴーストセッションの増大によるセッション数の増加を検出できます。
クライアント情報のWebOTX統計MBean(CLIName: tpsystem.ClientSession統合運用管理ツール: [統計情報]-[ドメイン名]-[TPシステム]-[クライアントセッション])接続クライアント数(connectionNum)の カレント値の閾値上限を設定してモニタリングします。