TP モニタプロセスが何らかの理由で異常終了した場合、他のTP モニタに関連するプロセスが動作しているのであれば、クライアントからのユーザアクセスは成功する可能性はあります。しかし、TP システムに対する運用操作できなくなります。
また、実行時に確保する共有メモリが残ってしまうため、次回以降のTP モニタ・マネージャの起動に失敗します。この場合、プロセスグループのプロセスが起動しないため、クライアントからのユーザアクセスがエラーとなり(ユーザ実装による)、統合運用管理ツールからはTP システムが停止していることが確認できます。
TP モニタプロセス(tpmMain)が終了した場合、syslogに以下のメッセージが出力されます。
WebOTX_Agent: OTX01180012:is not alive :domain1:category=monitor,type=alive-check-monitor,server=server,name=tpsystem-state (com.nec.webotx.enterprise.system.notification)
OTXM:MySystem: I:1: tpmMain getsignal(<x>).<x>はシグナルを表す番号です。例えば、9はSIGKILLです。
# ipcs
IPC status from /dev/kmem as of Wed Jun 7 15:11:24 2006
T | ID | KEY | MODE | OWNER | GROUP |
Message Queues: | |||||
q | 0 | 0x3c201079 | -Rrw--w--w- | root | root |
q | 1 | 0x3e201079 | --rw-r--r-- | root | root |
q | 19873794 | 0x4f4c3096 | --rw-rw-r-- | otxadm | otxadmin |
q | 19873795 | 0x4f4c3196 | --rw-rw-r-- | otxadm | otxadmin |
q | 19873796 | 0x4f4c3396 | --rw-rw-r-- | otxadm | otxadmin |
: |
WebOTX_Agent: OTX07200004 TPMonitorManager Lifecycle Startup Error. (com.nec.webotx.enterprise.system.TPMonitorManager)com.nec.webotx.enterprise.TPAClient.TPA ClientException: TPA ERROR: Wed May 24 18:12:13 2006 TPS12-00213 Cannot get TP-Monitor info data: ret(-154), err_code(0). WebOTX_Agent: OTX01205103: Service [com.nec.webotx.enterprise.TPMonitorManager.TPMonitorManagerLifecycle] cannot be started! : com.nec.webotx.enterprise.TPAClient.TPAClientException: TPA ERROR: Wed May 24 18:12:13 2006 TPS12-00213 Cannot get TP-Monitor info data: ret(-154), err_code(0).${AS_INSTALL}/Trnsv/multitpm/current 配下にTP システムのシステム名と同名のファイルがない場合(システム起動がタイムアウトするエラー)
WebOTX_Agent: OTX07200004 TPMonitorManager Lifecycle Startup Error. (com.nec.webotx.enterprise.system.TPMonitorManager)com.nec.webotx.enterprise.TPMonitorManager.TPMonitorManagerException: startSystem timeout :120000 WebOTX_Agent: OTX01205103: Service [com.nec.webotx.enterprise.TPMonitorManager.TPMonitorManagerLifecycle] cannot be started! : com.nec.webotx.enterprise.TPMonitorManager.TPMonitorManagerException: startSystem timeout :120000 (com.nec.webotx.enterprise.system.core)なお、このファイルやキーは、TP モニタ起動時に作成され、停止時に削除されます。共有メモリが残っていなければ、このファイル自体が残っていてもTP モニタの起動に影響はありません。
異常終了が発生した場合は、syslogやWebOTX のログにメッセージ出力されます。また、TP モニタの親プロセスであるtpmonitor を監視しておくことで、運用中のTP モニタプロセスの異常終了を発見することができます。イベントログメッセージに関しては、前述のメッセージの他、[ メッセージ一覧 ] を参照してください。プロセスの監視に関しては、[ 高度な管理と運用サイクルガイド > 4. 監視 > 4.1. プロセス監視 ] を参照してください。
共有メモリが残っている場合は、マシン再起動により復旧してください。復旧しない場合、TPモニタプロセスが終了した原因を前後のメッセージから判断し、原因を取り除いてから再起動してください。
UNIXかつ運用ユーザでWebOTXを運用している場合、マシンの再起動をしなくても復旧することができます。以下2つの方法のうちどちらかを行い復旧してください。
rootユーザでWebOTXを運用している場合、あるいはWindowsの場合は共有メモリ(IPC資源)の削除コマンドは使用できません。
この方法での復旧はどうしてもマシン再起動が許されない場合に限り行ってください。通常はマシン再起動での復旧を行ってください。
otxadmin> stop-domain <ドメイン名>
otxadmin> stop-domain --force <ドメイン名>
> ${AS_INSTALL}/Trnsv/bin/wormipc
HP-UX
# /sbin/init.d/WebOTXinit<バージョン番号> stop # /sbin/init.d/WebOTXinit<バージョン番号> start
Linux
SysVinitの場合:
# /etc/init.d/WebOTXinit<バージョン番号> stop # /etc/init.d/WebOTXinit<バージョン番号> start
systemdの場合:
# systemctl stop WebOTXinit<バージョン番号> # systemctl start WebOTXinit<バージョン番号>
「<バージョン番号>」の箇所には、バージョンに応じた数値が入ります。例えば、「V9.4」であれば「94」という数値が入ります。
otxadmin> start-domain <ドメイン名>
otxadmin> stop-domain <ドメイン名>
> ${AS_INSTALL}/Trnsv/command/tpsps -n <該当ドメインのTPシステム名> ********** PROCESS INFO ******************************************************* PID :COMD :CLASS 15288 :tpmMain : 15289 :systpp :SYSTPP_CLS 15290 :iioplsn :IIOPLSN_CLS 15291 :TIMMSGSND :TIMER 15292 :tpssendtpp :SNDTPP_CLS 15293 :jnlwrt :JNLWRT_CLS 15294 :wosystpp :WOSYSTPP *******************************************************************************
> ps -ef | grep <tpspsコマンドのPID>psコマンドで表示されるプロセスIDに対してrootユーザでKILLシグナルを送信しプロセスを停止させます。
# kill -KILL <psコマンドのPID>
> ${AS_INSTALL}/Trnsv/command/tpsipcs -n <該当ドメインのTPシステム名> ID KEY USE Message Queues: 040894489 0x4f4c3013 from TPmonitor : : : Shared Memory: 005799941 0x73676d13 for system message : : : Semaphores: 000036881 0x73676d13 for system message : : :
> ipcs -q | grep <tpsipcsコマンドのID列のIPCキューID>※ # ipcrm -q <ipcsで存在が確認できたID>
> ipcs -m | grep <tpsipcsコマンドのID列の共有メモリID>※ # ipcrm -m <ipcsで存在が確認できたID>
> ipcs -s | grep <tpsipcsコマンドのID列のセマフォID>※ # ipcrm -s <ipcsで存在が確認できたID>※9桁で表示していますが、ここに指定する時は先頭の0を削除してください。
otxadmin> start-domain <ドメイン名>
TPモニタプロセスは、killコマンド等で停止された場合は正常に停止しない可能性があります。killを使用せず、WebOTX提供のコマンドを利用してください。なお、共有メモリ(IPC資源)の削除コマンド(wormipc)は、通常運用時は実行しないでください。共有メモリが削除され、正常動作しなくなる可能性があります。