プロセス起動・停止時間超過への対応

事象説明

    アプリケーションプロセスの起動または停止時、いつになっても起動または停止しない場合は何らかの問題が発生していると考えられます。WebOTX では無限ループ状態を防止するため、プロセスが起動または停止処理をする際のタイムアウト時間を設定しており、この時間を越えた場合はプロセスを強制終了します。
    アプリケーションプロセスの異常終了時の終了処理でタイムアウトした場合も、本障害に含まれます。

状況の確認方法
採取資料
対象AP の特定

    イベントログ・syslogを確認してください。

原因の特定

    イベントログ・syslog、AP ログ、システムトレースを確認してください。

    イベントログ・syslogにTPS15-01312 が出力され、プロセス起動に失敗した場合、以下の処理で遅延している可能性がありますので確認してください。

    システムトレースに出力されたダンプを確認してください。
    また、AP ログに出力されたスタックトレースを確認してください。(Java アプリケーションの場合)

    イベントログ・syslogにTPS10-11101 が出力され、プロセス起動に失敗した場合、以下の処理で遅延している可能性がありますので確認してください。

    イベントログ・syslogにTPS10-13301 が出力され、プロセス停止が強制終了となった場合、以下の処理で遅延している可能性がありますので確認してください。

    イベントログ・syslogにTPS15-01312 が出力され、アプリケーショグループ停止が強制終了となった場合、実行中のオペレーションがあり、そのオペレーションがストールしている可能性があります。詳細は、 [ APストールへの対応 ] を参照して下さい。

    運用停止操作を実行していない状態で、イベントログ・syslogにTPS15-01312 が出力され、プロセスが強制終了された場合、アプリケーションプロセスで異常終了が発生し、さらにその後の終了処理で遅延している可能性があります。まずは、[ 2. 障害解析 > 2.4. 障害の種類から > 2.4.3. サーバアプリケーションの障害 ] を参照し、異常終了した原因について調査してください。

    さらに、以下の処理で遅延している可能性がありますので確認してください。

復旧方法

    AP の処理を修正してください。

予防のための対策

    サーバAP の起動及び停止にかかる時間が理論上ありえる範囲なのかありえないのかによって対策は異なります。理論上ありえないのであればAP の処理を見直す必要があります。理論上ありえる範囲の場合は [ 高度な管理と運用サイクルガイド > 2. チューニング > 2.1. APサーバ > 2.1.4. その他チューニングに関する設定 > 2.1.4.2. 起動・停止タイムアウト(プロセス終了) ] を参照し、必要に応じてあらかじめタイムアウト時間に大きな値を設定してください。

対象となるエラー事象

    TPS15-01312、TPS10-11101、TPS10-13301


関連情報

    APストールへの対応

    2. 障害解析 > 2.4. 障害の種類から > 2.4.3. サーバアプリケーションの障害

    高度な管理と運用サイクルガイド > 2. チューニング > 2.1. APサーバ > 2.1.4. その他チューニングに関する設定 > 2.1.4.2. 起動・停止タイムアウト(プロセス終了)