1. 前言

1.1. 读者对象及用途

《EXPRESSCLUSTER ® X SingleServerSafe 设置指南》,面向导入集群系统的系统工程师以及导入系统后进行维护/操作的系统管理员,说明EXPRESSCLUSTER X SingleServerSafe构建工作的步骤。

1.2. 本手册的构成

1.3. 本手册记述的术语

为提高与集群软件EXPRESSCLUSTER X SingleServerSafe 的操作性等方面的兼容性,本手册所介绍的EXPRESSCLUSTER X SingleServerSafe与之使用了相同的画面及命令。因此,采用了部分集群相关的术语。
请参照下列术语的说明来阅读本手册。
集群,集群系统

导入了EXPRESSCLUSTER X SingleServerSafe的单一服务器系统

集群关闭/重启

导入了EXPRESSCLUSTER X SingleServerSafe的系统的关闭/重启

集群资源

EXPRESSCLUSTER X SingleServerSafe所使用的资源

集群对象

EXPRESSCLUSTER X SingleServerSafe所使用的各种资源的对象

失效切换组

汇集了EXPRESSCLUSTER X SingleServerSafe所使用的组资源(应用程序,服务等)的组

1.4. EXPRESSCLUSTER X SingleServerSafe手册体系

EXPRESSCLUSTER X SingleServerSafe的手册分为以下 3 类。各指南的标题和用途如下所示。

EXPRESSCLUSTER X SingleServerSafe安装指南》(Install Guide)

本手册的读者对象为导入使用了EXPRESSCLUSTER X SingleServerSafe的集群系统的系统工程师,对EXPRESSCLUSTER X SingleServerSafe的安装设置步骤进行说明。

《EXPRESSCLUSTER X SingleServerSafe 设置指南》(Configration Guide)

本手册的读者对象为导入使用EXPRESSCLUSTER X SingleServerSafe的集群系统的系统工程师以及导入系统后进行维护和操作的系统管理员,对EXPRESSCLUSTER X SingleServerSafe的构建工作进行说明。

EXPRESSCLUSTER X SingleServerSafe操作指南》(Operation Guide)

本手册的读者对象为使用EXPRESSCLUSTER X SingleServerSafe导入后的进行维护和操作的系统管理员,对EXPRESSCLUSTER X SingleServerSafe的操作方法进行说明。

1.5. 本手册的标记规则

在本手册中,需要注意的事项,重要的事项以及相关信息等用如下方法标记。

注解

表示虽然比较重要,但是并不会引起数据损失或系统以及机器损伤的信息。

重要

表示为避免数据损失和系统,机器损坏所必需的信息。

参见

表示参考信息的位置。

另外,在本手册中使用以下标记法。

标记

使用方法

[ ]方括号
在命令名的前后,
显示在画面中的字句 (对话框,菜单等) 的前后。
点击[启动]。
[详细信息]对话框

命令行中的[ ]方括号

表示括号内的值可以不予指定(可省)。

clpstat -s [-h host_name]

等宽字体

路径名,命令行,系统输出(消息,提示等),目录,文件名,函数,参数

c:\Program files\EXPRESSCLUSTER SSS

粗体
表示用户在命令提示符后实际输入的值。
输入以下内容。
clpcl -s -a
斜体
用户将其替换为有效值后输入的项目。

clpstat -s [-h host_name]

1.6. 最新信息来源

关于最新的产品信息,请参考以下Web站点。

https://www.nec.com/global/prod/expresscluster/

2. 关于EXPRESSCLUSTER X SingleServerSafe

本章中对EXPRESSCLUSTER X SingleServerSafe的功能概要,及可以监视的故障进行了说明。

本章中介绍的内容如下。

2.1. 何谓EXPRESSCLUSTER X SingleServerSafe

EXPRESSCLUSTER X SingleServerSafe为可安装到服务器上,来查出服务器上的应用程序及硬件的故障,并可在发生故障时,通过自动重新启动应用程序及服务器,来提高服务器的可用性的产品。

通常的服务器,如应用程序异常结束,在意识到应用程序结束的时候,就必须人工启动应用程序。
此外,虽然应用程序未异常结束,但可执行其内部的运行已不稳定,并未正常运行。这种异常状态通常无法轻易察觉。
发生硬件故障时,若是暂时性故障,可执行重启服务器就可恢复正常。但难以察觉硬件故障,经常出现觉得应用程序运行不正常而进行检查,结果发现是硬件故障的情况。

在EXPRESSCLUSTER X SingleServerSafe中,通过指定希望查出异常的应用程序及硬件,自动查出故障,通过自动重新启动应用程序及服务器,进行故障的恢复动作。

2.2. EXPRESSCLUSTER X SingleServerSafe的故障监视原理

在EXPRESSCLUSTER X SingleServerSafe中通过执行各种监视,可以迅速确切地查出故障。以下介绍这些监视的详细内容。

  • 应用程序的生存状态监视
    能够使用启动资源(称为应用程序资源,服务资源)启动应用程序,通过监视用资源 (称为应用程序监视资源,服务监视资源) 定期监视进程的生存。在由于业务应用程序异常退出造成业务中断时有效。

    注解

    • 如果EXPRESSCLUSTER X SingleServerSafe直接启动的应用程序为启动,结束监视对象的常驻进程的应用程序,则无法查出常驻进程的异常。

    • 无法查出应用程序内部状态的异常 (应用程序的停止,结果异常) 。

  • 按照监视可选软件对应用程序/协议的停止/结果异常进行监视
    虽然需要另外购买License,但是可以监视数据库应用程序(Oracle,DB2等),协议(FTP,HTTP等) ,应用程序服务器(WebSphere,WebLogic等)的停止/结果异常。详细信息请参考"5. 监视资源的详细信息"。
  • 资源的监视
    通过EXPRESSCLUSTER X SingleServerSafe 的监视资源能够监视各种资源(应用程序,服务等)和LAN的状态。在由于必须资源异常造成业务中断时有效。

3. 创建配置信息

在EXPRESSCLUSTER X SingleServerSafe中,记述配置内容的数据称为配置信息。使用Cluster WebUI创建配置信息。在本章中,说明了根据Cluster WebUI的启动方法及创建配置信息的步骤为示例的配置示例。

本章中介绍的内容如下。

3.1. 确认设置值

在使用Cluster WebUI实际创建配置信息之前,需要确认配置信息的设置值。写出值,确认信息有无遗漏。

3.1.1. 环境的示例

以下记载了配置信息的样例值。以下逐一说明在此条件下创建配置信息的步骤。实际设置值时,请换成构筑的配置信息后输入。关于取值方法,请参考"4. 组资源的详细信息"和"5. 监视资源的详细信息"。

配置设置示例

设置对象

设置参数

设置值

服务器的信息

服务器名

server1

系统驱动器

C:

类型

失效切换

组名

failover1

启动服务器

server1

第1个组资源

类型

应用程序资源

组资源名

appli1

常驻类型

常驻

开始路径

执行文件的路径

第1个监视资源

类型

用户空间监视

监视资源名

userw

使用心跳的间隔/超时

使用

监视方法

keepalive

发生超时时的动作

发生有意图地停止错误

新建模拟线程

新建

第2个监视资源

类型

IP监视

监视资源名

ipw1

监视 IP地址

192.168.0.254(网关)

恢复对象

server1(服务器名)

重新启动界限值

-

最终动作

停止集群服务和重启OS

第3个监视资源

类型

应用程序监视

监视资源名

appliw1

对象资源

appli1

恢复对象

failover1

重新启动界限值

3

最终动作

停止集群服务和重启OS

注解

第1个监视资源的[用户空间监视]会自动设置。反映出服务器设置时的系统驱动器信息。

3.2. 启动Cluster WebUI

创建配置信息时,必须访问Cluster WebUI。在此,首先说明Cluster WebUI的概要,之后,访问Cluster WebUI,对创建配置信息的方法进行说明。

3.2.1. 何谓Cluster WebUI

所谓Cluster WebUI,就是通过Web 浏览器进行服务器的状态监视,启动/停止服务器/组,以及收集运行日志等的功能。

服务器以及管理PC

图 3.1 Cluster WebUI

3.2.2. 启动Cluster WebUI

Cluster WebUI的启动步骤如下所示。

  1. 启动Web浏览器。
    在浏览器的地址栏中输入安装了EXPRESSCLUSTER X SingleServerSafe的服务器的IP地址和端口号。
    http://ip-address:port/
    ip-address

    指定安装了EXPRESSCLUSTER X SingleServerSafe的服务器的IP地址。如是自身服务器,则localhost就可以了。

    port

    指定与安装时指定的WebManager的端口号相同的编号(默认值29003)。

  2. 启动Cluster WebUI。

  3. 从工具栏的下拉菜单中选择[编辑模式],切换为编辑模式。

    参见

    与启用加密通信的EXPRESSCLUSTER 服务器连接时请参考"6. 其他设置的详细信息" - "6.1. 集群属性" - "6.1.9. WebManager标签页"。使用加密通信时,请输入如下的地址。

    https://192.168.0.1:29003/

3.3. 创建配置信息的步骤

创建配置信息分为设置服务器,创建组,创建监视资源的3个阶段。新建配置信息时,可使用生成向导。其步骤流程如下所示。

注解

创建的集群配置信息只能在使用名称更改功能或属性显示功能后进行更改。

  1. 3.3.1. 服务器的设置

    设置运行EXPRESSCLUSTER X SingleServerSafe的服务器。

  2. 3.3.2. 组的设置

    创建组。通过组控制应用程序的启动及结束。创建所需数量的组。通常需要创建的数量应与想要控制的应用程序数量相当,但在使用[脚本资源]时,也能用1个组控制多个应用程序。

  3. 3.3.3. 3. 创建监视资源

    监视被指定的监视对象,添加监视资源。
    创建希望监视的数。

3.3.1. 服务器的设置

设置服务器。

3.3.1.1. 设置服务器

在安装了EXPRESSCLUSTER X SingleServerSafe之后,可通过重新启动OS来自动创建。Cluster WebUI的操作模式切换至编辑模式画面后,可显示出已经创建的信息。

画面如下所示。

3.3.2. 组的设置

所谓组是指为了执行系统内的某一个独立的业务所必需的服务及流程的集合。
说明添加组的步骤。

3.3.2.1. 添加组

设置组。

  1. 点击[组]的[添加组]。

  2. 打开[组定义]画面。

    请从以下类型中选择。

    类型

    • 失效切换
      通常选择此类型。

    在[名称]框中输入组名(failover1),然后点击[下一步]。

  3. 确认是否选中[所有服务器都可以失效切换] 的复选框,然后点击[下一步]。
  4. 设置组的各属性值的画面。直接点击 [下一步]。显示[组资源定义列表]。

3.3.2.2. 添加组资源 (应用程序资源)

启动/结束应用程序,添加应用程序资源。

  1. [组资源列表] 中点击[添加]。

  2. 打开[组资源定义| failover1]对话框。在[类型]框中选择组资源的类型(应用程序资源),在[名称]框中输入组资源名(appli1)。然后,点击[下一步]。

    注解

    作为类型,可选择[应用程序资源][脚本资源] [服务资源]。

  3. 会显示出依赖关系设置的页面。不作出任何指定,点击[下一步]。

  4. 会显示出[查出启动异常时的恢复动作],[查出停止异常时的恢复动作]。点击[下一步]。

  5. 在[常驻类型]中选择[常驻]。此外,在[起始路径]中指定执行文件的路径。点击[完成]。

    注解

    在[起始路径]及[结束路径]中设置可执行文件名的绝对路径,或环境变量中设置的路径完整的可执行文件名。不要指定相对路径。指定相对路径时,应用程序资源的启动可执行会失败。

  6. 点击[完成]。
    应用程序资源即被添加到[组资源列表]中。
  7. 点击[完成]。

3.3.3. 3. 创建监视资源

添加监视指定对象的监视资源。

3.3.3.1. 添加监视资源 (IP 监视资源)

  1. 点击[监视]的[添加监视资源]。会显示出[监视资源的定义]。

  2. 在[类型]框中选择监视资源的类型(IP监视),在[名称]框中输入监视资源名(ipw1)。点击[下一步]。

    注解

    监视资源显示在[类型]框中,请选择要监视的资源。
    没有安装可选产品的License时,对应License的资源及监视资源就不能显示在Cluster WebUI的列表中。
    如果已安装License但没有显示时,请点击[获取License信息]来取得License信息。
  3. 输入监视设置。在此,保持默认值不变,点击[下一步]。

  4. 显示[IP地址列表]。点击[添加]。

  5. 在[IP地址列表]设置中输入IP地址(192.168.0.254)。点击[确定]。

    注解

    可在IP监视资源的监视对象中指定在LAN上不间断运行为前提的设备(例如网关)的IP地址。

  6. 所输入的IP地址被设置到[IP地址列表]。点击[下一步]。

  7. 设置复归对象,点击[参照]。

  8. 在所表示的树形图中点击[failover1] ,再点击[确定]。[复归对象]中选择[failover1]。

  9. 点击[完成]。设置后的画面如下。

以上配置信息的创建结束。请继续下一步"3.4. 保存配置信息"。

3.4. 保存配置信息

已创建的集群配置信息能够保存到正在使用的PC的目录下或外部媒体中。
请按照以下步骤保存集群配置信息。
  1. 在Cluster WebUI的编辑模式中点击[导出配置文件]。

  2. 选择保存地址,保存。

    注解

    被保存的是1个文件(clp.conf)和1个目录(scripts)。如果这些文件和目录不齐备,则不能成功生成集群,因此移动时请务必将它们作为一个整体进行移动。另外,更改了新建的配置信息时,除上述2点外,还会再创建一个clp.conf.bak。

    注解

    安装EXPRESSCLUSTER X SingleServerSafe时,如果在[通信端口号设置]画面中指定了和默认值不同的端口号,则保存集群配置信息前,请在[集群属性]-[端口号]标签页中将[WebManager HTTP端口号]设置为和安装时相同的值。

3.5. 检查配置信息

在将Cluster WebUI 创建的集群配置信息应用到集群服务器之前,可以检查已设置的集群配置信息。

  1. 在 Cluster WebUI 的设置模式中点击[检查集群配置信息]

3.6. 反映配置信息

通过Cluster WebUI创建配置信息后,在服务器中反映配置信息。
反映配置信息时,请按照以下步骤进行。
  1. 在Cluster WebUI的编辑模式中点击[应用配置文件]。

  2. 根据上传前后配置信息的差异,弹出窗口中将显示所需操作的确认消息。
    若操作内容没有问题,点击[确定]。
    上传成功后,显示"修改已经被成功反映。"的消息。点击[确认]。
    若上传失败,则请按照显示的消息进行操作。
  3. Cluster WebUI上显示状态。
    Cluster WebUI的操作和确认方法,可以参考在线手册。点击画面右上的[ ]打开在线手册。

4. 组资源的详细信息

在本章中对组资源进行详细说明。

为提高与集群链接软件EXPRESSCLUSTER X的操作性等方面的兼容性,EXPRESSCLUSTER X SingleServerSafe 使用了相同的画面。

本章说明的项目如下。

4.1. 组资源一览

当前所支持的组资源如下所示。

组资源名

功能

简称

应用程序资源

提供启动/停止应用程序(包括用户制作的应用程序)的架构。

appli

脚本资源

提供启动/停止用户制作脚本等的脚本(BAT)的架构。

script

服务资源

提供启动/停止数据库及Web等的服务的架构。

service

4.2. 设置应用程序资源的详细信息

通过EXPRESSCLUSTER X SingleServerSafe进行管理,可以登录组启动时,结束时执行的应用程序。应用程序资源中也可以登录用户独有的应用程序等。

应用程序指文件的扩展名为exe/cmd/bat等文件时,可通过命令行等执行的应用程序。

4.2.1. 详细标签页

常驻类型(默认值:常驻)

设置应用程序的类型。从下面2者中选择。

  • 常驻
    应用程序常驻时选择此项。
  • 非常驻
    应用程序非常驻时 (执行后处理立即返回) 选择此项。

起始路径T (1023字节以内)

设置应用程序资源开始时可执行的文件的名称。

停止路径 (1023字节以内)

设置应用程序资源结束时可执行的文件的名称。常驻类型为常驻时执行以下的操作。

  • 没有指定停止路径时
    在停止时,进行EXPRESSCLUSTER所启动的应用程序的结束处理。
  • 指定停止路径时
    在停止时,通过执行停止路径所指定的应用程序,进行所启动的应用程序的结束处理。

注解

[起始路径]以及[停止路径]中设置可执行文件名的绝对路径,或者由环境变量设置的路径畅通的可执行文件名。请不要指定相对路径。指定了相对路径时,应用程序资源的启动可执行会失败时。

调整

显示[应用程序资源的调整属性]对话框。进行应用程序资源的高级设置。

应用程序资源调整属性

参数标签页

显示参数相关的详细设置。

同步 (启动)

常驻型应用程序时,忽略本设置。
非常驻型应用程序时,当应用程序执行时等待其结束。

异步 (启动)

常驻型应用程序时,忽略本设置。
非常驻型应用程序时,当应用程序执行时不等待其结束。

正常返回值 (启动) (1023字节以内)

选择了"异步"时,输入栏不能进行输入。
常驻类型是非常驻的场合,在起始路径中设定的应用程序的"正常返回值"的输入规则如下。
  • 没有值时
    忽略返回值。
  • 有值时
    请遵守以下输入规则。
    • 像0,2,3那样使用逗号进行分隔

    • 像0-3那样使用连字号指定

    注解

    可执行文件是批处理文件的场合,启动批处理文件的加载程序cmd.exe如果发生错误,其返回值是"1"。如果正常的返回值也设置为"1",则无法区分该错误。

同步 (停止)

常驻型应用程序时,没有指定停止路径时,等待所启动的应用程序结束。指定停止路径时,等待停止路径所指定的应用程序结束。
非常驻型应用程序时,应用程序执行时等待其结束。

异步 (停止)

常驻型应用程序时,不等待所启动的应用程序结束或停止路径所指定的应用程序结束。
非常驻型应用程序时,应用程序执行时不等待其结束。

正常返回值 (停止)(1023字节以内)

选择了"异步"时,输入栏不能进行输入。
常驻类型是非常驻的场合,在停止路径中设定的应用程序的"正常返回值"的输入规则如下。
  • 没有值时
    忽略返回值。
  • 有值时
    请遵守以下输入规则。
    • 像0,2,3那样使用逗号进行分隔

    • 像0-3那样使用连字号指定

    注解

    可执行文件是批处理文件的场合,启动批处理文件的加载程序cmd.exe如果发生错误,其返回值是"1"。如果正常的返回值也设置为"1",则无法区分该错误。

超时 (启动) (1~9999)

常驻型应用程序时,忽略本设置。
非常驻型应用程序时,设置应用程序执行时等待其结束的情况下([同步])的超时时间。只有选择了[同步]时可以输入。如果在设置的时间内应用程序没有结束,则判断为异常。

超时 (停止) (1~9999)

常驻型应用程序时,设置等待所启动的应用程序结束或停止路径所指定的应用程序结束([同步])的超时时间。
非常驻型应用程序时,设置应用程序执行时等待其结束([同步])的超时时间。
仅选择[同步]时可以输入。如果在设置的时间内应用程序没有结束,则判断为异常。

对象VCOM资源名

不使用。

允许桌面对话

设置执行的应用程序可否与桌面进行交互。如可交互,则执行应用程序就会在桌面上显示应用程序的画面。

退出时强制结束应用程序

设置作为停止时的结束处理是否强制结束应用程序。设置为是时,不进行普通的结束处理而强制结束应用程序。仅在常驻类型设为「常驻」,并且没有指定停止路径时有效。

执行用户

指定执行应用程序的用户。执行用户可以从已在[集群属性]的[账户]标签页注册的用户中选择。
当指定"个别指定"时,将使用开始标签页/结束标签页中执行用户的设置。
当指定"个别指定"之外时,不使用开始标签页/结束标签页的设置,而是使用以本参数指定的执行用户的设置。

默认值

按[默认值]按钮,所有项目内容均被设为默认值。

开始标签页,停止标签页 通用

显示关于开始/结束的详细设置。

当前目录 (1023字节以内)

设置执行应用程序时的目录。

选项参数 (1023字节以内)

为应用程序设置输入的参数。如果有多个参数,设置以空格隔开。如果输入的参数中带有空格,则用双引号("")将参数括起来。

例:"param 1" param2

窗口大小

从下面各项中选择执行应用程序时的窗口大小。

  • [隐藏]
    不显示应用程序。
  • [普通]
    以正常的窗口显示应用程序。
  • [最大化]
    以最大化窗口显示应用程序。
  • [最小化]
    以最小化窗口显示应用程序。

执行用户 域

指定执行应用程序的用户账号所属的域。
[结束]标签页时,无需停止/重启组。

执行用户 帐户

指定执行应用程序的用户账号。 1
[结束]标签页时,无需停止/重启组。
1

没有指定执行应用程序的用户账号时,将以当前系统用户来执行应用程序。

执行用户 密码

指定执行应用程序的用户账号的密码。
[结束]标签页时,无需停止/重启组。

从命令窗口执行

设置是否从命令行(cmd.exe)执行应用程序。执行文件的扩展名为exe/cmd/bat以外的应用程序(JavaScript或VBScript等)时指定此项。

默认值

点击[默认值]按钮,所有项目内容均被设为默认值。

4.3. 设置脚本资源

通过EXPRESSCLUSTER X SingleServerSafe进行管理,可以登录组启动时,终止时执行的脚本。脚本资源中也可以登录用户单独的脚本等。
脚本资源中分别备有开始脚本和结束脚本。各脚本资源在组的启动和结束时执行。文件名是固定的。
start.bat 开始脚本
stop.bat 结束脚本

组A开始脚本:start.bat之例

rem **************************************************************
rem *                          START.BAT                         *
rem **************************************************************

rem 参考脚本执行要因的环境变量分配处理。
IF "%CLP_EVENT%"=="START" GOTO NORMAL
IF "%CLP_EVENT%"=="FAILOVER" GOTO FAILOVER
IF "%CLP_EVENT%"=="RECOVER" GOTO RECOVER


rem 不运行EXPRESSCLUSTER
GOTO no_clp


:NORMAL
IF "%CLP_DISK%"=="FAILURE" GOTO ERROR_DISK

    rem 在此记述业务的正常启动处理。
    rem 该处理在以下时机执行。
    rem
    rem 正常启动
    rem


rem 参考执行服务器环境变量来分配处理。
IF "%CLP_SERVER%"=="OTHER" GOTO ON_OTHER1

    rem 仅当在主服务器上正常启动业务时
    rem 记述要进行的处理。
    rem 该处理在以下时机执行。
    rem
    rem 正常启动
    rem

GOTO EXIT


:ON_OTHER1

rem 仅当在主服务器以外的其他服务器上正常启动业务时
rem 记述要进行的处理。
rem
rem SingleServerSafe中不执行该处理。
rem

GOTO EXIT


:FAILOVER

rem 参考DISK连接信息环境变量来进行错误处理。
IF "%CLP_DISK%"=="FAILURE" GOTO ERROR_DISK

    rem 记述业务的启动处理。
    rem
    rem SingleServerSafe中不执行该处理。
    rem


rem 参考执行服务器环境变量来分配处理。
IF "%CLP_SERVER%"=="OTHER" GOTO ON_OTHER2

    rem 仅当在主服务器上正常启动业务时
    rem 记述要进行的处理。
    rem
    rem SingleServerSafe中不执行该处理。
    rem

GOTO EXIT


:ON_OTHER2

rem 仅当在主服务器以外的其他服务器上正常启动业务时
rem 记述要进行的处理。
rem
rem SingleServerSafe中不执行该处理。
rem


GOTO EXIT


:RECOVER

rem 记述了集群复归后的恢复处理。
rem 该处理在以下时机执行。
rem
rem 集群复归
rem

GOTO EXIT


:ERROR_DISK

rem 记述磁盘相关错误处理。

:no_clp

:EXIT
exit

组A结束脚本:stop.bat之例

rem **************************************************************
rem *                          STOP.BAT                          *
rem **************************************************************

rem 参考脚本执行要因的环境变量来分配处理。
IF "%CLP_EVENT%"=="START" GOTO NORMAL
IF "%CLP_EVENT%"=="FAILOVER" GOTO FAILOVER


rem 不运行EXPRESSCLUSTER
GOTO NO_CLP


:NORMAL
rem 参考DISK连接信息环境变量来进行错误处理。
IF "%CLP_DISK%"=="FAILURE" GOTO ERROR_DISK

    rem 在此记述业务正常结束处理。
    rem 该处理在以下时机执行。
    rem
    rem 正常关机
    rem


rem 参考执行服务器环境变量来分配处理。
IF "%CLP_SERVER%"=="OTHER" GOTO ON_OTHER1

    rem 在此记述仅在主服务器中正常处理业务时
    rem 要进行的处理。
    rem 该处理在以下时机执行。
    rem
    rem 正常关机
    rem

GOTO EXIT


:ON_OTHER1

rem 在此记述仅在主服务器以外的其他服务器中正常结束业务时
rem 要进行的处理。
rem
rem SingleServerSafe中不执行该处理。
rem

GOTO EXIT


:FAILOVER

rem 参考DISK连接信息环境变量来进行错误处理。
IF "%CLP_DISK%"=="FAILURE" GOTO ERROR_DISK

    rem 记述失效切换后的正常结束处理。
    rem
    rem SingleServerSafe中不执行该处理。
    rem


rem 参考执行服务器环境变量来分配处理。
IF "%CLP_SERVER%"=="OTHER" GOTO ON_OTHER2

    rem 记述失效切换后,仅在主服务器中结束业务时
    rem 要进行的处理。
    rem
    rem SingleServerSafe中不执行该处理。
    rem

GOTO EXIT


:ON_OTHER2

rem 记述失效切换后,仅在非主服务器中结束业务时
rem 要进行的处理。
rem
rem SingleServerSafe中不执行该处理。
rem

GOTO EXIT


:ERROR_DISK

rem 记述磁盘相关的错误处理。

:NO_CLP

:EXIT
exit

4.3.1. 创建脚本的提示

  • 通过[clplogcmd]命令可在Alert日志中输出消息。在创建脚本时请灵活运用。

4.3.2. 关于脚本资源的注意事项

在开始/结束脚本中使用start命令时,通过start命令启动脚本侧请使用exit命令结束处理。

4.3.3. 详细标签页

在[脚本列表]中显示现有脚本文件名[start.bat],[stop.bat]。

添加

显示脚本的添加对话框。添加[start.bat],[stop.bat]以外的脚本。

请不要在要添加的脚本的文件名中使用2字节字符。
请不要在要添加的脚本的文件名中使用"&(ampersand)"和" =(等号)"。

删除

删除脚本。无法删除[start.bat],[stop.bat]。

表示

显示所选的脚本文件。无法显示那些正在显示或者正在编辑的脚本文件。

编辑

可以编辑所选的脚本文件。要反映更改内容,请点击[保存]。不能更改脚本文件名。

替换

显示文件选择对话框。

注解

即使在Cluster WebUI上执行[删除]删除脚本文件,也无法删除实际文件。删除脚本文件后,重启Cluster WebUI重新读入配置信息,则删除的脚本文件将显示在[脚本列表]中。

在[资源属性]中选择的脚本文件内容将被替换为文件选择对话框中选择的脚本文件内容。脚本正在显示或者正在编辑时无法替换。请在此处选择脚本文件。请勿选择二进制文件(应用程序等)。

调整

显示[脚本资源属性调优]对话框。进行脚本资源的详细设置。

脚本资源调整属性

参数标签页

显示参数相关的详细信息。

[开始],[停止]所有脚本通用

同步

脚本执行时等待脚本结束。

异步

无法选择。

正常返回值(1023字节以内)

设定脚本的返回值的正确和错误的情况。

  • 没有值时
    忽略返回值。
  • 有值时
    请遵守以下输入规则。
    • 像0,2,3那样使用逗号进行分隔

    • 像0-3那样使用连字号指定

    注解

    设定正常的返回值时,开始和停止请设定相同的值。
    当使用cmd.exe执行脚本,如果发生错误时,其返回值是"1"。如果正常的返回值也设置为"1",则无法区分该错误。

执行恢复处理

设置是否在以下时间执行开始脚本。

  • 服务器复归时

  • 查出监视资源异常时

  • 启动组资源处理异常结束时

作为恢复处理执行时,环境变量CLP_EVENT设置为RECOVER。

超时(1~9999)

设置脚本执行时等待结束时([同步])的超时时间。仅在选择[同步]时可以输入。如果设置时间内脚本没有结束,则判断为异常。

对象VCOM资源名

不使用。

允许桌面对话

在要执行的脚本中设置是否允许与桌面的交互。设置后,则可以在画面中确认脚本进度状况。在对脚本进行调试时使用有效。

执行用户

指定执行脚本的用户。执行用户可以从已在[集群属性]的[账户]标签页注册的用户中选择。
如果未指定执行用户,则脚本将以本地系统帐户身份运行。

默认值

点击[默认值]按钮,则所有项目均被设置为默认值。

4.4. 设置服务资源的详细信息

通过EXPRESSCLUSTER X SingleServerSafe进行管理,可以登录组启动时,结束时执行的服务。服务资源中也可以登录用户单独的服务。
服务是指通过OS的服务控制管理器管理的服务。

4.4.1. 服务资源相关注意事项

  • 一般情况,服务资源设定的服务需要设定为手动启动。自动启动的服务,或者有可执行不通过服务资源启动的服务的场合,必须选择服务资源调整属性对话框的[服务]标签页下的[在服务已经启动的场合下,不产生错误]复选框。如果不选择的话,服务资源在启动已经启动的服务时会发生错误,导致资源启动失败。

  • 为了通过服务资源启动的服务不被EXPRESSCLUSTER以外的程序控制,推荐不要使用服务控制管理器设定恢复操作。
    服务控制管理器的恢复操作里设定了服务再启动时,与EXPRESSCLUSTER的恢复操作重复,可执行导致不符合预期的结果。

4.4.2. 详细标签页

服务名 (1023字节以内)

设置服务资源中使用的服务名或服务显示名。
组合框的选项将显示从所有服务器中获取服务的服务名列表。

连接

从所有服务器中获取服务列表后,将会更新[服务名]组合框中显示的服务名列表。

调整

显示[服务资源的调整属性]对话框。进行服务资源的详细设置。

服务资源的调整属性

参数标签页

显示参数相关的详细设置。

同步

服务开始时等待服务状态变为"已启动"状态。一般开始服务后,状态便由"启动中"迁移到"已启动"。
服务停止时等待服务状态变为"已停止"状态。一般停止服务后,状态便由"启动中" 迁移到"已停止"。

异步

不进行等待。

超时(1~9999)

服务开始时,设置服务状态变为"已启动"状态为止的超时时间。仅在选择[同步]时可以输入。设置时间内如果服务未变为"已启动"状态,则判断为异常。
服务停止时,设置服务状态变为"已停止"状态为止的超时时间。仅在选择[同步]时可以输入。设置时间内如果服务未变为"已停止"状态,则判断为异常。

对象VCOM资源名

不使用。

默认值

点击[默认值]按钮,则所有项目均被设置为默认值。

服务标签页

显示服务相关的详细设置。

开始参数(1023字节以内)

对服务设置输入参数。存在多个输入参数时,设置时用空格隔开。存在包含空格的输入参数时,用双引号("")将输入参数括起来。不能使用反斜线\。
例:"param 1" param2

在服务已经启动的场合下,不产生错误

  • 复选框被选中
    服务开始时,如果服务已经开始,则直接变为启动状态。
  • 复选框未选中
    服务开始时,如果服务已经开始,则视为启动异常。

服务开始后的等待时间 (0~9999)

服务变为启动状态后,指定等待时间。等待了指定的时间后,服务资源的启动变为完成状态。

服务停止后的等待时间 (0~9999)

服务变为停止状态后,指定等待时间。等待了指定的时间后,服务资源的停止变为完成状态。

默认值

点击[默认值]按钮,则所有项目均被设置为默认值。

5. 监视资源的详细信息

本章将对EXPRESSCLUSTER X SingleServerSafe中执行监视操作的单位,即监视资源进行具体说明。

为提高与集群链接软件EXPRESSCLUSTER X的操作性等方面的兼容性,EXPRESSCLUSTER X SingleServerSafe 使用了相同的画面。

本章说明的项目如下。

5.1. 监视资源一览

监视资源的可定义资源如下。

监视资源名

功能

监视时机

对象资源

(粗字为默认值)

应用程序监视资源

对应用程序资源进行监视。

启动时 (固定)

appli

服务监视资源

对服务资源进行监视。

不间断监视/启动时

全部

磁盘RW监视资源

通过向文件系统写入虚拟数据对磁盘设备进行监视。

不间断监视/启动时

全部

IP监视资源

IP监视资源是使用ping 命令,通过是否有应答,对IP地址和通信路径进行监视。

不间断监视/启动时

全部

NIC Link Up/Down监视资源

获取NIC的Link状态,进行Link的Up/Down的监视。

不间断监视/启动时

全部

自定义监视资源

通过执行任意的脚本,进行监视。

不间断监视/启动时

全部

多目标监视资源

通过汇集复数个监视资源的状态,进行监视。

启动时 (固定)

全部

消息接收监视资源

实现"接收发生异常通知时执行的异常时动作的设置"以及"发生异常通知的Cluster WebUI显示"。

不间断监视(固定)

进程名监视资源

监视任意进程名的进程。

不间断监视/启动时

全部

DB2监视资源

向IBM DB2数据库提供监视结构。

启动时 (固定)

全部

FTP监视资源

向FTP服务器提供监视结构。

启动时 (固定)

全部

HTTP监视资源

向HTTP服务器提供监视结构。

启动时 (固定)

全部

IMAP4监视资源

向IMAP服务器提供监视结构。

启动时 (固定)

全部

ODBC监视资源

向ODBC上可访问的数据库提供监视结构。

启动时 (固定)

全部

Oracle监视资源

向Oracle数据库提供监视结构。

启动时 (固定)

全部

POP3监视资源

向POP服务器提供监视结构。

启动时 (固定)

全部

PostgreSQL监视资源

向PostgreSQL数据库提供监视结构。

启动时 (固定)

全部

SMTP监视资源

向SMTP服务器提供监视结构。

启动时 (固定)

全部

SQL Server监视资源

向SQL Server数据库提供监视结构。

启动时 (固定)

全部

Tuxedo监视资源

向Tuxedo应用程序服务器提供监视结构。

启动时 (固定)

全部

WebLogic监视资源

向WebLogic应用程序服务器提供监视结构。

启动时 (固定)

全部

WebOTX监视资源

向WebOTX应用程序服务器提供监视结构。

启动时 (固定)

全部

WebSphere监视资源

向WebSphere应用程序服务器提供监视结构。

启动时 (固定)

全部

JVM监视资源

进行Java VM的监视。

不间断监视/启动时

全部

系统监视资源

进行系统资源的监视。

不间断监视(固定)

全部

进程资源监视资源

进行进程资源的监视。

不间断监视(固定)

全部

用户空间监视

提供用户空间的stall监视功能

不间断监视(固定)

5.1.1. License所需的监视资源

由于下表里的监视资源为可选产品,所以需要License。

使用时,请购买产品License,注册License。

可选产品名

监视资源名

EXPRESSCLUSTER X SingleServerSafe Database Agent 5.0 for Windows

DB2监视资源

ODBC监视资源

Oracle监视资源

PostgreSQL监视资源

SQL Server监视资源

EXPRESSCLUSTER X SingleServerSafe Internet Server Agent 5.0 for Windows

FTP监视资源

HTTP监视资源

IMAP4监视资源

POP3监视资源

SMTP监视资源

EXPRESSCLUSTER X SingleServerSafe Application Server Agent 5.0 for Windows

Tuxedo监视资源

WebSphere监视资源

WebLogic监视资源

WebOTX监视资源

EXPRESSCLUSTER X SingleServerSafe Java Resource Agent 5.0 for Windows

JVM监视资源

EXPRESSCLUSTER X SingleServerSafe System Resource Agent 5.0 for Windows

系统监视资源

进程资源监视资源

关于License的注册步骤,请参考《安装指南》。

5.1.2. 监视选项的动作确认完毕应用程序信息

监视选项以下述的应用程序为监视对象进行动作的确认。

X86_64版

监视资源
监视对象的
应用程序
EXPRESSCLUSTER X SingleServerSafe
Version
备注

Oracle监视

Oracle Databse 19c (19.3)

13.00~

DB2监视

DB2 V11.5

13.00~

PostgreSQL监视

PostgreSQL 14.1

13.00~

PowerGres on Windows V13

13.00~

SQL Server监视

SQL Server 2019

13.00~

Tuxedo 监视

Tuxedo 12c Release 2 (12.1.3)

12.00~

WebLogic监视

WebLogic Server 11g R1

12.00~

WebLogic Server 11g R2

12.00~

WebLogic Server 12c R2 (12.2.1)

12.00~

WebLogic Server 14c (14.1.1)

12.20~

WebSphere监视

WebSphere Application Server 8.5

12.00~

WebSphere Application Server 8.5.5

12.00~

WebSphere Application Server 9.0

12.00~

WebOTX监视

WebOTX Application Server V9.1

12.00~

WebOTX Application Server V9.2

12.00~

WebOTX Application Server V9.3

12.00~

WebOTX Application Server V9.4

12.00~

WebOTX Application Server V9.5

12.00~

WebOTX Application Server V10.1

12.00~

WebOTX Application Server V10.3

12.30~

JVM监视

WebLogic Server 11g R1

12.00~

WebLogic Server 12c R2 (12.2.1)

12.00~

WebLogic Server 14c (14.1.1)

12.20~

WebOTX Application Server V9.1

12.00~

WebOTX Application Server V9.2

12.00~

WebOTX Application Server V9.3

12.00~

WebOTX Application Server V9.4

12.00~

WebOTX Application Server V9.5

12.00~

WebOTX Application Server V10.1

12.00~

WebOTX Application Server V10.3

12.30~

WebOTX Enterprise Service Bus V8.4

12.00~

WebOTX Enterprise Service Bus V8.5

12.00~

WebOTX Enterprise Service Bus V10.3

12.30~

Apache Tomcat 8.5

12.00~

Apache Tomcat 9.0

12.00~

WebSAM SVF for PDF 9.1

12.00~

WebSAM SVF for PDF 9.2

12.00~

WebSAM Report Director Enterprise 9.1

12.00~

WebSAM Report Director Enterprise 9.2

12.00~

WebSAM Universal Connect/X 9.1

12.00~

WebSAM Universal Connect/X 9.2

12.00~

系统监视

不指定版本

12.00~

进程资源监视

不指定版本

12.10~

5.2. 设置监视资源的属性

5.2.1. 信息标签页

名称

显示监视资源名称。

注释 (127 字节以内)

设置监视资源的的注释。只能输入半角的英文数字。

5.2.2. 监视 (共通) 标签页

间隔(1~999)

设置确认监视对象状态的时间间隔。

超时(5~999)

若在指定时间内没有发现监视对象的正常状态,则判断为异常。

超时发生时获取监视进程的dump文件 (仅Oracle监视资源时)

指定发生超时时,是否收集监视进程的Dump文件。
收集的Dump文件存放在EXPRESSCLUSTER 安装目录的 work\rm\资源名\errinfo.cur 文件夹下。多次收集的情况下,之前收集的文件夹的名字重命名为errinfo.1,errinro.2等,并且只存放最新的5次收集的Dump文件。

超时发生时不进行重试

将本功能设为有效时,若监视资源发生超时则立即执行复归操作。

超时发生时不执行复归操作

将本功能设为有效时,若监视资源发生超时则不执行复归操作。
仅在将[超时发生时不进行重试]功能设为有效时可以设置。

注解

在以下监视资源中,不能设置[超时发生时不进行重试], [超时发生时不执行复归操作]功能。

  • 自定义监视资源 (仅在监视类型为[异步]时)

  • 多目标监视资源

  • 消息接收监视资源

  • JVM监视资源

  • 系统监视资源

  • 进程资源监视资源

  • 用户空间监视资源

重试次数(0~999)

发现异常状态后,若连续指定次数发现异常,则判断为异常。
若指定为0,则在最初发现异常时即判断为异常。

开始监视的等待时间(0~9999)

设置等待监视开始的时间。

监视时间

设置监视的时机。

  • 不间断监视
    一直进行监视。
  • 指定资源被启动后开始监视
    指定资源启动之前不进行监视。
    [监视时间]选择[指定资源被启动后开始监视]时,必须要对[目标资源]进行设定。点击[参照]选择监视的目标资源。
    选择监视目标资源,点击[确定]。

目标资源

显示启动时进行监视的对象资源。

参照

显示[选择对象资源]对话框。树形显示服务器名和资源名。选择要设置的对象资源,点击[确定]。

选择监视服务器

不使用。

发送监视处理时间指标

设置监视处理时间指标的发送功能。

  • 选中复选框
    发送监视资源的监视处理时间指标。
  • 不选中复选框
    不发送监视资源的监视处理时间指标。

注解

使用Amazon Cloud Watch联动功能时,启用本功能,可以发送任意的监视资源的监视处理时间指标。
下面的监视资源中,不能设置[发送监视处理时间指标]功能。
  • 消息接收监视资源

5.2.3. 监视 (固有) 标签页

有些监视资源需要设置监视操作时的参数。参数请参考各个资源的说明。

5.2.4. 复归操作标签页

通常的监视资源(外部监视关联资源以外)的场合

外部监视关联资源的场合

设置复归对象和查出异常时的运行。查出异常时可重新启动组的失效切换,资源和集群。但是,如果复归对象处于停止状态则不进行恢复运行。

复归动作

选择异常检出时的复归操作。

  • 对复归对象进行重新启动
    对复归对象里选择的失效切换组或者组资源所属的组进行重新启动。重新启动失败,或者重新启动后发生相同的异常时,则执行最终动作里选择的动作。
  • 只在最终动作时执行
    执行最终动作里选择的动作。
  • 自定义设置
    在重启动次数范围内对复归对象里选择的失效切换组或者组资源所属的组进行重新启动。重新启动失败,或者重新启动后发生相同的异常,或者达到重启动次数上限,则执行最终动作里选择的动作。

复归对象

当发现资源异常时,显示要进行恢复的对象。

参照

显示[选择复归对象]对话框。树形显示LocalServer,All Groups和集群中登录的组名,资源名。选择要设置的恢复对象,点击[确定]。

复归脚本运行回数 (0~99)

发现异常时,设置[脚本设置]中脚本的执行次数。若设置为0,则不执行脚本。

重启动前运行脚本

指定是否在进行重新启动前执行脚本。

重启动次数(0~99)

设置出现异常时进行重新启动的次数。若设置为0,则不重新启动。若选择组或组资源为恢复对象,可进行设置。外部关联监视资源的场合该值不能设定。

失效切换执行前运行脚本

不使用。

失效切换目标服务器

不使用。

最大失效切换次数

不使用。

在最终动作前运行脚本

指定是否在最终动作前运行脚本。

  • 选中复选框
    在最终动作前运行脚本。要进行脚本/命令设置时,请点击[设置]按钮。
  • 未选中复选框
    不运行脚本/命令。

复归动作前运行脚本

指定是否在执行复归运行前执行脚本
仅在消息接收监视资源可设置。
  • 选中复选框
    执行复归运行前执行脚本/命令。要进行脚本/命令的设置,请点击[设置]。
  • 未选中复选框
    不执行脚本/命令。

脚本设置

显示[编辑脚本]对话框。设置复归脚本/命令。

用户应用程序

使用作为脚本的可在服务器上执行的文件(可执行的批处理文件,执行文件)。在文件名中设置服务器上的本地磁盘绝对路径或者可执行文件名。但是,只设置可执行文件名时,需要事先在环境变量中设置路径。此外,如果在绝对路径,文件名包含空格时,如下所示,请用双引号(")括起来。

例:

"C:\Program Files\script.bat"

另外,执行VB脚本时请输入以下所记的。

例:

cscript script.vbs

各可执行文件不包含在Cluster WebUI的集群配置信息中。由于无法在Cluster WebUI中进行编辑和上传,所以需要在各服务器上准备。

用Cluster WebUI创建的脚本

使用作为脚本的在Cluster WebUI中准备的脚本文件。可以在Cluster WebUI中编辑脚本文件。脚本文件包含在集群配置信息中。

文件 (1023字节内)

选择[用户应用程序]时,设置执行的脚本(可执行的批处理文件,执行文件)。

显示

选择[用Cluster WebUI创建的脚本]时,显示脚本文件。

编辑

选择[用Cluster WebUI创建的脚本]时,编辑脚本文件。如要反映更改时,请点击[保存]。无法更改脚本文件名。

替换

选择[用Cluster WebUI创建的脚本]时,将脚本文件的内容替换为文件选择对话框中选择的脚本文件内容。如脚本已经为显示中或者编辑中时,无法替换。请选择脚本文件。请不要选择二进制文件(应用程序)。

超时 (1~9999)

指定等待脚本结束的最大时间。规定值为5秒。

执行用户

指定执行脚本的用户。执行用户可以从已在[集群属性]的[账户]标签页注册的用户中选择。
如果未指定执行用户,则脚本将以本地系统帐户身份运行。

最终动作

选择通过重新启动复归失败后的复归动作。
最终运行有以下选择。
  • 无操作
    不进行任何操作。

注解

以下情况下请使用[无操作]设置。

  • 暂时控制最终动作时

  • 查出异常后想仅显示警报时

  • 通过多目标监视资源执行实际的最终动作时

  • 停止资源
    若选择组资源为监视对象时,停止该组资源和依赖该组资源的组资源。若选择"LocalServer","All Groups",组为监视对象时,无法选择本项目。
  • 停止组
    若选择监视对象为组时,停止该组,或选择组资源为监视对象时,停止该组资源所属的组。若选择"All Groups",则停止监测到异常的监视资源所在的服务器上启动的所有组。若选择LocalServer为复归对象,则无法选择。
  • 停止集群服务
    停止出现异常的服务器的EXPRESSCLUSTER Server服务。
  • 停止集群服务并关闭操作系统
    停止出现异常的服务器的EXPRESSCLUSTER Server服务,关闭OS。
  • 停止集群服务并操作系统重启
    停止出现异常的服务器的EXPRESSCLUSTER Server服务,重启OS。
  • 生成主动停止错误
    有意使查出异常的服务器发生停止错误。

5.3. 设置应用程序监视资源

应用程序监视资源对应用程序资源进行监视。在启动了应用程序资源的服务器中进行监视。仅在应用程序资源的常驻类型设置为[常驻]时,可以监视。

5.3.1. 应用程序监视资源的监视方法

定期对应用程序进行死活监视,发现应用程序关闭时判断为异常。

5.3.2. 应用程序监视资源相关注意事项

对成功启动的应用程序资源进行监视。仅在应用程序资源的常驻类型设置为[常驻]时,可以监视。

添加应用程序资源时,若常驻类型设置为"常驻",则本资源将自动登录。各应用程序资源对应的应用程序监视资源将自动登录。
应用程序监视资源设置了默认值,必要时请更改为合适的值。
添加应用程序资源时,若常驻类型设置为"非常驻",则无法添加本资源。

5.4. 设置服务监视资源

服务监视资源对服务资源或者服务进行监视。

5.4.1. 服务监视资源的监视方法

定期向服务控制管理器询问服务的状态,若处于"已停止"状态,则判断为出现异常。

5.4.2. 关于服务监视资源的注意事项

选择[监视时机]-[启动时监视],在[对象资源]中设置服务资源时,服务监视资源的[服务名]设置为服务资源的[服务名]。

5.4.3. 监视(固有)标签页

服务名 (1023字节以内)

设置服务资源中使用的服务名或服务显示名。

组合框的选项将显示从所有服务器中获取服务的服务名列表

如果服务名是在[监视时机]-[启动时监视]-[对象资源]中设置服务资源时,则不能更改设置。

连接

从所有服务器中获取服务列表后,将会更新[服务名]组合框中显示的服务名列表。

5.5. 设置磁盘RW监视资源

磁盘RW监视资源通过对文件系统进行虚拟数据写入,对磁盘设备进行监视。

5.5.1. 使用磁盘RW监视资源进行监视的方法

按照指定的I/O大小写入指定的文件系统(Basic Volume 或Dynamic Volume),判断该结果(写入的大小)(作成的文件在写入后被删除)。
仅判断指定的I/O大小已经成功write,不判断写入数据是否合法。
若增大要write的I/O大小,OS或磁盘负荷将会增大。
由于使用的磁盘或接口不同,有时实现用于write的缓存可执行各种各样。因此当I/O大小很小时,可执行冲击缓存,无法查出write的错误。
请有意制造磁盘故障等,以便确认关于I/O大小足够查出故障。

注解

监视对象磁盘发生磁盘路径故障,磁盘路径冗余化软件等功能执行失效切换时,需将监视超时的时间(默认值300秒)设置成大于路径失效切换所需时间。

5.5.2. 监视 (固有) 标签页

文件名(1023字节以内)

输入用于访问的文件名。本文件在监视处理时创建,I/O结束时删除。

注解

文件名请指定为绝对路径。若指定为相对路径,有时监视的路径可执行是指定路径之外的其他路径。

重要

指定文件名时请不要指定已经存在的文件。若指定的文件已经存在,该文件信息将会丢失。

I/O大小 (1~9999999 默认值:2000000)

指定针对要监视的磁盘进行I/O的大小。

查出Stall异常时的动作

指定查出停止(Stall)异常时的运行。

  • 无动作
    不进行任何操作。
  • HW重置 2
    重置硬件。
  • 生成主动停止错误(默认值)
    促使发生停止错误。
2

本机能与强制停止机能不同,使用时无需ipmiutil。

磁盘已满时的处理

指定查出磁盘已满(监视的磁盘没有空余容量的状态)时的运行。

  • 执行复归操作
    磁盘RW监视资源将查出磁盘已满作为异常操作来处理。
  • 不执行复归操作
    磁盘RW监视资源将查出磁盘已满作为警告操作来处理。

使用Write Through方式

监视I/O方式适用于Write Through方式。

  • 有效时,提高磁盘RW监视的异常检测精确度,但会发生系统I/O负荷上升的现象。

5.6. 设置IP监视资源

IP监视资源是使用ping 命令,通过是否有应答,对IP地址进行监视的监视资源。

5.6.1. IP监视资源的监视方法

使用ping 命令对指定IP地址进行监视。若指定IP地址没有任何应答,则判断为异常。

  • 在存在多个IP地址,且全部IP地址出现异常,被判断为异常的情况下,请在1个IP监视资源中登录所有IP地址。

    下图是将所有IP地址都注册到1个IP监视资源中的示例。 指定的IP地址即使只有1个是正常的情况下,IP monitor 1都会判断为正常。

    运行IP监视资源的服务器和作为监视对象的3台服务器

    图 5.1 在1个IP监视资源中注册所有IP地址(正常)

    下图是将所有IP地址都注册到1个IP监视资源中的示例。 指定的IP地址全异常时,IP monitor 1判断为异常。

    运行IP监视资源的服务器和作为监视对象的3台服务器

    图 5.2 在1个IP监视资源中注册所有IP地址(查出异常)

  • 多个IP地址中,若要判断其中某一个为异常时,需要按照各个IP地址,分别创建IP监视资源。
    运行IP监视资源的服务器和作为监视对象的3台服务器

    图 5.3 将IP地址一个个都注册到各IP监视资源中(查出异常)

5.6.2. 监视 (固有) 标签

[IP地址列表]中显示要监视的IP地址列表。

添加

添加要监视的IP地址。显示IP地址的输入对话框。

删除

在监视对象中删除[IP地址列表]中选中的IP地址。

编辑

显示输入IP地址的对话框。显示[IP地址]中选中的IP地址,编辑后点击[确定]。

Ping超时 (1~999999 默认值:1000)

以毫秒为单位设置Ping所要监视的IP地址的超时时间。

输入IP地址

显示关于接口的详细设定。

IP地址 (255字节以内)

输入进行监视的IP地址,点击[确定]。请输入可常時通信的IP地址。

5.8. 设置自定义监视资源

自定义监视资源是通过执行任意的脚本对系统进行监视的一种监视资源。

5.8.1. 自定义监视资源的监视方法

自定义监视资源通过任意的脚本进行系统监视。
监视类型为[同步]时,定期执行脚本,通过该错误代码判断是否异常。
监视类型为[异步]时,在监视开始时执行脚本,如该脚本进程消失则判断为异常。

5.8.2. 自定义监视资源相关注意事项

  • 在bat文件内执行向命令窗口输出消息(标准输出,错误输出)的命令时,由于在命令执行时bat文件有可执行停止,请将消息输出点指定为文件或者null(重定向)。

  • 监视类型为[异步]时,请在超时中设置比监视开始等待时间大的值。

5.8.3. 监视 (固有) 标签页

用户应用程序

使用作为脚本的可在服务器上执行的文件(可执行的批处理文件,执行文件)。各可执行文件名在服务器上的本地磁盘绝对路径中设置。
各可执行文件不包含在Cluster WebUI的集群配置信息中。由于无法在Cluster WebUI中进行编辑和上传,所以需要在各服务器上准备。

用Cluster WebUI创建的脚本

使用作为脚本的在Cluster WebUI中准备的脚本文件。可以在 Cluster WebUI中编辑脚本文件。脚本文件包含在集群配置信息中。

文件 (1023字节以内)

执行的脚本(可执行的批处理文件,执行文件)在服务器上的本地磁盘绝对路径中设置。但是脚本的后面不能指定参数。

显示

选择[用Cluster WebUI创建的脚本]时,显示脚本文件。

编辑

选择[用Cluster WebUI创建的脚本]时,编辑脚本文件。如要反映更改时,请点击[保存]。无法更改脚本文件名。

替换

选择[用Cluster WebUI创建的脚本]时,将脚本文件的内容替换为文件选择对话框中选择的脚本文件内容。如脚本已经为显示中或者编辑中时,无法替换。请选择脚本文件。请不要选择二进制文件(应用程序)。

监视方式

选择监视方法。

  • 同步(默认值)
    定期执行脚本,通过该错误代码判断是否异常。
  • 异步
    在监视开始时执行脚本,如该进程消失则判断为异常。

正常的返回值 (1023字节以内)

监视类型为[同步]时,对于脚本的错误代码是什么值时判断为正常进行设置。有多个值时,像0,2,3这样用逗号分隔开,或者像0-3这样用连字号指定数值范围。

默认值 : 0

退出时强制结束应用程序

作为监视停止时的终了处理,设定是否强制停止应用。设定时不执行通常的停止处理, 强制停止应用。只有在监视类型为[异步]时有效。

执行用户

指定执行脚本的用户。执行用户可以从已在[集群属性]的[账户]标签页注册的用户中选择。
如果未指定执行用户,则脚本将以本地系统帐户身份运行。

当停止集群时,等待启动时监控的停止

在集群停止时,等待自定义监视资源停止。只有在监视时间设置为[启动时]才有效。

5.9. 设置多目标监视资源

多目标监视资源对多个监视资源进行监视。

5.9.1. 多目标监视资源的注意事项

  • 多目标监视资源将登录中监视资源的状态下线(offline)处理为异常。为此,已登录启动时监视的监视资源时,因监视资源不能查出异常的状态下,多目标监视器资源查出异常的现象。请勿登录启动时监视的监视资源。

5.9.2. 多目标监视资源的状态

多目标监视资源的状态是根据已登录的监视资源状态进行判断。
如下设置多目标监视资源时
已登录的监视资源数 2
异常次数 2
警告次数 1

多目标监视资源的状态如下所示。

监视资源1状态
正常
(normal)
监视资源1状态
异常
(error)
监视资源1状态
已停止
(offline)
监视资源2状态
正常
(normal)
正常
(normal)
警告
(caution)
警告
(caution)
监视资源2状态
异常
(error)
警告
(caution)
异常
(error)
异常
(error)
监视资源2状态
已停止
(offline)
警告
(caution)
异常
(error)
正常
(normal)
  • 多目标监视资源对已登录的监视资源状态进行监视。
    异常(error)状态的监视资源数超过异常次数时,多目标监视资源则会查出异常(error)。
    异常(error)状态的监视资源数超过警告次数时,多目标监视资源的状态会变为警告(caution)。
    若所有登录的监视资源状态都已停止(offline),多目标监视资源的状态将为正常(normal)。
    除了所有登录的监视资源状态均已停止(offline)的情况之外,多目标监视资源将已登录的监视资源状态处于已停止(offline)的情况判断为异常(error)。
  • 即便已登录的监视资源状态为异常(error),也不会执行该监视资源出现异常时的操作。
    仅在多目标监视资源出现异常(error)时,才会执行多目标监视资源出现异常时的操作。

5.9.3. 监视 (固有) 标签页

将监视资源分组后,对该组的状态进行监视。[监视资源一览]中最多可登录64个监视资源。
当本资源的[监视资源一览]中唯一设置的监视资源被删除时,本资源将会自动被删除。

添加

将选中监视资源添加到[监视资源列表]中。

删除

在[监视资源列表]中删除选中的监视资源。

调整

显示[多目标监视资源调整属性]的对话框。进行多目标监视资源的详细设定。

多目标监视资源的调整属性

参数标签页

显示关于参数的详细设定。

异常次数

选择多目标监视器为异常的条件。

  • 与成员总数相同
    多目标监视器下指定的监视资源全都异常,或者既有异常又有已停止时,多目标监视器为异常。
    多目标监视器下指定的监视资源都为已停止时,属于正常。
  • 设定数字
    在多目标监视器下指定的监视资源中,异常次数中设置的数值异常或者为已停止时,多目标监视器视为异常。
    在多目标监视器下指定的监视资源中,在多少个监视资源异常或者为已停止时,视为多目标监视器异常。设置该数值。
    异常次数的选择为[指定数值]时可以进行设置。

警告次数

  • 选中复选框
    多目标监视器下指定的监视资源中,在多少个监视资源为异常或者已停止时,视为多目标监视器警告。设置该数值。
  • 未选中复选框
    多目标监视器部显示警告Alert。

默认值

返回默认值时使用。点击[默认值],则所有项目被设置成默认值。

5.10. 设置消息接收监视资源

消息接收监视资源是被动的监视。自身不执行监视处理。
是接收到外部使用clprexec 命令发行的异常发生通知时,执行消息接收监视资源的状态更
改,异常发生时的恢复动作的监视资源。

5.10.1. 消息接收监视资源监视方法

接收到外部的异常发生通知时,执行已设置了已通知监视类型和监视对象(可省略监视对象)的消息接收监视资源的异常发生时的恢复动作。
有多个已设置了已通知监视类型,监视对象的消息监视资源时,执行各监视资源的恢复动作。

图为使用消息接收监视资源的配置示例。 从clprexec命令接收到异常发生通知的Server2的消息接收监视资源 (Message receive monitor resource) ,执行查出自身状态更改和异常时的复归动作。

执行clprexec命令的Server 1,运行消息接收监视资源的Server 2

图 5.4 使用消息接收监视资源的配置

5.10.2. 消息接收监视资源相关注意事项

  • 在消息接收监视资源处于暂停状态下接收到外部的异常发生通知时,不执行异常时动作。

  • 接收到外部的异常发生通知时,消息接收监视资源的状态变成异常。变成异常的消息接收监视资源的状态不会自动恢复到正常。请使用clprexec命令将其状态恢复到正常。关于clprexec命令,请参考《操作指南》的"EXPRESSCLUSTER X SingleServerSafe 命令参考"。

  • 在接收到外部的异常发生通知,消息接收监视资源的状态变成异常的状态下,接收到异常发生通知时,不执行异常发生时的恢复动作。

5.10.3. 监视 (固有) 标签页

在监视类型和监视对象中使用clprexec命令参数-k设置要传递的关键词。可以省略监视对象。

分类(32字节以内)

[clprexec]命令的参数[-k]指定传递的分类参数。

关键字(1023字节以内)

[clprexec]命令的参数[-k]指定传递的关键字参数。

5.11. 设置进程名监视资源

进程名监视资源是监视任意的进程名的进程的监视资源。

5.11.1. 进程名监视资源的注意事项

进程数下限值为1,存在多个指定为监视对象的进程名之进程时,按以下条件选择一个进程作为监视对象,并进行监视。

  1. 进程间存在主从关系时,监视主进程。

  2. 进程间无主从关系时,监视启动时间最早的进程。

  3. 若进程间无主从关系,且启动时间也相同,则监视进程ID最小的进程。

同一名称的进程多个存在时,根据进程的启动个数进行监视时,设置监视进程数下限值的个数。低于同一名称进程的设置个数时判断为异常发生。进程数的下限值的个数可指定为1到999之间。进程数下限值设置为1时,选择一个进程作为监视对象,并进行监视。

可指定为监视对象的进程名最多为1023字节。若指定超过1023字节的进程名之进程为监视对象时,使用通配符号(*)进行指定。
如果监视对象进程的进程名比1023字节长时,可以识别的进程名从开始位置到1023字节为止。如果通配符号(*)进行指定,则需指定包含1023字节以内的字符串。

监视对象的进程名过长时,输出到日志等的进程名信息以省略了后半部分的形式来显示。

监视的进程中如果进程名包含「"」(双引号),「,」(逗号)时,警报日志中的进程名有时可执行不能正确显示。

请按照以下命令,确认并设定监视对象进程名的实际动作中进程的进程名。

EXPRESSCLUSTER安装路径\bin\GetProcess.vbs

从上面的命令中确认实际运行进程的进程名,并在输出信息的CommandLine部分指定监视对象的进程名。输出信息中包含「"」(双引号)时,「"」(双引号)也需要指定。

输出文件的列子

20XX/07/26 12:03:13
Caption     CommandLine
services.exe    C:\WINDOWS\system32\services.exe
svchost.exe     C:\WINDOWS\system32\svchost -k rpcss
explorer.exe    C:\WINDOWS\Explorer.EXE

从上面的命令输出信息来看,如果要监视 svchost.exe,需指定监视对象进程名 C:\WINDOWS\system32\svchost -k rpcss

指定为监视对象进程名的进程名可以将进程参数也作为进程名的一部分特定为监视对象的进程。指定监视对象进程名时,请指定包括参数在内的进程名。仅监视不含参数的进程名时,请使用通配符号(*)来指定不含参数的前方一致或部分一致。

5.11.2. 进程名监视资源的监视方法

监视指定进程名的进程。进程数的下限值为1时,根据进程名确定进程ID,进程ID消失则判断为异常。无法检测出进程的停止。

进程数的下限值设置为大于1的数值时,根据个数对设置的进程名的进程进行监视。并根据进程名计算出监视对象进程的个数,低于下限值时判断为异常。不能查出进程的停止。

5.11.3. 监视 (固有) 标签页

进程名(1023字节以内)

设置监视的进程名。请务必进行设置。
默认值 :无

此外,可使用下述的3种模式指定进程名的通配符号。其它模式不可指定。

  • 【前方一致】 <包含进程名中的字符串>*

  • 【后方一致】*<包含进程名中的字符串>

  • 【部分一致】*<包含进程名中的字符串>*

进程数量下限 (1~999)

设置作为监视对象的进程的监视个数。如果进程名中设置的监视对象的进程的个数低于设置值时,判断为异常。

5.12. 设置DB2监视资源

DB2监视资源是监视服务器上运行的DB2的数据库的监视资源。

5.12.1. DB2监视资源的注意事项

关于确认过运行的DB2版本,请参考"5. 监视资源的详细信息"的"5.1.2. 监视选项的动作确认完毕应用程序信息"。

因为监视处理使用DB2的CLI,所以需要在执行监视的服务器上安装用于接口的DLL (DB2CLI.DLL/DB2CLI64.DLL)。

请在监视对象资源中指定启动DB2的服务资源或脚本资源。启动监视对象资源后,开始监视。但如果启动监视对象资源后,发生数据库不能立即运行等情况,请通过[开始监视的等待时间]进行调整。

开始监视时,创建监视表。因为失效切换组停止导致监视也停止时,会删除监视表。监视暂时中断等情况下,不会删除监视表。另外,由于系统异常等导致服务器在失效切换组停止前发生宕机等现象时,不会删除监视表,所以下次开始监视时,会显示"a monitor table exists"的错误消息,这不属于异常。

针对每个监视操作,DB2自身将会输出运行日志等。请根据需要,通过DB2的设置进行控制。

以下"5.12.2. DB2监视资源的监视方法"中说明的监视级别中,请注意以下几点。
选择"级别1",且监视开始时没有监视表,则监视发生错误。请创建以下监视表。
选择"级别2",且监视开始时没有监视表,EXPRESSCLUSTER将自动创建监视表。这时,Cluster WebUI的Alert日志中显示没有监视表的消息。

选择的监视级别

事先创建监视表格

级别1(在select中的监视)

有必要

级别2(在update/select中的监视)

没有必要

可按以下步骤创建监视表格。

(以监视表格名为db2watch时为例):

sql> create table DB2WATCH (num int not null primary key)
sql> insert into DB2WATCH values(0)
sql> commit

5.12.2. DB2监视资源的监视方法

DB2监视资源按从以下监视级别中选择的级别进行监视。

  • 级别1(在select中的监视)
    该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select )。
    作为监视结果,如果出现以下情况则视为异常。
    1. 数据库连接失败时

    2. SQL语句响应中通知异常时

  • 级别2(在update/select中的监视)
    该监视也进行监视表格的更新。通过SQL语句,对最大10行数值数据进行写入和读入操作。监视的开始以及结束时进行监视表格的作成和删除。对监视表格发行的SQL文为create / update / select / drop。
    作为监视结果,如果出现以下情况则视为异常。
    1. 数据库连接失败时

    2. 在SQL语句的响应中通知有异常时

    3. 写入和读入的数据不一致时

5.12.3. 监视 (固有) 标签页

监视级别

从以下选项中选择一项。请务必进行设置。

  • 级别1(在select中的监视)
    该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。
  • 级别2(在update/select中的监视)
    该监视还对监视表格进行更新。对监视表格执行的SQL语句为(create /update / select /drop )。

默认值 : 级别2(在update/select中的监视)

数据库名 (255字节以内)

指定要监视的数据库名。请务必设置。

默认值:无

实例名 (255字节以内)

指定要监视的数据库的实例名。请务必设置。

默认值:DB2

用户名 (255字节以内)

指定登录数据库时使用的用户名。

默认值 : db2admin

密码 (255字节以内)

指定登录数据库时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。

默认值:无

监视表名 (255字节以内)

指定在数据库上创建的用于监视的表格的名称。请务必设置。因为该表需要创建和删除,请注意不要与运行时用到的表格重名。另外,还需要注意不要与SQL语句的保留字重复。
根据数据库的式样,监视的表名有不能设置的字符。详细请确认数据库的式样。

默认值 : DB2WATCH

5.13. 设置FTP监视资源

FTP监视资源对服务器上运行的FTP服务进行监视。它监视FTP协议,而不是监视特定的应用程序。因此,可以对使用FTP协议的各种应用程序进行监视。

5.13.1. FTP监视资源的注意事项

请在监视对象资源中指定启动FTP的服务资源或脚本资源等。启动监视对象资源后,开始监视。但如果启动监视对象资源后,发生FTP不能立即运行等情况,请通过[开始监视的等待时间]进行调整。
针对每个监视操作,FTP服务自身将会输出运行日志等。请根据需要,通过FTP的设置进行控制。
将FTP服务器的FTP消息(横幅,连接FTP时的通知等)从既定的设置变更时,有可执行被视为监视异常。
在[协议]中选择FTPS时,必须在[集群属性]的[加密]标签页中设置OpenSSL库的安装路径。FTPS使用的OpenSSL库的版本仅支持OpenSSL 1.1.1。

5.13.2. FTP监视资源的监视方法

FTP监视资源进行以下监视。
连接FTP服务器,执行文件列表获取命令。
作为监视结果,如果出现以下情况则视为异常。
  1. FTP资源连接失败时

  2. 在对FTP命令的响应中通知有异常时

5.13.3. 监视 (固有) 标签页

IP地址 (255字节以内)

指定要监视的FTP服务器的IP地址。请务必设置。
由于一般情况下连接到在自身服务器中工作的FTP服务器上,因此设置回环地址(127.0.0.1)。但因FTP服务器设置对能够连接的地址进行了限制时,设置可连接的地址(浮动IP地址等)。

默认值 : 127.0.0.1

端口号 (1~65535)

指定要监视的FTP的端口号。请务必设置。

默认值 : 21

用户名 (255字节以内)

指定登录FTP时使用的用户名。

默认值 : 无

密码 (255字节以内)

指定登录FTP时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。

默认值 : 无

协议

设置用于与 FTP 服务器通信的协议。 通常选择 FTP,但如果需要通过 FTP over SSL / TLS 进行连接,请选择 FTPS。

默认值 : FTP

5.14. 设置HTTP监视资源

HTTP监视资源监视服务器上运行的HTTP服务。它监视HTTP协议,而不是特定的应用程序。因此,可以对使用HTTP协议的各种应用程序进行监视。

5.14.1. HTTP监视资源的注意事项

请在监视对象资源中指定启动HTTP的服务资源或脚本资源等。启动监视对象资源后,开始监视。但如果启动监视对象资源后,发生HTTP不能立即运行等情况,请通过[开始监视的等待时间]进行调整。
针对每个监视操作,HTTP服务自身会输出运行日志等。请根据需要,通过HTTP的设置进行控制。
HTTP监视资源不支持客户端认证。
可用于 HTTP 监视资源的 DIGEST 认证的算法是 MD5。

5.14.2. HTTP监视资源的监视方法

HTTP监视资源进行以下监视。

连接到服务器上的HTTP Daemon,通过发送HTTP request执行HTTP daemon监视。
作为监视结果,如果出现以下情况则视为异常。
  1. 连接HTTP daemon时通知异常

  2. 应答HTTP request的信息不是以"HTTP/"开头

  3. 应答HTTP request的状态代码为400,500时(Request URI指定默认值以外的URI时)

5.14.3. 监视 (固有) 标签页

连接目的端 (255字节以内)

指定要监视的HTTP服务器的IP地址。请务必设置。
由于一般情况下连接到在自身服务器中工作的HTTP服务器上,因此设置回环地址(127.0.0.1)。但因HTTP服务器设置对能够连接的地址进行了限制时,设置可连接的地址(浮动IP地址等)。

默认值 : 127.0.0.1

端口号 (1~65535)

指定要监视的HTTP的端口号。请务必设置。

默认值 : 80 (HTTP)
443 (HTTPS)

监视URI (255字节以内)

指定要监视的HTTP的URI。
如果不指定,则对document root进行监视。不需要创建监视用页面。
如果指定,则对指定的特定URI进行监视。指定的URI需要具备可匿名访问的权限。
使用从document root开始的URI进行如下描述。
(例) 监视对象Web页面的URL为
http://WebServer:80/watch/sample.htm

/watch/sample.htm

默认值:无

协议

设置和HTTP服务器通信使用的协议。一般选择HTTP,但是必须通过HTTP over SSL连接时选择HTTPS。

注解

如果选择了[HTTPS],则无论选择哪种请求类型选项,都将发出GET请求。

Request类型

设置连接到HTTP服务器时的HTTP Request的类型。请务必进行设置。

默认值 : HEAD

认证方式

设置连接到 HTTP 服务器时的认证方法。

默认值 : 无需认证

用户名(255字节以内)

设置登录HTTP时的用户名。

默认值 : 无

密码(255字节以内)

设置登录HTTP时的密码。

默认值 : 无

5.15. 设置IMAP4监视资源

IMAP4监视资源对服务器上运行的IMAP4服务进行监视。它监视IMAP4协议,而不是特定的应用程序。因此,可以对使用IMAP4协议的各种应用程序进行监视。

5.15.1. IMAP4监视资源的注意事项

请在监视对象资源中指定启动IMAP4服务器的服务资源及脚本资源等。虽然在启动对象资源后开始进行监视,但如果对象资源启动后IMAP4服务器不能立即运行或其他情况下,请通过[开始监视的等待时间]进行调整。

针对每个监视动作,IMAP4服务本身会输出运行日志等,请通过IMAP4服务器侧的设置进行适当控制。

5.15.2. IMAP4监视资源的监视方法

IMAP4监视资源进行以下监视。
连接IMAP4服务器,执行运行确认命令。
作为监视结果,如果出现以下情况则视为异常。
  1. 连接IMAP4服务器失败

  2. 在对命令的响应中通知有异常时

5.15.3. 监视 (固有) 标签页

IP地址 (255字节以内)

指定要监视的IMAP4服务器的IP地址。请务必设置。
由于一般情况下连接到在自身服务器中工作的IMAP4服务器上,因此设置回环地址(127.0.0.1)。但因IMAP4服务器设置对能够连接的地址进行了限制时,设置可连接的地址(浮动IP地址等)。

默认值 : 127.0.0.1

端口号 (1~65535)

指定要监视的IMAP4的端口号。请务必设置。

默认值 : 143

用户名 (255字节以内)

指定登录IMAP4时使用的用户名。

默认值 : 无

密码 (189字节以内)

指定登录IMAP4时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。

默认值 : 无

认证方式

指定登录IMAP4时使用的认证方法。需要与使用的IMAP4的设置保持一致。

  • AUTHENTICATE LOGIN(默认值)
    使用AUTHENTICATE LOGIN命令的加密认证方式。
  • LOGIN
    使用LOGIN命令的明文方式。

5.16. 设置ODBC监视资源

ODBC监视资源用于监视服务器上运行的ODBC数据库。

5.16.1. ODBC监视资源的注意事项

因为监视处理使用ODBC驱动程序,所以需要事先使用Windows的ODBC数据源管理器对数据源进行设置。数据源添加到系统数据源内。
请在监视对象资源中指定启动的服务资源或脚本资源等。启动监视对象资源后,开始监视。但如果启动监视对象资源后,发生数据库不能立即运行等情况,请通过[开始监视的等待时间]进行调整。
开始监视时,创建监视表。因为失效切换组停止导致监视也停止时,会删除监视表。监视暂时中断等情况下,不会删除监视表。另外,由于系统异常等导致服务器在失效切换组停止前发生宕机等现象时,不会删除监视表,所以下次开始监视时,会显示"a monitor table exists"的错误消息,这不属于异常。
针对每个监视操作,数据库自身将会输出运行日志等。请根据需要,通过数据库的设置进行控制。
以下"5.16.2. ODBC监视资源的监视方法 "中说明的监视级别中,请注意以下几点。
选择"级别1",且监视开始时没有监视表,则监视发生错误。请创建以下监视表。
选择"级别2",且监视开始时没有监视表,EXPRESSCLUSTER将自动创建监视表。这时,Cluster WebUI的Alert日志中显示没有监视表的消息。

选择的监视级别

事先创建监视表格

级别1(在select中的监视)

有必要

级别2(在update/select中的监视)

没有必要

可按以下步骤创建监视表格。

(以监视表格名为odbcwatch时为例):

sql> create table ODBCWATCH (num int not null primary key);
sql> insert into ODBCWATCH values(0);
sql> commit;

5.16.2. ODBC监视资源的监视方法

ODBC监视资源按从以下监视级别中选择的级别进行监视。

  • 级别1(在select中的监视)
    该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select )。
    作为监视结果,如果出现以下情况则视为异常。
    1. 连接数据库失败时

    2. 在响应SQL语句响应中通知异常时

  • 级别2(在update/select中的监视)
    该监视也进行监视表格的更新。通过SQL语句,对最大10 行数值数据进行写入和读入操作。监视的开始以及结束时进行监视表格的作成和删除。对监视表格发行的SQL文为create / update / select / drop。
    作为监视结果,如果出现以下情况则视为异常。
    1. 数据库连接失败时

    2. 在SQL语句的响应中通知有异常时

    3. 写入和读入的数据不一致时

5.16.3. 监视 (固有) 标签页

监视级别

从以下选项中选择一项。请务必进行设置。

  • 级别1(在select中的监视)
    该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。
  • 级别2(在update/select中的监视)
    该监视还对监视表格进行更新。对监视表格执行的SQL语句为(create /update / select /drop)。

默认值 : 级别2(在update/select 中的监视)

数据源名 (255字节以内)

指定要监视的数据源名。请务必设置。

默认值 : 无

用户名 (255字节以内)

指定登录数据库时使用的用户名。如果在设置数据源时已经设置用户名,则不需要指定。

默认值 : 无

密码 (255字节以内)

指定登录数据库时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。

默认值 : 无

监视表名 (255字节以内)

指定在数据库上创建的用于监视的表格的名称。请务必设置。因为该表需要创建和删除,请注意不要与运行时用到的表格重名。另外,还需要注意不要与SQL语句的保留字重复。
根据数据库的式样,监视的表名有不能设置的字符。详细请确认数据库的式样。

默认值 : ODBCWATCH

5.17. 设置Oracle监视资源

Oracle监视资源是监视服务器上运行的监视Oracle数据库的监视资源。

5.17.1. Oracle监视资源的注意事项

关于已经进行操作确认的Oracle版本,请参考"5. 监视资源的详细信息"的"监视选项的动作确认完毕应用程序信息"。
因为监视处理使用Oracle的OCI,所以需要在执行监视的服务器上安装用于接口的DLL (OCI.DLL)。
请在监视对象资源中指定启动Oracle的服务资源或脚本资源。启动监视对象资源后,开始监视。但如果启动监视对象资源后,发生数据库不能立即运行等情况,请通过[开始监视的等待时间]进行调整。
开始监视时,创建监视表。因为失效切换组停止导致监视也停止时,会删除监视表。监视暂时中断等情况下,不会删除监视表。另外,由于系统异常等导致服务器在失效切换组停止前发生宕机等现象时,不会删除监视表,所以下次开始监视时,会显示"a monitor table exists"的错误消息,这不属于异常。

参数中"操作系统认证"复选框未选中时,通常以密码认证方式监视Oracle。但是在以下条件下,以操作系统认证方式监视Oracle时,将忽略用户名和密码的设置。

  • 参数中认证方式指定为SYSDBA。

  • Administrator用户属于Windows OS的ora_dba组。

指定为参数用户名的用户默认为sys,但另外创建用于监视的用户时,需授予各监视级别以下访问权限。(不授予sysdba权限时)

监视级别

必要的权限

级别0(数据库状态)

对于V$PROCESS的SELECT权限/对于V$INSTANCE的SELECT权限

级别1(在select中的监视)

对于V$PROCESS的SELECT权限/对于监视表格的SELECT权限

级别2(在update/select中的监视)

对于V$PROCESS的SELECT权限/对于CREATE TABLE/DROP ANY TABLE/监视表格的INSERT权限/对于监视表格的UPDATE权限/对于监视表格的SELECT权限

针对每个监视操作,Oracle自身将会输出运行日志等。请根据需要,通过Oracle的设置进行控制。

以下"5.17.2. Oracle监视资源的监视方法 "中说明的监视级别中,请注意以下几点。
选择"级别1",且监视开始时没有监视表,则监视发生错误。请创建以下监视表。
选择"级别2",且监视开始时没有监视表,EXPRESSCLUSTER将自动创建监视表格。这时,Cluster WebUI的Alert日志中显示没有监视表的消息。

选择的监视级别

事先创建监视表格

级别0(数据库状态)

无必要

级别1(在select中的监视)

有必要

级别2(在update/select中的监视)

无必要

可按以下步骤创建监视表格。

(以监视表格名为orawatch时为例):

sql> create table ORAWATCH (num int not null primary key);
sql> insert into ORAWATCH values(0);
sql> commit;

※请创建指定为参数用户名的用户架构。

5.17.2. Oracle监视资源的监视方法

Oracle监视资源按从以下监视级别中选择的级别进行监视。

  • 级别0(数据库状态)
    参考Oracle的管理表格(V$INSTANCE表格),确认DB的状态(实例的状态)。该监视为简单监视,不对监视表格执行SQL语句。
    作为监视结果,如果出现以下情况则视为异常。
    1. (DB(实例)为未启动状态(MOUNTED,STARTED)时

  • 级别1(在select中的监视)
    该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。
    作为监视结果,如果出现以下情况则视为异常。
    1. 连接数据库失败时

    2. 在响应SQL语句响应中通知异常时

  • 级别2(在update/select中的监视)
    该监视也进行监视表格的更新。通过SQL语句,对最大10 行数值数据进行写入和读入操作。监视的开始以及结束时进行监视表格的作成和删除。对监视表格发行的SQL文为create / update / select / drop。
    作为监视结果,如果出现以下情况则视为异常。
    1. 数据库连接失败时

    2. 在SQL语句的响应中通知有异常时

    3. 写入和读入的数据不一致时

5.17.3. 监视 (固有) 标签页

监视方式

选择作为监视对象的Oracle功能。

  • 监视监听器和实例
    按照设置的监视级别,监视数据库的连接,参照及更新等操作。
  • 只监视监听器
    执行Oracle的命令(tnsping ),监视监听器是否在运行。需在监视资源属性中预先设置ORACLE_HOME。
    若没有设置ORACLE_HOME,则只对指定为连接字符串的目标进行连接处理动作的监视。在连接异常时,利用重启监听器的服务来尝试复原时使用。
    若选择本设置,则会忽略监视级别的设置。
  • 只监视实例
    不经过监听器而直接连接(BEQ连接)数据库,按照设置的监视级别,监视数据库的连接,参照,更新等操作。需在监视资源属性中预先设置ORACLE_HOME。本方法用于监听不经过监听器而直接监视实例来设置复归操作。
    若没有设置ORACLE_HOME,则会连接指定为连接字符串的目标,当连接处理异常时选择忽略。本方法可与[只监视监听器]方法中的Oracle监视资源并用,可以对连接处理以外的异常进行的复原动作进行设置。

默认值:监视监听器和实例

监视级别

从以下选项中选择一项。监视方式为"只监视监听器"时,会忽略本设置。

  • 级别0(数据库状态)
    参考Oracle的管理表格(V$INSTANCE表格),确认DB的状态(实例的状态)。该监视为简单监视,不对监视表格执行SQL语句。
  • 级别1(在select中的监视)
    该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。
  • 级别2(在update/select中的监视)
    该监视还对监视表格进行更新。对监视表格执行的SQL语句为( create / update / select / drop )。

默认值 : 级别2 (在update/select中的监视)

连接字符串 (255字节以内)

指定要监视的数据库的连接字符串。请务必设置。
监视方式为"只监视实例"时,设置ORACLE_SID。

监视方式

ORACLE_HOME

连接字符串

监视级别

监视监听器和实例

不输入

指定连接字符串

按设置的级别监视

只监视监听器

已输入时,使用Oracle的命令监视

指定连接字符串

忽略级别设置

未输入时,确认经由监听器的实例连接

指定连接字符串

忽略级别设置

只监视实例

已输入时,通过BEQ连接确认实例

指定ORACLE_SID

按设置的级别监视

未输入时,确认经由监听器的实例

指定连接字符串

按设置的级别监视

默认值 :无连接字符串的默认值

用户名 (255字节以内)

指定登录数据库时使用的用户名。作为监视方法选择[只监视监听器]以外时,以及使用OS认证时,请务必设置。

默认值:sys

密码 (255字节以内)

指定登录数据库时使用的密码。点击[Change]按钮,显示指定密码的对话框,可在此进行设置。

默认值:无

操作系统认证

指定登录Oracle时的认证方式。需要与Oracle的设置保持一致。

  • 选中复选框
    使用OS认证。
  • 不选中复选框 (默认值)
    使用数据库认证。

认证方式

指定登录Oracle时的用户权限。需要与指定的用户名的权限保持一致。

  • SYSDBA(默认值)
    使用SYSDBA连接。
  • DEFAULT
    使用普通用户权限连接。

监视表名 (255字节以内)

指定在数据库上创建的用于监视的表格的名称。请务必设置。因为该表需要创建和删除,请注意不要与运行时用到的表格重名。另外,还需要注意不要与SQL语句的保留字重复。
根据数据库的式样,监视的表名有不能设置的字符。详细请确认数据库的式样。

默认值:ORAWATCH

ORACLE_HOME (255字节以内)

指定ORACLE_HOME设置的路径名。需要设置为[/]开头的名字。当监视方式为"只监视监听器","只监视实例"时使用。

默认值 : 无

字符编码

选择Oracle的字符编码。

  • (Following the setting of the application)(默认值)
    选择安装在服务器上的Oracle的字符编码
  • AMERICAN_AMERICA.US7ASCII
    使用普通用户权限连接。
    Oracle的语言是日语或英语以外时,选择[AMERICAN_AMERICA.US7ASCII]。

发生故障时收集应用程序的详细信息

指定查出Oracle数据库异常时是否收集Oracle的详细信息。

  • 选中复选框
    收集Oracle的详细信息。
  • 不选中复选框(默认值)
    不收集Oracle的详细信息。

使用本功能时,由于利用本地系统帐户执行为收集信息的数据库处理,因此,本地系统帐户需要DBA权限。收集的详细信息文件存放在EXPRESSCLUSTER X SINGLESERVERSAFE安装目录的 work\rm\资源名\errinfo.cur 文件夹下。多次收集的情况下,之前收集的文件夹的名字重命名为errinfo.1,errinro.2等,并且只存放最新的5次收集的信息文件。

注解

在收集过程中,因为EXPRESSCLUSTER X SINGLESERVERSAFE停止等原因造成Oracle服务停止的场合,有可执行无法正确收集信息文件。
收集过程中请不要执行停止组等手动操作。根据手动操作的时机,之后的监视处理可执行不能正常动作。

收集超时(1~9999)

按秒单位来指定收集详细信息时的超时时间。

默认值:120

Oracle初始化或关闭时当作错误

在运行本功能时,查出Oracle启动中或关闭中的状态,则立即判定为监视错误。

与Oracle Clusterware等联动运行中自动重启Oracle时,请关闭此功能。即使Oracle启动中或关闭中的状态也判定为监视正常。
但是,持续一个小时以上的Oracle启动中或关闭中的状态时,则判定为监视错误。

默认值:关闭

5.18. 设置POP3监视资源

POP3监视资源用于监视服务器上运行的POP3服务。它监视POP3协议,而不是监视特定的应用程序。因此,可以对使用POP3协议的各种应用程序进行监视。

5.18.1. POP3监视资源的注意事项

请在监视对象资源中指定启动POP3服务器的服务资源或脚本资源等。启动监视对象资源后,开始监视。但如果启动监视对象资源后,发生POP3不能立即运行等情况,请通过[开始监视的等待时间]进行调整。

针对每个监视操作,POP3自身会输出运行日志等。请根据需要,通过POP3的设置进行控制。

5.18.2. POP3监视资源的监视方法

POP3监视资源进行以下监视。
连接POP3服务器,执行运行确认命令。
作为监视结果,如果出现以下情况则视为异常。
  1. POP3服务器连接失败时

  2. 在对命令的响应中通知有异常时

5.18.3. 监视 (固有) 标签页

IP地址(255字节以内)

指定要监视的POP3服务器的IP地址。请务必指定。
由于一般情况下连接到在自身服务器中工作的POP3服务器上,因此设置回环地址(127.0.0.1)。但因POP3服务器设置对能够连接的地址进行了限制时,设置可连接的地址(浮动IP地址等)。

默认值 : 127.0.0.1

端口号 (1~65535)

指定要监视的POP3的端口号。请务必指定。

默认值 : 110

用户名 (255字节以内)

指定登录POP3时使用的用户名。

默认值 : 无

密码 (255字节以内)

指定登录POP3时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。

默认值 : 无

认证方式

选择登录POP3时使用的认证方式。需要与使用的POP3的设置保持一致。

  • APOP(默认值)
    使用APOP命令的加密认证方式。
  • USER/PASS
    使用USER/PASS命令的明文方式。

5.19. 设置PostgreSQL监视资源

PostgreSQL监视资源是用于监视服务器上运行的PostgreSQL数据库的监视资源。

5.19.1. PostgreSQL监视资源的注意事项

关于已经进行操作确认的PostgreSQL/PowerGres版本,请参考"5. 监视资源的详细信息"的"5.1.2. 监视选项的动作确认完毕应用程序信息"。

因为监视处理使用PostgreSQL/PowerGres的库,所以需要在执行监视的服务器上安装用于接口的DLL (LIBPQ.DLL)。执行PostgreSQL的监视时,请在环境变量中设置该DLL的路径。

请在监视对象资源中指定启动PostgreSQL/PowerGres的服务资源。启动监视对象资源后,开始监视。但如果启动监视对象资源后,发生数据库不能立即运行等情况,请通过[开始监视的等待时间]进行调整。

开始监视时,创建监视表。因为失效切换组停止导致监视也停止时,会删除监视表。监视暂时中断等情况下,不会删除监视表。另外,由于系统异常等导致服务器在失效切换组停止前发生宕机等现象时,不会删除监视表,所以下次开始监视时,会显示"a monitor table exists"的错误消息,这不属于异常。

针对每个监视操作,PostgreSQL/PowerGres自身将会输出运行日志等。请根据需要,通过PostgreSQL/PowerGres的设置进行控制。

PostgreSQL因为是开放源码软件 (OSS),虽然进行了运行确认,但是不保证其运行。请分别进行测试后再运行。

因OS和PostgreSQL版本的原因,执行PostgreSQL监视时,可执行出现找不到程序库的错误输出。此时,请在系统环境系数的PATH上添加PostgreSQL的bin之后,请执行集群重启。

环境系数添加PATH时(下面以PostgreSQL9.6的bin的PATH为例)

利用本监视资源时,PostgreSQL的日志里会输出以下信息。由于这是监视处理过程中的输出信息,没什么问题。

YYYY-MM-DD hh:mm:ss JST moodle moodle LOG: statement: DROP TABLE psqlwatch
YYYY-MM-DD hh:mm:ss JST moodle moodle ERROR: table "psqlwatch" does not exist
YYYY-MM-DD hh:mm:ss JST moodle moodle STATEMENT: DROP TABLE psqlwatch
YYYY-MM-DD hh:mm:ss JST moodle moodle LOG: statement: CREATE TABLE psqlwatch (num INTEGER NOT NULL PRIMARY KEY)
YYYY-MM-DD hh:mm:ss JST moodle moodle NOTICE: CREATE TABLE / PRIMARY KEY will create implicit index "psqlwatch_pkey" for table "psql watch"
YYYY-MM-DD hh:mm:ss JST moodle moodle LOG: statement: DROP TABLE psqlwatch
以下"5.19.2. PostgreSQL监视资源的监视方法"中说明的监视级别中,请注意以下几点。
选择"级别1",且监视开始时没有监视表,则监视发生错误。请创建以下监视表。
选择"级别2",且监视开始时没有监视表,EXPRESSCLUSTER将自动创建监视表。这时,Cluster WebUI的Alert日志中显示没有监视表的消息。

选择的监视级别

事先创建监视表格

级别1(在select中的监视)

有必要

级别2(在update/select中的监视)

没有必要

可按以下步骤创建监视表格。

(以监视表格名为psqlwatch时为例)

sql> create table PSQLWATCH (num int not null primary key);
sql> insert into PSQLWATCH values(0);
sql> commit;

5.19.2. PostgreSQL监视资源的监视方法

PostgreSQL监视资源按从以下监视级别中选择的级别进行监视。

  • 级别1(在select中的监视)
    该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。
    作为监视结果,如果出现以下情况则视为异常。
    1. 数据库连接失败时

    2. SQL语句响应中通知异常时

  • 级别2(在update/select中的监视)
    该监视也进行监视表格的更新。通过SQL语句,对最大10 行数值数据进行写入和读入操作。监视的开始以及结束时进行监视表格的作成和删除。对监视表格发行的SQL文为create / update / select / reindex / drop / vacuum。
    作为监视结果,如果出现以下情况则视为异常。
    1. 数据库连接失败时

    2. 在SQL语句的响应中通知有异常时

    3. 写入和读入的数据不一致时

5.19.3. 监视 (固有) 标签页

监视级别

从以下选项中选择一项。请务必进行设置。

  • 级别1(在select中的监视)
    该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。
  • 级别2(在update/select中的监视)
    该监视还对监视表格进行更新。对监视表格执行的SQL语句为(create /update / select / reindex / drop / vacuum )。

默认值 : 级别2(在update/select中的监视)

数据库名 (255字节以内)

指定监视的数据库名。请务必指定。

默认值 : 无

IP地址

指定监视的数据库服务器的IP地址。请务必指定。

默认值 : 127.0.0.1

端口号

指定监视的PostgreSQL的端口号。请务必指定。

默认值 : 5432

用户名 (255字节以内)

指定登录数据库时使用的用户名。

默认值 : postgres

密码 (255字节以内)

指定登录数据库时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。

默认值 : 无

监视表名 (255字节以内)

指定在数据库上创建的用于监视的表格的名称。请务必指定。因为该表需要创建和删除,请注意不要与运行时用到的表格重名。另外,还需要注意不要与SQL语句的保留字重复。
根据数据库的式样,监视的表名有不能设置的字符。详细请确认数据库的式样。

默认值 : PSQLWATCH

在PostgreSQL的初始化中或关机中出错

将本功能设置为有效时,若检测出PostgreSQL的初始化中或关机中的状态,则马上变为监视错误。
将本功能设置为无效时,即使检测出PostgreSQL的初始化中或关机中的状态也变为监视正常。
但是,若持续保持PostgreSQL的初始化中或关机中的状态1个小时以上,则变为监视错误。

默认值 : 有效

5.20. 设置SMTP监视资源

SMTP监视资源对服务器上运行的SMTP服务进行监视。它监视SMTP协议,而不是监视特定的应用程序。因此,可以对使用SMTP协议的各种应用程序进行监视。

5.20.1. SMTP监视资源的注意事项

请在监视对象资源中指定启动SMTP服务器的服务资源或脚本资源等。启动监视对象资源后,开始监视。但如果启动监视对象资源后,发生SMTP不能立即运行等情况,请通过[开始监视的等待时间]进行调整。
针对每个监视操作,SMTP自身会输出运行日志等。请根据需要,通过SMTP的设置进行控制。

5.20.2. SMTP监视资源的监视方法

SMTP监视资源进行以下监视。
连接SMTP服务器,执行运行确认命令。
作为监视结果,如果出现以下情况则视为异常。
  1. SMTP服务器连接失败时

  2. 在对命令的响应中通知有异常时

5.20.3. 监视 (固有) 标签页

IP地址

指定监视的SMTP服务器的IP地址。请务必指定。

默认值 : 127.0.0.1

端口号

指定监视的SMTP的端口号。请务必指定。

默认值 : 25

用户名 (255字节以内)

指定登录SMTP时使用的用户名。如果没有指定用户名,则不执行SMTP认证。

默认值 : 无

密码 (255字节以内)

指定登录SMTP时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。

默认值 : 无

认证方式

指定登录SMTP时使用的认证方式。需要与使用的SMTP的设置保持一致。

  • CRAM-MD5(默认值)
    使用CRAM-MD5的密码认证方式。
  • LOGIN
    使用LOGIN命令的明文方式。

邮件地址 (255字节以内)

指定监视时的邮件地址。
如果不指定,仅通过运行确认命令进行监视。内部执行使用伪邮件地址的命令。
如果指定,则对指定的地址实际发送邮件进行监视。建议准备一个专门用于监视的邮件地址来指定。

默认值 : 无

5.21. 设置SQL Server监视资源

SQL Server监视资源用于监视服务器上运行的SQL Server数据库。

5.21.1. SQL Server监视资源的注意事项

关于已经进行了操作确认的SQL Server的版本,请参考"5. 监视资源的详细信息"的"5.1.2. 监视选项的动作确认完毕应用程序信息"。
请在监视对象资源中指定启动SQL Server的服务资源或脚本资源等。启动监视对象资源后,开始监视。但如果启动监视对象资源后,发生数据库不能立即运行等情况,请通过[开始监视的等待时间]进行调整。
开始监视时,创建监视表。因为失效切换组停止导致监视也停止时,会删除监视表。监视暂时中断等情况下,不会删除监视表。另外,由于系统异常等导致服务器在失效切换组停止前发生宕机等现象时,不会删除监视表,所以下次开始监视时,会显示"a monitor table exists"的错误消息,这不属于异常。

针对每个监视操作,SQL Server自身会输出运行日志等。请根据需要,通过SQL Server的设置进行控制。

以下"5.21.2. SQL Server监视资源的监视方法 "中说明的监视级别中,请注意以下几点。
选择"级别1",且监视开始时没有监视表,则监视发生错误。请创建以下监视表。
选择"级别2",且监视开始时没有监视表,EXPRESSCLUSTER将自动创建监视表。这时,Cluster WebUI的Alert日志中显示没有监视表的消息。

选择的监视级别

事先创建监视表格

级别0(数据库状态)

无必要

级别1(在select中的监视)

有必要

级别2(在update/select中的监视)

无必要

可按以下步骤创建监视表格。

(以监视表格名为sqlwatch时为例)

  • SET IMPLICIT_TRANSACTIONS关闭时

    sql> create table SQLWATCH (num int not null primary key)
    sql> go
    sql> insert into SQLWATCH values(0)
    sql> go
    
  • SET IMPLICIT_TRANSACTIONS打开时

    sql> create table SQLWATCH (num int not null primary key)
    sql> go
    sql> insert into SQLWATCH values(0)
    sql> go
    sql> commit
    sql> go
    

5.21.2. SQL Server监视资源的监视方法

SQL Server监视资源按从以下监视级别中选择的级别进行监视。

  • 级别0(数据库状态)
    参照SQL Server的管理表格,确认DB的状态。该监视为简单监视,不进行SQL语句的发行。
    作为监视结果,如果出现以下情况则视为异常。
    1. 数据库的状态为非通信状态

  • 级别1(在select中的监视)
    该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。
    作为监视结果,如果出现以下情况则视为异常。
    1. 连接数据库失败时

    2. 在响应SQL语句过程中接到异常通知时

  • 级别2(在update/select中的监视)
    该监视还对监视表格进行更新。通过SQL语句,对最大为10位的数值数据进行写入和读入操作。监视开始,结束时将创建,删除监视表格。对监视表格执行的SQL语句为(create / update / select / drop)。
    作为监视结果,如果出现以下情况则视为异常。
    1. 连接数据库失败时

    2. 在响应SQL语句过程中接到异常通知时

    3. 写入和读入的数据不一致时

5.21.3. 监视 (固有) 标签页

监视级别

从以下选项中选择一项。请务必进行设置。

  • 级别0(数据库状态)
    参照SQL Server的管理表格进行DB的状态确认。是对监视表格不发行SQL命令的简单监视。
  • 级别1(在select中的监视)
    该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。
  • 级别2(在update/select中的监视)
    该监视还对监视表格进行更新。对监视表格执行的SQL语句为(create /update / select /drop )。

默认值 : 级别2(在update/select中的监视)

数据库名 (255字节以内)

指定监视的数据库名。请务必设置。

默认值 : 无

实例名 (255字节以内)

指定监视的数据库的实例名。请务必设置。

默认值 : MSSQLSERVER

用户名 (255字节以内)

指定登录数据库时使用的用户名。如果没有指定用户名,则使用Windows认证。

默认值 : SA

密码 (255字节以内)

指定登录数据库时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。

默认值 : 无

监视表名 (255字节以内)

指定在数据库上创建的用于监视的表格的名称。请务必设置。因为该表需要创建和删除,请注意不要与运行时用到的表格重名。另外,还需要注意不要与SQL语句的保留字重复。
根据数据库的式样,监视的表名有不能设置的字符。详细请确认数据库的式样。

默认值 : SQLWATCH

ODBC驱动名 (255字节以内)

设置[开始]菜单->[管理工具] ->[数据源(ODBC)]的[驱动]标签页中显示的对象数据库设备名。
SQL Server 2014时请选择或直接输入SQL Server Native Client 11.0
SQL Server 2016,SQL Server 2017时请选择或直接输入ODBC Driver 13 for SQL Server
SQL Server 2019时请选择或直接输入ODBC Driver 17 for SQL Server

默认值 : ODBC Driver 13 for SQL Server

5.22. 设置Tuxedo监视资源

Tuxedo监视资源用于监视服务器上运行的Tuxedo。

5.22.1. Tuxedo监视资源的注意事项

关于已经进行了操作确认的Tuxedo的版本,请参考"5. 监视资源的详细信息"的"5.1.2. 监视选项的动作确认完毕应用程序信息"。
请在监视对象资源中指定启动Tuxedo的脚本资源,应用程序资源。启动对象资源后,开始监视。但如果启动对象资源后Tuxedo不能立即运行等时,请通过[开始监视的等待时间]进行调整。
针对每个监视操作,Tuxedo自身会输出运行日志等。请根据需要,通过Tuxedo的设置进行控制。

5.22.2. Tuxedo监视资源的监视方法

Tuxedo监视资源进行以下监视。
利用Tuxedo的API,执行应用程序服务器的监视。
作为监视结果,如果出现以下情况则视为异常。
  1. 应用程序服务器的连接或对状态取得的应答中通知异常时

5.22.3. 监视 (固有) 标签页

应用服务器名 (255字节以内)

设置要监视的应用程序服务器名。请务必设置。

默认值 : BBL

TUXCONFIG文件 (1023字节以内)

设置Tuxedo的配置文件名。请务必设置。

默认值 : 无

5.23. 设置WebLogic监视资源

WebLogic监视资源用于监视服务器上运行的WebLogic。

5.23.1. WebLogic监视资源的注意事项

有关运行确认完毕的WebLogic版本,请参考"5. 监视资源的详细信息"的"5.1.2. 监视选项的动作确认完毕应用程序信息"。
WebLogic启动时如果不能立即运行则被视为异常,因此请通过[开始监视的等待时间]进行调整。或者请先启动WebLogic(例:在监视的对象资源中,指定启动WebLogic的脚本资源,应用程序资源)。
在本监视资源中选择 [WLST] 为监视方式时,为了进行监视必须具备Java环境。因为应用程序服务器系统利用了Java的功能,有时发生Java的死机时也视为异常。
针对每个监视动作,WebLogic本身会输出运行日志等,请通过WebLogic侧的设置进行适当控制。

5.23.2. WebLogic监视资源的监视方法

WebLogic监视资源进行以下监视。

  • 监视方式:选择RESTful API 时

    WebLogic提供了称为WebLogic RESTful管理服务的RESTful API。

    通过此RESTful API执行应用程序服务器监视。

    作为监视结果,当以下应答通知异常时都视为异常。

    1. RESTful API 的应答中通知异常时

    注解

    监视方式:与WLST相比,可以减少监视时应用程序服务器的CPU负荷。

  • 监视方式:选择WLST时

    利用[weblogic.Admin]命令或[weblogic.WLST]命令执行connect,执行应用程序服务器监视。[weblogic.Admin]命令可执行时,执行[weblogic.Admin]命令。[weblogic.Admin]命令不可执行时,执行[weblogic.WLST]命令。

    作为监视结果,如果出现以下情况则视为异常。

    1. connect应答中通知异常时

    根据不同的[认证方式]执行以下的动作。

    • DemoTrust: 使用WebLogic的Demo用认证文件的SSL认证方式

    • CustomTrust: 使用用户做成的认证文件的SSL认证方式

    • Not Use SSL: 不执行SSL认证

5.23.3. 监视 (固有) 标签页

IP地址 (80字节以内)

设置要监视的服务器的IP地址。请务必设置。

默认值 : 127.0.0.1

端口号 (1~65535)

设置连接服务器时的端口号。请务必设置。

默认值 : 7002

监视方式

设置服务器的监视方式。请务必设置。

默认值:RESTful API

协议

设置要监视的服务器的协议。[监视方式]中选择RESTful API时,请务必选择。

默认值:HTTP

用户名 (255字节以内)

设置WebLogic的用户名。[监视方式]中选择RESTful API时,请务必输入。

默认值:weblogic

密码 (255字节以内)

设置WebLogic的密码。[监视方式]中选择RESTful API时,如有必要请输入。

默认值:无

账户隐藏

直接指定用户名和密码时请指定[关闭],文件中记述时请指定[开]。请务必设置。

默认值 : [关闭]

配置文件 (1023字节以内)

设置保存用户信息的文件名。帐户Shadow为[开]时,请务必设置。

默认值 : 无

注册文件名 (1023字节以内)

以全路径的形式设置用于保存访问配置文件路径的密码的文件名。帐户Shadow为[开]时,请务必设置。

默认值 : 无

用户名 (255字节以内)

设置WebLogic的用户名。帐户Shadow为[关闭]时,请务必设置。

默认值 :weblogic

密码 (255字节以内)

设置WebLogic的密码。

默认值 : 无

认证方式

设置连接应用程序服务器时的认证方式。请务必设置。
如果想使用SSL通信进行监视时,[认证方式]请指定为[DemoTrust]或[CustomTrust]。
是否选择[DemoTrust]或[CustomTrust]取决于WebLogic Administraion Console上的设置。
如果WebLogic Administraion Console的[Keystore]是[Demo Identity and Demo Trust],请指定[DemoTrust]。 在这种情况下,不必设置[密钥文件]。
如果WebLogic Administraion Console的[Keystore]是[Custom Identity and Custom Trust],请指定[CustomTrust]。在这种情况下,必须设置[密钥文件]。

默认值 : DemoTrust

密钥文件 (1023字节以内)

设置SSL认证时的认证文件。认证方式为[CustomTrust]时,请务必设置。请设定为WebLogic Administraion Console上[Custom Identity Keystore]指定的文件。

默认值 : 无

安装路径 (255字节以内)

设置WebLogic的安装路径。请务必设置。

默认值 : C:\Oracle\Middleware\Oracle_Home\wlserver

附加命令参数(1023字节以内)

变更向[webLogic.WLST]传递的选项时设定。

默认值:-Dwlst.offline.log=disable -Duser.language=en_US

5.24. 设置WebOTX监视资源

WebOTX监视资源是用于监视服务器上运行的WebOTX的监视资源。

5.24.1. WebOTX监视资源的注意事项

关于已经进行了操作确认的WebOTX的版本,请参考"5. 监视资源的详细信息"的"监视选项的动作确认完毕应用程序信息"。
请在监视对象资源中指定启动WebOTX的服务资源或脚本资源。启动对象资源后,开始监视。但如果启动对象资源后WebOTX不能立即运行等时,请通过[开始监视的等待时间]进行调整。
为了通过本监视资源进行监视必须具备JAVA环境。因为应用程序服务器系统利用了JAVA的功能,当JAVA发生停止等时也被视为异常。
针对每个监视操作,WebOTX自身会输出运行日志等。请根据需要,通过WebOTX的设置进行控制。
WebOTX监视资源利用WebOTX提供的otxadmin.bat命令来进行应用程序服务器的监视。WebOTX V10.1以上下otxadmin.bat命令所在的位置${AS_INSTALL}\bin不在包含在环境变量PATH中。监视WebOTX V10.1以上时请按照以下任意一种方式设置。
  • 系统环境变量PATH中添加otxadmin.bat命令所在的位置。

  • 在[安装路径]中设置WebOTX Application Server的安装路径(例. C:\WebOTX)。

5.24.2. WebOTX监视资源的监视方法

WebOTX监视资源进行以下监视。
利用otxadmin.bat命令,来进行应用程序服务器的监视。
作为监视结果,如果出现以下情况则视为异常。
  1. 取得的应用程序服务器的状态中通知异常时

5.24.3. 监视 (固有) 标签页

连接目的端 (255字节以内)

设置要监视的服务器的服务器名。请务必设置。

默认值 : localhost

端口号 (1~65535)

设置连接服务器时的端口号。请务必设置。
监视WebOTX用户域时,请设置WebOTX域的管理端口号。管理端口号为创建域时<域名>.properties的domain.admin.port处设置的端口号。关于<域名>.properties 的详细请参考WebOTX的文档。

默认值 : 6212

用户名 (255字节以内)

设置WebOTX的用户名。请务必设置。
监视WebOTX用户域时,请设置WebOTX域的登录用户名。

默认值 :无

密码 (255字节以内)

设置WebOTX的密码。

默认值 : 无

安装路径(1023 字节以内)

设置WebOTX Application Server 的安装路径。监视WebOTX Application Server V10.1 以上版本请务必设置。

默认值 : 无

5.25. 设置WebSphere监视资源

WebSphere监视资源用于监视服务器上运行的WebSphere。

5.25.1. WebSphere监视资源的注意事项

有关运行确认完毕的WebSphere版本,请参考"5. 监视资源的详细信息"的"5.1.2. 监视选项的动作确认完毕应用程序信息"。
请在监视对象资源中指定启动WebSphere服务器的服务资源及脚本资源等。在启动对象资源后开始监视。 但如果对象资源启动后WebSphere不能立即运行或其他情况下,请通过[开始监视的等待时间]进行调整。
为了通过本监视资源进行监视必须具备JAVA环境。因为应用程序服务器系统利用了JAVA的功能,当JAVA发生停止等时也被视为异常。
针对每个监视动作,WebSphere服务本身会输出运行日志等,请通过WebSphere侧的设置进行适当控制。

5.25.2. WebSphere监视资源的监视方法

WebSphere监视资源进行以下监视。
利用WebSphere的serverStatus.bat命令,执行应用程序服务器的监视。
作为监视结果,如果出现以下情况则视为异常。
  1. 取得的应用程序服务器的状态中通知异常时

5.25.3. 监视 (固有) 标签页

应用服务器名 (255字节以内)

设置监视的应用程序服务器名。请务必设置。

默认值 : server1

配置文件名 (1023字节以内)

设置WebSphere的Profile名。请务必设置。

默认值 : default

用户名 (255字节以内)

设置WebSphere的用户名。请务必设置。

默认值 :无

密码 (255字节以内)

设置WebSphere的密码。

默认值 : 无

安装路径 (255字节以内)

设置WebSphere的安装路径。请务必设置。

默认值 : C:\Program Files\IBM\WebSphere\AppServer

5.26. 设置JVM监视资源

JVM监视资源监视在服务器上操作的Java VM,或监视应用程序服务器使用的资源利用信息。

5.26.1. JVM监视资源的注意事项

在新建JVM监视资源之前,需要先在[集群的属性]的[JVM监视]页中把[Java安装路径]设定好。
请指定WebLogic Server或WebOTX等在Java VM上操作的应用程序服务器作为监视对象的资源。虽然启动JVM监视资源后Java Resource Agent会开始监视,但当刚刚启动JVM监视资源后,监视对象(WebLogic Server或WebOTX)无法立即运行时,请调整[监视开始等待时间]。
[监视(固有)]-[重试次数]的设定无效。如果想推迟检出异常的时间,请变更[集群]属性-[JVM监视] 标签页-[资源测量设置]-[共通]-[重试次数]的设定值。
JVM监视资源从监视开始到实际进行监视处理之间,JVM监视资源的状态变为"警告"。另外在这个时候,下列的信息会出现在Alert日志,因为是表示监视准备中的信息,所以请忽略。
Monitor jraw is in the warning status. (100 : not ready for monitoring.)

5.26.2. JVM监视资源的监视方法

JVM监视资源进行以下监视。
利用JMX(Java Management Extensions),执行应用程序服务器的监视。

作为监视结果,如果出现以下情况则视为异常。

无法连接监视对象的Java VM或应用程序服务器时

获取的Java VM或应用程序服务器的资源使用量规定次数(异常判定次数)超出客户定义的界限值时

出现以下监视结果则视为恢复正常。

重新开始复原操作后的监视时低于临界值时

注解

Cluster WebUI的[收集集群日志]不收集监视对象(WebLogic Server和WebOTX)的设置文件及日志文件。

图中显示的是通过JVM监视资源进行的监视操作。
在a)中开始监视作为监视对象的Java VM。
使用JMX(Java Management Extensions)对Java VM进行监视。
Java Resource Agent通过使用JMX定期获取用于Java VM的资源量来检查Java VM的状态。
当状态从正常变为异常时,在Cluster WebUI中显示在b)中查出的Java VM异常。
可以确认状态和警报。
此外,向事件日志和JVM操作日志通知在c)中发生故障。
使用警报服务时,还可以通过电子邮件进行报告。
a)之后,状态从异常变为正常时,在Cluster WebUI中显示在d)中查出Java VM已正常恢复。
此外,向事件日志和JVM操作日志通知在e)中已正常恢复。
_images/img_w_how-jvm-monitor-resources-perform-monitoring-10.png

图 5.5 通过JVM监视资源进行监视的流程

超过基本界限值时的操作如下。

图的水平轴显示时间,垂直轴显示是否已超过监视界限值(Exceeded/Not exceeded)。
在此,如果监视时超过界限值的状态持续超过异常判定界限值(图中为5次)以上,则判定为异常。
判断其处于异常状态后,如果异常判定界限值次数连续降低3次时,判断为其为正常状态。
_images/img_how-jvm-monitor-resources-perform-monitoring-20.png

图 5.6 超过界限值时的操作

连续发生异常时情况如下。

如果持续超过异常判定界限值,则判断为异常状况。
判断其处于异常状态后,即使再一次持续超过异常判定界限值,也不会在Cluster WebUI中再次显示警报。
_images/img_how-jvm-monitor-resources-perform-monitoring-30.png

图 5.7 继续异常时的操作

以监视Full GC(Garbage Collection)为例进行说明。
图中水平轴表示时间经过。
图的上面部分显示的是各监视时间中是否查出GC发生,下面部分显示在每个时间点连续多少次查出Full GC。
当异常判断界限值Full GC连续发生,则JVM监视资源会检测到监视器异常。
由于异常判定界限值设置为5次,因此当查出Full GC达到5次时会检测到监视器异常。
Full GC对系统的影响很大,因此建议将异常判定界限值设为1次。
_images/img_how-jvm-monitor-resources-perform-monitoring-40.png

图 5.8 监视图(设置异常判定界限值为5次时)

5.26.3. 何谓JVM统计日志

JVM统计日志是保存了JVM监视资源所集的监视对象Java VM的统计信息的文件。文件格式为csv格式。目标位置如下所示。

<EXPRESSCLUSTER X SingleServerSafe安装路径>\log\ha\jra\*.stat
下述的「监视项目」表示JVM监视资源的[属性]-[监视(固有)]标签页内的设置项目。
有关各自的监视项目,选中[监视],并且设置了阈值时,收集统计信息,输出信息到JVM统计日志。不选中[监视],以及选中[监视]但不设置阈值时,信息不会输出至JVM统计日志。

监视项目和相应的JVM统计日志如下所示。

监视项目

相应的JVM统计日志

[内存]标签页[监视堆内存使用率]
[内存]标签页[监视非堆内存使用率]
[内存]标签页[监视堆使用量]
[内存]标签页[监视非堆使用量]
jramemory.stat

[线程]标签页[监视运行中的线程数]

jrathread.stat

[GC]标签页[监视Full GC执行时间]
[GC]标签页[监视Full GC发生次数]
jragc.stat
[WebLogic]标签页[监视Work Manager的请求]
[WebLogic]标签页[监视线程Pool的请求]
选中上述任意一个时,输出wlworkmanager.stat和wlthreadpool.stat。不提供只输出一方的设置。
wlworkmanager.stat
wlthreadpool.stat

5.26.4. 确认监视对象Java VM的Java内存领域的使用量(jramemory.stat)

记录监视对象Java VM的Java内存领域使用量的日志文件。文件名可按照日志输出设置的周转方式,采用如下的任意一种。

  • 选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[文件大小]时:jramemory<从0开始的整数>.stat

  • 选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[时间]时:jramemory<YYYYMMDDhhmm>.stat

    格式如下所示。

No

格式

说明

1

yyyy/mm/dd hh:mm:ss.SSS

表示记录日志的日期和时间。

2

半字节英文数字符号

表示监视对象Java VM的名称。是在JVM监视资源的[属性]-[监视固有]标签页[识别名]上所设置的值。

3

半字节英文数字符号

Java内存Pool的名称。详情请参阅"关于Java内存Pool名"。

4

半字节英文数字符号

Java内存Pool的类型。
Heap,Non-Heap

5

半字节数字

Java VM启动时向OS要求的内存量。单位为字节。(init)
在监视对象Java VM的启动时。可在以下的Java VM启动时以选项指定大小。
・HEAP:-Xms
・NON_HEAP permanent领域(Perm Gen):-XX:PermSize
・NON_HEAP code cache领域(Code Cache):-XX:InitialCodeCacheSize

6

半字节数字

Java VM目前使用的内存量。单位为字节。(used)

7

半字节数字

保证Java VM目前使用的内存量。单位为字节。(committed)
因内存的使用状况会发生增减,但务必要在used以上,max以下。

8

半字节数字

Java VM可使用的最大内存量。单位为字节。(max)
可在以下的Java VM启动时以选项指定大小。
・HEAP:-Xmx
・NON_HEAP permanent领域(Perm Gen):-XX:MaxPermSize
・NON_HEAP code cache领域(Code Cache):-XX:ReservedCodeCacheSize

例)
java -XX:MaxPermSize=128m -XX:ReservedCodeCacheSize=128m javaAP
上述的例子中,NON_HEAP的max为 128m+128m=256m。

(注意)
若-Xms与-Xmx指定为相同的值,则可执行变为(init)>(max)。这是因为,HEAP的max为-Xmx的指定而确保的领域大小减去Survivor Space的大小的一半后的大小。

9

半字节数字

从测量对象的Java VM启动开始的使用内存量的峰值。Java内存Pool的名称为HEAP,NON_HEAP时,与Java VM目前使用的内存量(used)相同。单位为字节。

10

半字节数字

[JVM类型]选择[Oracle Java(usage monitoring)]时请忽略。

[JVM类型]选择[Oracle Java(usage monitoring)]以外时,Java内存Pool的类型(No.4的field)为HEAP时,为max(No.8的field)×阈值(%)的内存量。单位为字节。
Java内存Pool的类型为HEAP以外时,固定为0。

5.26.5. 确认监视对象Java VM的线程运行状况(jrathread.stat)

记录监视对象Java VM的线程运行状况的日志文件。文件名可按照日志输出设置的周转方式,采用如下的任意一种。

  • 选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[文件大小]时:jrathread<从0开始的整数>.stat

  • 选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[时间]时:jrathread<YYYYMMDDhhmm>.stat

格式如下所示。

No

格式

说明

1

yyyy/mm/dd hh:mm:ss.SSS

表示记录日志的日期和时间。

2

半字节英文数字符号

表示监视对象Java VM的名称。是在JVM监视资源的[属性]-[监视固有]标签页[识别名]所设置的值。

3

半字节英文数字符号

表示监视对象Java VM目前运行中的线程数。

4

[半字节数字: 半字节数字:...]

表示监视对象Java VM死锁的线程ID。反复死锁数份额的ID。

5

半字节英文数字符号

表示监视对象Java VM死锁的线程的详细信息。按照以下形式反复线程数份额。
线程名, 线程ID, 线程状态, UserTime, CpuTime, WaitedCount, WaitedTime, isInNative, isSuspended <换行>
stacktrace<换行>
:
stacktrace<换行>
stacktrace=ClassName, FileName, LineNumber, MethodName, isNativeMethod

5.26.6. 确认监视对象Java VM的GC运行状况(jragc.stat)

记录监视对象Java VM的GC运行状况的日志文件。文件名可按照日志输出设置的周转方式,采用如下的任意一种。

  • 选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[文件大小]时:jragc<从0开始的整数>.stat

  • 选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[时间]时:jragc<YYYYMMDDhhmm>.stat

JVM监视资源可输出复制GC和Full GC的2种GC信息。
在JVM监视资源为Oracle Java时,关于以下的GC,作为Full GC的发生次数的增加份额来计数。
  • MarksweepCompact

  • MarkSweepCompact

  • PS Marksweep

  • ConcurrentMarkSweep

格式如下所示。

No

格式

说明

1

yyyy/mm/dd hh:mm:ss.SSS

表示记录日志的日期和时间。

2

半字节英文数字符号

表示监视对象Java VM的名称。是在JVM监视资源的[属性]-[监视固有]标签页[识别名]所设置的值。

3

半字节英文数字符号

表示监视对象Java VM的GC名称。

监视对象Java VM为Oracle Java时
具有以下。
Copy
MarksweepCompact
MarkSweepCompact
PS Scavenge
PS Marksweep
ParNew
ConcurrentMarkSweep

4

半字节数字

表示从监视对象Java VM的启动后开始到测量点为止的GC发生次数。值中也包含JVM监视资源开始监视前发生的GC的发生次数。

5

半字节数字

表示从监视对象Java VM的启动后开始到测量点为止的GC总执行时间。单位为豪秒。值中也包含JVM监视资源开始监视前发生的GC的执行时间。

5.26.7. 确认WebLogic Server的Work Manager的运行状况(wlworkmanager.stat)

记录WebLogic Server的Work Manager的运行状况的日志文件。文件名可按照日志输出设置的周转方式,采用如下的任意一种。

  • 选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[文件大小]时:wlworkmanager<从0开始的整数>.stat

  • 选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[时间]时:wlworkmanager<YYYYMMDDhhmm>.stat

格式如下所示。

No

格式

说明

1

yyyy/mm/dd hh:mm:ss.SSS

表示记录日志的日期和时间。

2

半字节英文数字符号

表示监视对象Java VM的名称。是在JVM监视资源的[属性]-[监视固有]标签页[识别名]所设置的值。

3

半字节英文数字符号

表示应用程序名。

4

半字节英文数字符号

表示Work Manager名。

5

半字节数字

表示已执行的请求的数量。

6

半字节数字

表示待机中的请求的数量。

5.26.8. 确认WebLogic Server的线程Pool的运行状况(wlthreadpool.stat)

记录WebLogic Server的线程Pool的运行状况的日志文件。文件名可按照日志输出设置的周转方式,采用如下的任意一种。

  • 选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[文件大小]时:wlthreadpool<从0开始的整数>.stat

  • 选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[时间]时:wlthreadpool<YYYYMMDDhhmm>.stat

格式如下所示。

No

格式

说明

1

yyyy/mm/dd hh:mm:ss.SSS

表示记录日志的日期和时间。

2

半字节英文数字符号

表示监视对象Java VM的名称。是在JVM监视资源的[属性]-[监视固有]标签页[识别名]所设置的值。

3

半字节数字

表示已执行的请求的总数。

4

半字节数字

表示等待处理的请求数。

5

半字节数字

表示每一单位时间(秒)的请求处理数。

6

半字节数字

表示为了执行应用程序的线程的合计数。

7

半字节数字

表示处于idle状态的线程数。

8

半字节数字

表示执行中的线程数。

9

半字节数字

表示处于待机状态的线程数。

5.26.9. 关于Java内存Pool名

说明作为输出到JVM运行日志的消息中的memory_name输出的Java内存Pool名,以及输出到JVM统计日志jramemory.stat中的Java内存Pool名。
作为Java内存Pool名输出的字符串并非由JVM监视资源来决定,而是输出从监视对象Java VM接收的字符串。
此外,由于未公开Java VM的规格,因此有可执行因Java VM的版本升级,而未经预告而更改。
因此,不建议通过消息中的Java内存Pool名来进行消息监视。

下述的监视项目表示JVM监视资源的[属性]-[监视(固有)]标签页[内存]标签页内的设置项目。

以下所记载的Java内存Pool名为在Oracle Java的实际确认结果。

在[JVM类型]选择[Oracle Java]时,并且在监视对象Java VM的启动选项附加「-XX:+UseSerialGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。

监视项目

作为memory_name输出的字符串

[监视堆内存使用率]-[领域整体]

HEAP

[监视堆内存使用率]-[Eden Space]

Eden Space

[监视堆内存使用率]-[Survivor Space]

Survivor Space

[监视堆内存使用率]-[Tenured Gen]

Tenured Gen

[监视非堆内存使用率]-[领域整体]

NON_HEAP

[监视非堆内存使用率]-[Code Cache]

Code Cache

[监视非堆内存使用率]-[Perm Gen]

Perm Gen

[监视非堆内存使用率]-[Perm Gen[shared-ro]]

Perm Gen [shared-ro]

[监视非堆内存使用率]-[Perm Gen[shared-rw]]

Perm Gen [shared-rw]

在[JVM类型]选择[Oracle Java]时,并且在监视对象Java VM的启动选项附加「-XX:+UseParallelGC」,「-XX:+UseParallelOldGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。

监视项目

作为memory_name输出的字符串

[监视堆内存使用率]-[领域整体]

HEAP

[监视堆内存使用率]-[Eden Space]

PS Eden Space

[监视堆内存使用率]-[Survivor Space]

PS Survivor Space

[监视堆内存使用率]-[Tenured Gen]

PS Old Gen

[监视非堆内存使用率]-[领域整体]

NON_HEAP

[监视非堆内存使用率]-[Code Cache]

Code Cache

[监视非堆内存使用率]-[Perm Gen]

PS Perm Gen

[监视非堆内存使用率]-[Perm Gen[shared-ro]]

Perm Gen [shared-ro]

[监视非堆内存使用率]-[Perm Gen[shared-rw]]

Perm Gen [shared-rw]

在[JVM类型]选择[Oracle Java]时,并且在监视对象Java VM的启动选项附加「-XX:+UseConcMarkSweepGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。

监视项目

作为memory_name输出的字符串

[监视堆内存使用率]-[领域整体]

HEAP

[监视堆内存使用率]-[Eden Space]

Par Eden Space

[监视堆内存使用率]-[Survivor Space]

Par Survivor Space

[监视堆内存使用率]-[Tenured Gen]

CMS Old Gen

[监视非堆内存使用率]-[领域整体]

NON_HEAP

[监视非堆内存使用率]-[Code Cache]

Code Cache

[监视非堆内存使用率]-[Perm Gen]

CMS Perm Gen

[监视非堆内存使用率]-[Perm Gen[shared-ro]]

Perm Gen [shared-ro]

[监视非堆内存使用率]-[Perm Gen[shared-rw]]

Perm Gen [shared-rw]

在[JVM类别]选择[Oracle Java(usage monitoring)]时,并且在监视对象Java VM的启动选项附加「-XX:+UseSerialGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。

监视项目

作为memory_name输出的字符串

[监视堆内存使用量]-[领域整体]

HEAP

[监视堆内存使用量]-[Eden Space]

Eden Space

[监视堆内存使用量]-[Survivor Space]

Survivor Space

[监视堆内存使用量]-[Tenured Gen]

Tenured Gen

[监视非堆内存使用量]-[领域整体]

NON_HEAP

[监视非堆内存使用量]-[Code Cache]

Code Cache (Java 9以上时不输出)

[监视非堆内存使用量]-[Metaspace]

Metaspace

[监视非堆内存使用量]-[CodeHeap non-nmethods]

CodeHeap non-nmethods

[监视非堆内存使用量]-[CodeHeap profiled]

CodeHeap profiled nmethods

[监视非堆内存使用量]-[CodeHeap non-profiled]

CodeHeap non-profiled nmethods

[监视非堆内存使用量]-[Compressed Class Space]

Compressed Class Space

在[JVM类别]选择[Oracle Java(usage monitoring)]时,并且在监视对象Java VM的启动选项附加「-XX:+UseParallelGC」,「-XX:+UseParallelOldGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。

监视项目

作为memory_name输出的字符串

[监视堆内存使用量]-[领域整体]

HEAP

[监视堆内存使用量]-[Eden Space]

Eden Space

[监视堆内存使用量]-[Survivor Space]

Survivor Space

[监视堆内存使用量]-[Tenured Gen]

Tenured Gen

[监视非堆内存使用量]-[领域整体]

NON_HEAP

[监视非堆内存使用量]-[Code Cache]

Code Cache (Java 9以上时不输出)

[监视非堆内存使用量]-[Metaspace]

Metaspace

[监视非堆内存使用量]-[CodeHeap non-nmethods]

CodeHeap non-nmethods

[监视非堆内存使用量]-[CodeHeap profiled]

CodeHeap profiled nmethods

[监视非堆内存使用量]-[CodeHeap non-profiled]

CodeHeap non-profiled nmethods

[监视非堆内存使用量]-[Compressed Class Space]

Compressed Class Space

在[JVM类别]选择[Oracle Java(usage monitoring)]时,并且在监视对象Java VM的启动选项附加「-XX:+UseConcMarkSweepGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。

监视项目

作为memory_name输出的字符串

[监视堆内存使用量]-[领域整体]

HEAP

[监视堆内存使用量]-[Eden Space]

Par Eden Space

[监视堆内存使用量]-[Survivor Space]

Par Survivor Space

[监视堆内存使用量]-[Tenured Gen]

CMS Old Gen

[监视非堆内存使用量]-[领域整体]

NON_HEAP

[监视非堆内存使用量]-[Code Cache]

Code Cache (Java 9以上时不输出)

[监视非堆内存使用量]-[ Metaspace]

Metaspace

[监视非堆内存使用量]-[CodeHeap non-nmethods]

CodeHeap non-nmethods

[监视非堆内存使用量]-[CodeHeap profiled]

CodeHeap profiled nmethods

[监视非堆内存使用量]-[CodeHeap non-profiled]

CodeHeap non-profiled nmethods

[监视非堆内存使用量]-[Compressed Class Space]

Compressed Class Space

在[JVM类别]选择[Oracle Java(usage monitoring)]时,并且在监视对象Java VM的启动选项附加「-XX:+UseParNewGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。Java 9以上时,附加「-XX:+UseParNewGC」会导致监视对象Java VM不启动。

监视项目

作为memory_name输出的字符串

[监视堆内存使用量]-[领域整体]

HEAP

[监视堆内存使用量]-[Eden Space]

Par Eden Space

[监视堆内存使用量]-[Survivor Space]

Par Survivor Space

[监视堆内存使用量]-[Tenured Gen]

Tenured Gen

[监视非堆内存使用量]-[领域整体]

NON_HEAP

[监视非堆内存使用量]-[Code Cache]

Code Cache

[监视非堆内存使用量]-[ Metaspace]

Metaspace

[监视非堆内存使用量]-[CodeHeap non-nmethods]

CodeHeap non-nmethods

[监视非堆内存使用量]-[CodeHeap profiled]

CodeHeap profiled nmethods

[监视非堆内存使用量]-[CodeHeap non-profiled]

CodeHeap non-profiled nmethods

[监视非堆内存使用量]-[Compressed Class Space]

Compressed Class Space

在[JVM类别]选择[Oracle Java(usage monitoring)] 时,并且在监视对象Java VM的启动选项附加「-XX::+UseG1GC」时,jramemory.stat中的No3的Java内存Pool名如下所示。

监视项目

作为memory_name输出的字符串

[监视堆内存使用量]-[领域整体]

HEAP

[监视堆内存使用量]-[Eden Space]

G1 Eden Space

[监视堆内存使用量]-[Survivor Space]

G1 Survivor Space

[监视堆内存使用量]-[ Tenured Gen(Old Gen)]

G1 Old Gen

[监视非堆内存使用量]-[领域整体]

NON_HEAP

[监视非堆内存使用量]-[Code Cache]

Code Cache(Java 9以上时不输出)

[监视非堆内存使用量]-[ Metaspace]

Metaspace

[监视非堆内存使用量]-[CodeHeap non-nmethods]

CodeHeap non-nmethods

[监视非堆内存使用量]-[CodeHeap profiled]

CodeHeap profiled nmethods

[监视非堆内存使用量]-[CodeHeap non-profiled]

CodeHeap non-profiled nmethods

[监视非堆内存使用量]-[Compressed Class Space]

Compressed Class Space

在JVM统计日志jramemory.stat中,Java内存Pool名和Java VM内存空间的关系如下所示。

  • Oracle Java 7时

    _images/img_java-memory-pool-name-10.png

    图 5.9 Java VM内存空间(Oracle Java 7)

图中的No

监视项目

jramemory.stat的Java内存Pool名

(1)

[监视堆内存使用率]-[领域整体]

HEAP

(2)

[监视堆内存使用率]-[Eden Space]

EdenSpace
PS Eden Space
Par Eden Space

(3)+(4)

[监视监视堆内存使用率]-[Survivor Space]

Survivor Space
PS Survivor Space
Par Survivor Space

(5)

[监视堆内存使用率]-[Tenured Gen]

Tenured Gen
PS Old Gen
CMS Old Gen

(6)

[监视非堆内存使用率]-[Perm Gen]
[监视非堆内存使用率]-[Perm Gen[shared-ro]]
[监视非堆内存使用率]-[Perm Gen[shared-rw]]
Perm Gen
Perm Gen [shared-ro]
Perm Gen [shared-rw]
PS Perm Gen
CMS Perm Gen

(7)

[监视非堆内存使用率]-[Code Cache]

Code Cache

(8)

-

-

(6)+(7)

[监视非堆内存使用率]-[领域整体]

NON_HEAP
※不包含stack trace
  • Oracle Java 8/Oracle Java 9/Oracle Java 11时

    _images/img_java-memory-pool-name-20.png

    图 5.10 Java VM内存空間(Oracle Java 8/Oracle Java 9/Oracle Java 11)

图中的No

监视项目

jramemory.stat的Java内存Pool名

(1)

[监视堆内存使用量]-[领域整体]

HEAP

(2)

[监视堆内存使用量]-[Eden Space]

EdenSpace
PS Eden Space
Par Eden Space
G1 Eden Space

(3)+(4)

[监视堆内存使用量]-[Survivor Space]

Survivor Space
PS Survivor Space
Par Survivor Space
G1 Survivor Space

(5)

[监视堆内存使用量]-[Tenured Gen]

Tenured Gen
PS Old Gen
CMS Old Gen
G1 Old Gen

(6)

[监视非堆内存使用量]-[Code Cache]

Code Cache(Java 9以上时不输出)

(7)

[监视非堆内存使用量]-[CodeHeap non-nmethods]

CodeHeap non-nmethods (Java 9以上时输出)

(6)

[监视非堆内存使用量]-[CodeHeap profiled]

CodeHeap profiled nmethods (Java 9以上时输出)

(6)

[监视非堆内存使用量]-[CodeHeap non-profiled]

CodeHeap non-profiled nmethods (Java 9以上时输出)

(7)

[监视非堆内存使用量]-[Metaspace]

Metaspace

(8)

[监视非堆内存使用量]-[Compressed Class Space]

Compressed Class Space

(6)+(7)+(8)

[监视非堆内存使用量]-[领域整体]

NON_HEAP

5.26.10. 检测出异常时想按照故障原因执行命令时

检测出监视资源的异常时,在EXPRESSCLUSTER不会按照故障原因的区分而提供不同的命令。
JVM监视资源可按照故障原因的区分执行不同的命令。并在检测出异常时执行。
按照故障原因执行的命令的设置项目如下所示。

故障原因

设置项目

・连接到监视对象的Java VM失败
・资源测量失败
[监视(固有)]标签页[命令]
・堆内存使用率
・非堆内存使用率
・堆内存使用量
・非堆内存使用量

[监视(固有)]标签页[调整]属性[内存]标签页[命令]

・运行中的线程数

[监视(固有)]标签页[调整]属性[线程]标签页[命令]

・Full GC执行时间
・Full GC发生次数

[监视(固有)]标签页[调整]属性[GC]标签页[命令]

・WebLogic的Work Manager的请求
・WebLogic的线程Pool的请求

[监视(固有)]标签页[调整]属性[WebLogic]标签页[命令]

[命令]可将故障原因的详细作为命令的参数移交。参数结合在[命令]的最后移交。通过将脚本等设置为自身制作的[命令],可更进一步展开特定故障原因的操作。作为参数移交的字符串如下所示。
记载多个作为参数移交的字符串时,按照监视对象Java VM的GC方式可移交任意的字符串。有关差异的详细,请参阅"关于Java内存Pool名"。
记载有(Oracle Java时) (Oracle Java(usage monitoring)时)时,因JVM类别而异。没有记载时,没有因JVM类别的区别。

故障原因的详细

作为参数移交的字符串

・连接到监视对象的Java VM失败
・资源测量失败
[监视(固有)]标签页[调整]属性[内存]标签页[监视堆内存使用率]-[领域整体]
(Oracle Java时)
HEAP
[内存]标签页[监视堆内存使用率]-[Eden Space]
(Oracle Java时)
EdenSpace
PSEdenSpace
ParEdenSpace

[内存]标签页[监视堆内存使用率]-[Survivor

SurvivorSpace

Space]

PSSurvivorSpace

(Oracle Java时)

ParSurvivorSpace

[内存]标签页[监视堆内存使用率]-[Tenured Gen]
(Oracle Java时)
TenuredGen
PSOldGen
CMSOldGen
[内存]标签页[监视非堆内存使用率]-[领域整体]
(Oracle Java时)

NON_HEAP

[内存]标签页[监视非堆内存使用率]-[Code Cache]
(Oracle Java时)

CodeCache

[内存]标签页[监视非堆内存使用率]-[Perm Gen]
(Oracle Java时)
PermGen
PSPermGen
CMSPermGen
[内存]标签页[监视非堆内存使用率]-[Perm Gen[shared-ro]]
(Oracle Java时)

PermGen[shared-ro]

[内存]标签页[监视非堆内存使用率]-[Perm Gen[shared-rw]]
(Oracle Java时)

PermGen[shared-rw]

[内存]标签页- [监视堆内存使用使用量]-[领域整体]
(Oracle Java(usage monitoring) 时)

HEAP

[内存]标签页- [监视堆内存使用使用量]-[Eden Space]
(Oracle Java(usage monitoring) 时)
EdenSpace
PSEdenSpace
ParEdenSpace
G1EdenSpace
[内存]标签页- [监视堆内存使用使用量]-[Survivor Space]
(Oracle Java(usage monitoring) 时)
SurvivorSpace
PSSurvivorSpace
ParSurvivorSpace
G1SurvivorSpace
[内存]标签页- [监视堆内存使用使用量]-[Tenured Gen]
(Oracle Java(usage monitoring) 时)
TenuredGen
PSOldGen
CMSOldGen
G1OldGen
[内存]标签页- [监视非堆内存使用量]-[领域整体]
(Oracle Java(usage monitoring) 时)

NON_HEAP

[内存]标签页- [监视非堆内存使用量]-[Code Cache]
(Oracle Java(usage monitoring) 时)

CodeCache

[内存]标签页- [监视非堆内存使用量]-[Metaspace]
(Oracle Java(usage monitoring) 时)

Metaspace

[内存]标签页- [监视非堆内存使用量]-[CodeHeap non-nmethods]
(Oracle Java(usage monitoring) 时)

non-nmethods

[内存]标签页- [监视非堆内存使用量]-[CodeHeap profiled]
(Oracle Java(usage monitoring) 时)

profilednmethods

[内存]标签页- [监视非堆内存使用量]-[CodeHeap non-profiled]
(Oracle Java(usage monitoring) 时)

non-profilednmethods

[内存]标签页- [监视非堆内存使用量]-[Compressed Class Space]
(Oracle Java(usage monitoring) 时)

CompressedClassSpace

[线程]标签页[监视运行中的线程数]

Count

[GC]标签页[监视Full GC执行时间]

Time

[GC]标签页[监视Full GC发生次数]

Count

[WebLogic]标签页[监视Work Manager的请求]-[待机请求 请求数]

WorkManager_PendingRequests

[WebLogic]标签页[监视线程Pool的请求]-[待机请求 请求数]

ThreadPool_PendingUserRequestCount

[WebLogic]标签页[监视线程Pool的请求]-[执行请求数]

ThreadPool_Throughput

以下表示执行例。

例1)

设置项目

设置内容

[监视(固有)]标签页[调整]属性[GC]标签页[命令]

/Program Files/bin/command.bat

[监视(固有)]标签页[调整]属性[GC]标签页[监视Full GC发生次数]

1

[集群]属性[JVM监视]标签页[资源测量设置]-[共通]标签页[异常判定阈值]

3

若JVM监视资源连续异常判定阈值次数(3次)发生Full GC,则检测出监视异常,作为「/Program Files/bin/command.bat Cont」执行命令。

例2)

设置项目

设置内容

[监视(固有)]标签页[调整]属性[GC]标签页[命令]

"/Program Files/bin/command.bat" GC

[监视(固有)]标签页[调整]属性[GC]标签页[监视Full GC执行时间]

65536

[集群]属性[JVM监视]标签页[资源测量设置]-[共通]标签页[异常判定阈值]

3

若JVM监视资源连续异常判定阈值次数(3次),Full GC执行时间超过65535豪秒,则检测出监视异常,作为「/Program Files/bin/ command.bat GC Time」执行命令。

例3)

设置项目

设置内容

[监视(固有)]标签页[调整]属性[内存]标签页[命令]

"/Program Files/bin/ command.bat" memory

[监视(固有)]标签页[调整]属性[内存]标签页[监视堆内存使用率]

On

[监视(固有)]标签页[调整]属性[内存]标签页[Eden Space]

80

[监视(固有)]标签页[调整]属性[内存]标签页[Survivor Space]

80

[集群]属性[JVM监视]标签页[资源测量设置]-[共通]标签页[异常判定阈值]

3

若JVM监视资源连续异常判定阈值次数(3次),Java Eden Space的使用率以及Java Survivor Space的使用率超过了80%,则检测出监视异常,作为"/Program Files/bin/ command.bat memory EdenSpace SurvivorSpace"执行命令。

等待在[命令]所设置的命令的结束的超时(秒),可在[集群的属性][JVM监视]标签页[命令超时]设置。借此,在上述各标签页的[命令]可适用相同的值。不能进行[命令]个别的设置。

发生超时时,不执行强制结束[命令]进程的处理。在[命令]进程后的处理(例:强制结束)请由客户自己执行。发生超时时,以下的消息会输出到JVM运行日志中。

action thread execution did not finish. action is alive = <命令>

注意事项如下所示。

  • 检测出Java VM的正常复归时(异常->正常时)不执行[命令]。

  • 以检测出Java VM异常时(按照异常判定阈值次数,连续发生超过阈值时)为契机执行[命令]。不是每超过阈值便执行。

  • 若在多个标签页上设置[命令],同时发生故障时,会执行多个的[命令]。因此,请注意系统负载。

  • 监视[监视(固有)]标签页[调整]属性[WebLogic]标签页[监视Work Manager的请求]-[待机请求 请求数]和[监视(固有)]标签页[调整]属性[WebLogic]标签页[监视Work Manager的请求]-[待机请求 平均值]的双方时,有可执行同时执行2次[命令]。
    这是因为,有可执行同时检测出[集群]属性[JVM监视]标签页[资源测量设置]-[WebLogic]标签页[间隔请求数]和[集群]属性[JVM监视]标签页[资源测量设置]-[WebLogic]标签页[间隔平均值]的异常。作为回避的对策,请仅监视任意一方。以下的监视项目的组合也同样。
  • [监视(固有)]标签页[调整]属性[WebLogic]标签页[监视线程Pool的请求]-[待机请求数]和[监视(固有)]标签页[调整]属性[WebLogic]标签页[监视线程Pool的请求]-[待机请求平均值]

  • [监视(固有)]标签页[调整]属性[WebLogic]标签页[监视线程Pool的请求]-[执行请求 请求数]和[监视(固有)]标签页[调整]属性[WebLogic]标签页[监视线程Pool的请求]-[执行请求平均值]

5.26.11. 监视WebLogic Server

完成监视对象WebLogic Server的设置,并作为应用程序服务器运行的步骤请参考WebLogic Server的使用说明书。

本章只介绍JVM监视资源监视时所必需的设置。

  1. 启动WebLogic Server Administration Console。
    启动方法请参考WebLogic Server使用说明书的"Administration Console的概要"。
    选择域设置-域-设置-整体。在这里请先确认"启用管理端口"复选框为未选中状态。
  2. 在域设置-服务器中选择监视对象的服务器名。选择的服务器名设置为可以从Cluster WebUI编辑模式中选择的[属性]-[监视(固有)]标签的[识别名]。

  3. 在监视对象服务器的设置-整体中,确认"监听端口"中管理连接的端口号。

  4. 停止WebLogic Server。停止方法请参考WebLogic Server使用说明书的"WebLogic Server的启动和停止"。

  5. 打开WebLogic Server的启动脚本。

  6. 在打开的脚本中记载以下内容。

    • 监视对象为WebLogic Server的管理服务器时

      set JAVA_OPTIONS=%JAVA_OPTIONS%
      -Dcom.sun.management.jmxremote.port=n
      -Dcom.sun.management.jmxremote.ssl=false
      -Dcom.sun.management.jmxremote.authenticate=false
      -Djavax.management.builder.initial=weblogic.management.jmx.mbeanserver.WLSMBeanServerBuilder
      

      ※在实际操作中请将上述内容记载为1行。

注解

n用来指定监视时使用的端口号。指定的端口号请指定为与监视对象Java VM的监听端口号不同的号码。此外,同一设备有多个监视对象的WebLogic Server时,请指定不同于监听端口号和其他应用程序端口号的号码。

  • 监视对象为WebLogic Server的管理对象服务器时

    if "%SERVER_NAME%" == "SERVER_NAME"(
        set JAVA_OPTIONS=%JAVA_OPTIONS%
    -Dcom.sun.management.jmxremote.port=n
    -Dcom.sun.management.jmxremote.ssl=false
    -Dcom.sun.management.jmxremote.authenticate=false
    -Djavax.management.builder.initial=weblogic.management.jmx.mbeanserver.WLSMBeanServerBuilder
    )
    

    ※在实际操作中,请将if语句记载为1行。

注解

SERVER_NAME指定为"选择监视对象服务器"中确认的监视对象服务器名。存在多个监视对象服务器时,按照同样的设置(1~6行)更改服务器名,重复设置。

注解

上述内容中添加的部分请放在以下记载的前面。

%JAVA_HOME%\bin\java %JAVA_VM% %MEM_ARGS%
-Dweblogic.Name=%SERVER_NAME%
-Djava.security.policy=%WL_HOME%\server\lib\weblogic.policy %JAVA_OPTIONS
% %PROXY_SETTINGS% %SERVER_CLASS%

※在实际操作中请将上述内容记载为1行

  1. 启动监视对象的WebLogic Server的WSLT(wlst.cmd)。
    启动方法是选择[开始]菜单的 [Oracle WebLogic]-[WebLogic Server <版本号>]-[Tools]-[WebLogic Scripting Tool]。
  2. 监视Work Manage或线程Pool的请求时,请进行以下设置。
    启动监视对象WebLogic Server的WLST(wlst.cmd)。
    启动方法为在[开始]菜单中选择[Oracle WebLogic]-[WebLogic Server <版本编号>]-[Tools]-[WebLogic Scripting Tool]。
    请在显示的提示画面上执行以下命令。
    > connect('USERNAME','PASSWORD','t3://SERVER_ADDRESS:SERVER_PORT')
    > edit()
    > startEdit()
    > cd('JMX/DOMAIN_NAME')
    > set('PlatformMBeanServerUsed','true')
    > activate()
    > exit()

    请将上面的USERNAMEPASSWORDSERVER_ADDRESSSERVER_PORTDOMAIN_NAME替换为符合域环境的值。

  3. 重启监视对象WebLogic Server

5.26.12. 监视WebOTX

本章将介绍JVM监视资源的监视对象WebOTX的设置步骤。
启动WebOTX集成操作管理控制台。启动方法请参考《WebOTX操作篇(Web版集成操作管理工具)》手册的"集成操作管理工具的启动和停止"。

以下设置中,监视WebOTX上JMX代理的Java进程与监视进程组上的Java进程其设定内容有所不同。请根据监视对象进行设置。

5.26.13. 监视WebOTX域代理的Java进程

不需要设置操作。

5.26.14. 监视WebOTX进程组的Java进程

  1. 通过集成操作管理工具连接域。

  2. 在树形图中选择[<域名>]-[TP系统]-[应用程序组]-[<应用程序组名>]-[进程组]-[<进程组名>]。

  3. 在右侧显示的[JVM选项]标签内的[其他参数]属性中,用1行指定下一个Java选项。n用来指定端口号。若同一设备有多个监视对象Java VM存在,请指定不同的端口号。这里指定的端口号在Cluster WebUI([监视资源的属性]->[监视(固有)]标签页->[连接端口号] )中也会设置。

    -Dcom.sun.management.jmxremote.port=n
    -Dcom.sun.management.jmxremote.ssl=false
    -Dcom.sun.management.jmxremote.authenticate=false
    -Djavax.management.builder.initial=com.nec.webotx.jmx.mbeanserver.JmxMBeanServerBuilder
    
  4. 完成设置后点击[更新]。完成设置后,重启进程组。
    本设置也可在WebOTX集成操作管理工具[Java系统属性]标签内的[Java系统属性]中进行指定。此时,"-D"为不指定,"="之前的字符串指定为"名称","="之后的字符串指定为"值"。

注解

WebOTX 进程组的功能中,如果设定了进程故障时重启,集群恢复动作中执行进程组的重启时,WebOTX 进程组的功能有可执行会产生异常。
因此,监视WebOTX进程组时,需在Cluster WebUI中对JVM监视资源作以下设定。

设定标签名

项目名

设定值

监视(共通)

监视时间

不间断监视

复归操作

复归动作

只在最终动作时执行

复归操作

最终动作

无操作

5.26.15. 接收WebOTX notification通知

通过登录特定的监听器类,当WebOTX查出故障时就发行notification。JVM监视资源接收到该notification,就会向JVM运行日志发出以下的通知。

%1$s:Notification received. %2$s.

%1$s,%2$s的意思如下。

%1$s:监视对象Java VM
%2$s:notification的通知 (ObjectName=**,type=**,message=**)

现在,可监视的资源的Mbean的详细信息如下表所述。

ObjectName

[domainname]:j2eeType=J2EEDomain,name=[domainname],category=runtime

Notification类型

nec.webotx.monitor.alivecheck.not-alive

消息

failed

5.26.16. 监视Tomcat

对JVM监视资源中,监视对象的Tomcat 的设置步骤进行说明。

  1. 停止Tomcat,从[开始]-(Tomcat的文件夹)-[Configure Tomcat]打开。

  2. 在打开的窗口的[java]标签页的[Java Option]中用1行来记述以下的内容。n 指定端口编号。如果同一机器中存在多个监视对象的Java VM,则需要指定不重复的端口编号。此处指定的端口编号也可通过Cluster WebUI ([监视资源的属性]->[监视(固有)标签页]->[连接端口编号])来设置。

    -Dcom.sun.management.jmxremote.port=n
    -Dcom.sun.management.jmxremote.ssl=false
    -Dcom.sun.management.jmxremote.authenticate=false
    
  3. 保存上述的设置后,启动Tomcat。

  4. 在Cluster WebUI (JVM监视资源名->[属性]->[监视(固有)] 标签页->[识别名])中,请设置为与其他监视对象不重复的任意的字符串(例:tomcat)。

5.26.17. 监视SVF

JVM监视资源中,监视对象的SVF 的设置进行说明。

  1. 从下表中选择监视对象,从编辑器打开该当的脚本。

    监视对象

    编辑的文件

    Report Director EnterpriseServer

    <SVF安装路径>
    \launcher\ReportDirectorEnterpriseServer.run

    Report Director Svf Server

    <SVF安装路径>
    \launcher\ReportDirectorSvfServer.run

    Report Director Spool Balancer

    <SVF安装路径>
    \launcher\ReportDirectorSpoolBalancer.run

    Tomcat

    %FIT_PRODUCTS_BASE%\SetupUtils\setup_tomcat.bat

    SVF Print Spooler services

    <SVF安装路径>\svfjpd\launcher\SpoolerDaemon.run

  2. (监视对象为Tomcat时)
    setup_tomcat.bat 中的:install 的 --JvmOption 的地方,添加如下。n 指定端口编号。如果同一机器中存在多个监视对象的Java VM,则需要指定不重复的端口编号。此处指定的端口编号也可通过Cluster WebUI ([监视资源的属性]->[监视(固有)]标签页->[连接端口编号])来设置。

    更改前:

    --JvmOptions=...
    

    更改后:

    --JvmOptions=...;-Dcom.sun.management.jmxremote.port=n;-Dcom.sun.management.jmxremote.ssl=false;-Dcom.sun.management.jmxremote.authenticate=false
    
  3. (监视对象不是Tomcat时)在指定Arguments的[-Xms]后面用1行来记述以下的内容。n 指定端口编号。如果同一机器中存在多个监视对象的Java VM,则需要指定不重复的端口编号。此处指定的端口编号也可通过Cluster WebUI ([监视资源的属性]->[监视(固有)]标签页->[连接端口编号])来设置。

    -Dcom.sun.management.jmxremote.port=n -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false
    

5.26.18. 监视自己制造的Java应用程序

对在JVM监视资源中监视的目标的Java应用程序的设置步骤进行说明。在监视目标的Java应用程序为停止状态下,在Java应用程序启动时的选项中用1行指定下一个Java选项。n 指定用于监视的端口号。如果同一机器中存在多个监视对象的Java VM,则需要指定不重复的端口编号。此处指定的端口编号也可通过Cluster WebUI ([监视资源的属性]->[监视(固有)]标签页->[连接端口编号])来设置。
-Dcom.sun.management.jmxremote.port=n -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false

根据Java应用程序还需要添加以下内容。

-Djavax.management.builder.initial=<MBeanServerBuilder 的类名>

5.26.19. 监视(固有)标签页

监视对象

从列表中选择监视对象。监视WebSAM SVF for PDF,WebSAM Report Director Enterprise和WebSAM Universal Connect/X 时,请选择[WebSAM SVF]。监视自己制造的Java应用程序时,请选择[Java应用程序]。

默认值 : 无

JVM类型

从列表中选择监视对象应用程序操作的Java VM。
Java 8以上时请选择[Oracle Java(usage monitoring)]。Java 8时需进行以下的规格更改。
  • 无法获得非堆领域的各内存的最大值。

  • Perm Gen被更改为Metaspace。

  • 追加了Compressed Class Space。

因此,Java 8时的[内存]标签页的监视项目需进行以下的更改。

  • 使用率监视被更改为使用量监视。

  • 无法监视[Perm Gen],Perm Gen[shared-ro],Perm Gen[shared-rw]。请将复选框设置为OFF。

  • 可以监视[Metaspace],[Compressed Class Space]。

Java 9时有以下的设计变更。

  • Code Cache 被分割。

因此,Java 9时的[内存]标签页的监视项目需进行以下的变更。

  • 无法监视[Code Cache]。请将复选框设置为OFF。

  • 可以监视[CodeHeap non-nmethods] ,[CodeHeap profiled] ,[CodeHeap non-profiled]。

默认值 : 无

识别名(255字节以内)

识别名是在JVM监视的JVM运行日志中输出监视对象信息时,为了识别与其他JVM监视资源而设定的。为此,请在JVM监视资源之间设定唯一的字符串。请务必进行设置。

  • 监视对象为[WebLogic Server]时
    参考"5.26.11. 监视WebLogic Server "中的2,设置监视对象的服务器实例名。
  • 监视对象为[WebOTX进程组]时
    请设置进程组名。
  • 监视对象为[WebOTX域代理]时
    请设置域名。
  • 监视对象为[WebOTX ESB]时
    与"WebOTX 进程组"时一样设置。
  • 监视对象为[Tomcat]时
    请参阅"5.26.16. 监视Tomcat"的4进行设置。
  • 监视对象为[WebSAM SVF]时
    请参阅"5.26.17. 监视SVF"的4进行设置。
  • 监视对象为[Java应用程序]时
    请将监视对象的Java VM 进程指定为一个唯一可识别的字符串。

默认值 : 无

连接端口号 (1024~65535)

设置JVM监视资源在进行监视对象Java VM和JMX连接时所使用的端口号。JVM监视资源从监视对象Java VM所进行的JMX连接来取得信息。为此,登录JVM监视资源时,需要在监视对象Java VM上开放JVM连接用的端口。请务必设置。不建议设置42424~61000。

  • 监视对象为[WebLogic Server]时
    请参考"5.26.11. 监视WebLogic Server"中的6,设置连接端口号。
  • 监视对象为[WebOTX进程组]时
  • 监视对象为[WebOTX域代理]时
    请设置"(WebOTX安装路径)/<域名>.properties"中的"domain.admin.port"。
  • 监视对象为[WebOTX ESB]时
    与"WebOTX 进程组"时一样设置。
  • 监视对象为[Tomcat]时
    请参阅"5.26.16. 监视Tomcat"的2进行设置。
  • 监视对象为[WebSAM SVF]时
    请参阅"5.26.17. 监视SVF"的2进行设置。
  • 监视对象为[Java应用程序]时
    请确认连接端口编号在监视对象的Java 应用程序上之后才设置。

默认值 : 无

进程名(255字节以内)

由于可以通过[连接端口号]识别监视目标Java VM ,因此不需要设置。内部版本11.35为止的版本中,在获取虚拟内存使用量时或在JVM运行日志中输出监视目标的信息时,也是用本参数识别的,因此需要指定。但是,内部版本12.00之后的版本中,由于"监视虚拟内存使用量"已经被删除,因此无法设置。

默认值 : 无

用户名 (255字节以内)

设置连接监视对象Java VM的管理员名称。监视对象选择为[WebOTX域代理]时
请设置"/opt/WebOTX/<域名>.properties"中"domain.admin.user"的值。

默认值 :无

密码 (255字节以内)

设置连接监视对象Java VM的管理员密码。监视对象选择为[WebOTX域代理]时
请设置"(WebOTX安装路径)\<域名>.properties"的"domain.admin.passwd"的值。请点击[更改],在显示的密码输入对话框内进行设置。密码将被隐藏。

默认值 : 无

命令(255字节以内)

查出监视对象的Java VM异常时,设置要执行的命令。可指定根据不同异常原因执行的命令和参数。请指定绝对路径。另外,请用双引号("")将执行文件名括起来。例) "\Program Files\bin\command.bat" arg1 arg2
在此设置无法连接监视对象Java VM或获取使用资源量查出异常时要执行的命令。

默认值 :无

点击[调整]后,弹出的对话框中会显示以下内容。根据以下说明进行详细设置。

5.26.20. 内存标签(在[JVM类型]选择[Oracle Java]时)

监视堆内存使用率

对监视对象Java VM使用的Java堆空间使用率进行监视设置。

  • 复选框选中(默认值)
    监视。
  • 复选框未选中
    不监视。

领域整体 (1~100)

设置监视对象Java VM使用的Java堆内存使用率之界限值。

默认值 : 80[%]

Eden Space (1~100)

设置监视对象Java VM使用的Java Eden Space使用率之界限值。作为监视对象的Java VM的GC方式指定为G1 GC时,请改读为G1 Eden Space。

默认值 : 100[%]

Survivor Space (1~100)

设置监视对象Java VM使用的Java Survivor Space使用率之界限值。作为监视对象的Java VM的GC方式指定为G1 GC时,请改读为G1 Survivor Space。

默认值 : 100[%]

Tenured Gen (1~100)

设置监视对象Java VM使用的JJava Tenured(Old) Gen空间使用率之界限值。作为监视对象的Java VM的GC方式指定为G1 GC时,请改读为G1 Old Gen。

默认值 : 80[%]

监视非堆内存使用率

对监视对象Java VM使用的Java非堆空间之使用率进行监视设置。

  • 复选框选中(默认值)
    监视。
  • 复选框未选中
    不监视。

领域整体 (1~100)

设置监视对象Java VM使用的Java非堆空间使用率之界限值。

默认值 : 80[%]

Code Cache (1~100)

设置监视对象Java VM使用的Java Code Cache空间使用率之界限值。

默认值 : 100[%]

Perm Gen (1~100)

设置监视对象Java VM使用的Java Perm Gen空间使用率之界限值。

默认值 : 80[%]

Perm Gen[shared-ro] (1~100)

设置监视对象Java VM使用的Java Perm Gen [shared-ro]空间使用率之界限值。
Java Perm Gen [shared-ro] 范围,是其监视对象Java VM启动选项 -client -Xshare:on -XX:+UseSerialGC 启动时设置的使用范围。

默认值 : 80[%]

Perm Gen[shared-rw] (1~100)

设置监视对象Java VM使用的Java Perm Gen [shared-rw]空间使用率之界限值。
Java Perm Gen [shared-rw] 范围,是其监视对象Java VM启动选项 -client -Xshare:on -XX:+UseSerialGC 启动时设置的使用范围。

默认值 : 80[%]

命令 (255字节以内)

查出监视对象的Java VM异常时,设置要执行的命令。可指定根据不同异常原因执行的命令和参数。请指定绝对路径。另外,请用双引号("")将执行文件名括起来。例) "\Program Files\bin\command.bat" arg1 arg2
在此设置查出监视对象Java VM的Java堆内存,Java非堆内存异常时要执行的命令。

默认值 :无

默认值

点击[默认值]按钮后,所有项目将设置为默认值。

5.26.21. 内存标签(在[JVM类型]选择[Oracle Java(usage monitoring)] 时)

监视堆内存使用量

对监视对象Java VM使用的Java堆空间使用量进行监视设置。

  • 复选框选中(默认值)
    监视。
  • 复选框未选中
    不监视。

领域整体 (0~102400)

设置监视对象Java VM使用的Java堆内存使用量之界限值。为0时不进行监视。

默认值 : 0[MB]

Eden Space(0~102400)

设置监视对象Java VM使用的Java Eden Space使用使用量之界限值。为0时不进行监视。作为监视对象的Java VM的GC方式指定为G1 GC时,请改读为G1 Eden Space。

默认值 :0[MB]

Survivor Space(0~102400)

设置监视对象Java VM使用的Java Survivor Space使用量之界限值。为0时不进行监视。作为监视对象的Java VM的GC方式指定为G1 GC时,请改读为G1 Survivor Space。

默认值 :0[MB]

Tenured Gen(0~102400)

设置监视对象Java VM使用的JJava Tenured(Old) Gen空间使用量之界限值。为0时不进行监视。作为监视对象的Java VM的GC方式指定为G1 GC时,请改读为G1 Old Gen。

默认值 :0[MB]

监视非堆内存使用量

对监视对象Java VM使用的Java非堆空间之使用量进行监视设置。

  • 复选框选中(默认值)
    监视。
  • 复选框未选中
    不监视。

领域整体 (0~102400)

设置监视对象Java VM使用的Java非堆空间使用量之界限值。为0时不进行监视。

默认值 : 0[MB]

Code Cache(0~102400)

设置监视对象Java VM使用的Java Code Cache空间使用量之界限值。为0时不进行监视。

默认值 :0[MB]

CodeHeap non-nmethods(0~102400)

设置监视对象Java VM使用的Java CodeHeap non-nmethods空间使用量之界限值。为0时不进行监视。

默认值 :0[MB]

CodeHeap profiled(0~102400)

设置监视对象Java VM使用的Java CodeHeap profiled空间使用量之界限值。为0时不进行监视。

默认值 :0[MB]

CodeHeap non-profiled(0~102400)

设置监视对象Java VM使用的Java CodeHeap non-profiled空间使用量之界限值。为0时不进行监视。

默认值 :0[MB]

Compressed Class Space(0~102400)

设置监视对象Java VM使用的Java Compressed Class Space空间使用量之界限值。为0时不进行监视。

默认值 :0[MB]

Metaspace(0~102400)

设置监视对象Java VM使用的Metaspace空间使用量之界限值。

默认值 :0[MB]

命令 (255字节以内)

查出监视对象的Java VM异常时,设置要执行的命令。可指定根据不同异常原因执行的命令和参数。请指定绝对路径。另外,请用双引号("")将执行文件名括起来。例) "\Program Files\bin\command.bat" arg1 arg2
在此设置查出监视对象Java VM的Java堆内存,Java非堆内存异常时要执行的命令。

默认值 :无

默认值

点击[默认值]按钮后,所有项目将设置为默认值。

5.26.22. 线程标签

监视动作中的线程数 (1~65535)

设置监视对象Java VM中正在运行的线程上限值。

默认值 : 65535[线程]

命令 (255字节以内)

查出监视对象的Java VM异常时,设置要执行的命令。可指定根据不同异常原因执行的命令和参数。请指定绝对路径。另外,请用双引号("")将执行文件名括起来。例) "\Program Files\bin\command.bat" arg1 arg2
在此设置查出监视对象Java VM目前运行中的线程数的异常时要执行的命令。

默认值 :无

默认值

点击[默认值]按钮后,所有项目将设置为默认值。

5.26.23. GC标签

监视Full GC执行时间 (1~65535)

在监视对象Java VM中,设置前一次测量后的Full GC执行时间之界限值。Full GC执行时间指的是,除以前一次测量后Full GC发生次数而得出的平均值。
若希望将Full GC执行时间3000毫秒,Full GC发生次数3次的情况判定为异常,则请将前一次测量后的Full GC执行时间设置为1000毫秒以下。

默认值 : 65535[毫秒]

监视Full GC发生次数 (1~65535)

在监视对象Java VM中,设置前一次测量后的Full GC发生次数之界限值。

默认值 : 1(次)

命令 (255字节以内)

查出监视对象的Java VM异常时,设置要执行的命令。可指定根据不同异常原因执行的命令和参数。请指定绝对路径。另外,请用双引号("")将执行文件名括起来。例) "\Program Files\bin\command.bat" arg1 arg2
在此设置查出监视对象Java VM的Full GC执行时间或Full GC发生次数的异常时要执行的命令。

默认值 :无

默认值

点击[默认值]按钮后,所有项目将设置为默认值。

5.26.24. WebLogic标签页

监视Work Manager的请求

在WebLogic Server中,对Work Manager的待机请求状态进行监视设置。

  • 选中复选框
    监视。
  • 不选中复选框(默认值)
    不监视。

监视对象Work Manager(255字节以内)

对监视对象的WebLogic Server,设置监视目标应用程序的Work Manager名称。执行Work Manager监视时,请务必设置。
App1[WM1,WM2,...];App2[WM1,WM2,...];...
在App和WM中可指定的字符为ASCII字符。(不包括Shift_JIS 编码0x005C 和0x00A1~0x00DF )
若应用程序中包含存档的版本,请在App中指定"应用程序名#版本"。
若应用程序名中包含"["或"]",请在其前面添加"¥¥"。

(例如)应用程序名为app[2]时,则为app¥¥[2¥¥]

默认值 : 无

请求数 (1~65535)

在监视对象WebLogic Server的Work Manager中,设置待机请求数的界限值。

默认值 : 65535

平均值 (1~65535)

在监视对象WebLogic Server的Work Manager中,设置待机请求数平均值的界限值。

默认值 : 65535

相比上一次测量值的增加率 (1~1024)

在监视对象WebLogic Server的Work Manager中,设置上一次测量后待机请求数增量的界限值。

默认值 : 80[%]

监视线程Pool的请求

在监视对象WebLogic Server的线程Pool中,对待机请求数(WebLogic Server内部待处理的HTTP请求数)进行监视设置。

  • 选中复选框(默认值)
    监视。
  • 不选中复选框
    不监视。

待机请求 请求数 (1~65535)

设置待机请求数的界限值。

默认值 : 65535

待机请求 平均值 (1~65535)

设置待机请求数平均值的界限值。

默认值 : 65535

待机请求 相比上一次测量值的增加率 (1~1024)

设置上一次测量后,待机请求数增量的界限值。

默认值 : 80[%]

执行请求 请求数 (1~65535)

设置单位时间内执行请求数的界限值。

默认值 : 65535

执行请求 平均值 (1~65535)

设置单位时间内执行的请求数平均值之界限值。

默认值 : 65535

执行请求 相比上一次测量值的增加率 (1~1024)

设置上一次测量后,单位时间内执行的请求数增量之界限值。

默认值 : 80[%]

命令 (255字节以内)

查出监视对象的Java VM异常时,设置要执行的命令。可指定根据不同异常原因执行的命令和参数。请指定绝对路径。另外,请用双引号("")将执行文件名括起来。例) "\Program Files\bin\command.bat" arg1 arg2
在此设置查出WebLogic Server的WorkManage的请求,线程Pool的请求的异常时要执行的命令。

默认值 :无

默认值

点击[默认值]按钮后,所有项目将设置为默认值。

5.27. 设置系统监视资源

系统监视资源是对系统资源进行监视的监视资源。系统监视资源可持续收集系统资源统计信息,并根据一定的知识信息进行解析处理。通过解析结果,可尽早发现资源枯竭。

5.27.1. 系统监视资源的注意事项

请在复归对象中指定System Resource Agent检测到资源监视异常时的失效切换对象资源。
System Resource Agent的设定值建议使用默认。
以下情况可执行无法查出资源监视异常。
  • 在系统全体资源监视下,反复在阈值上下增减时

系统为高负荷等状态下,统计信息收集时间过长,可执行导致无法在收集统计信息的间隔内收集信息。

正在运行时若更改OS的日期或时间,会导致每10分钟进行一次的解析处理时刻在日期或时间更改后的第一次有偏差。由于可执行会发生以下问题,请进行挂起集群和恢复集群操作。

  • 已经到了异常查出时间,却没有查出异常。

  • 还没到异常查出时间,却查出异常。

进行集群的挂起/复原时,从其启动的瞬间即开始收集信息。

系统资源使用量的解析每10分钟进行一次。因此,持续监视时间最多可执行经过10分钟后才会查出异常。

磁盘资源使用量的解析每60分钟进行一次。因此,持续监视时间最多可执行经过60分钟后才会查出异常。

磁盘资源的剩余容量监视中指定的磁盘容量,请指定为比实际磁盘容量小的数值。如果指定为较大值,将被认为剩余容量不足,查出异常。

交换正在监视中的磁盘时,如果交换前和交换后的磁盘在以下项目有差异,需要清除之前的解析信息。

  • 磁盘的总容量

  • 文件系统

请在没有获得Swap领域的机器中,不要选中系统的总虚拟内存使用量的监视。

磁盘资源监视功能不能对固定磁盘以外的磁盘进行监视。

磁盘资源监视功能中,同时能监视的最大磁盘数是26个。

如果监视资源的定义画面的类型栏中,没有显示「系统监视」时,请选择[获取License信息]来获取License信息。

从系统监视资源的监视开始,到实际进行监视处理为止的期间,系统监视资源的状态为"警告"。同时输出以下的警告日志信息。
Monitor sraw is in the warning status. (191 : 正常)
如果注册的系统监视资源和进程资源监视资源的数量很大,则可能会在警报日志中输出以下消息并检测到异常。
如果输出此消息,请重新设定 [监视 (共通)] 选项卡中的超时设置。
Monitor sraw has detected an error. (99 : monitor was timeout)

5.27.2. 系统监视资源的监视方法

系统监视资源进行以下监视。
持续收集并解析系统以及磁盘的系统资源的使用量。
如果资源使用量超过预设阈值,则会查出异常。
若查出异常的状态与监视持续时间连续,则会通知资源监视异常。
利用默认值进行系统资源监视时,如资源的使用量达到90%以上的状态持续,则在60分钟后通知资源监视的异常。
查出利用默认值进行系统资源监视时的总内存使用量的异常的示例如下所示。
  • 总内存使用量与经过时间同时持续处在总内存使用量的阈值以上的状态,并经过了一定时间以上时
    _images/img_how-system-monitor-resources-perform-monitoring-10.png

    图 5.11 若超过总内存使用量阈值的状态持续一定时间时(查出异常)

  • 总内存使用量与经过时间同时在总内存使用量的阈值前后增减,持续低于总内存使用量的阈值时

    下图中,总内存使用量暂时超过总内存使用量的阈值(90%)。 但是,由于超过该阈值的状态不会持续监视持续时间(60分),因此不会查出总内存使用量异常。

    _images/img_how-system-monitor-resources-perform-monitoring-20.png

    图 5.12 若超过总内存使用量阈值的状态不持续一定时间时(不查出异常)

利用默认值进行磁盘资源监视时,在24小时后通知通知级别的异常。
查出利用默认值进行磁盘资源监视时的磁盘使用率的异常的示例如下所示。

监视级别的磁盘容量监视

  • 磁盘使用率在警告级别上限值所指定的一定的阈值以上
    _images/img_how-system-monitor-resources-perform-monitoring-30.png

    图 5.13 磁盘使用率在警告级别上限值以上时(查出异常)

  • 磁盘使用率在一定范围内增减,不会超过警告级别上限值所指定的一定的阈值以上

    由于磁盘使用率在不超过警告级别上限的范围内增加或减少,因此不会被判断为磁盘容量监视异常。

    _images/img_how-system-monitor-resources-perform-monitoring-40.png

    图 5.14 磁盘使用率不在警告级别上限值以上时(不查出异常)

通知级别的磁盘容量监视

  • 磁盘使用率与经过时间同时持续处在通知级别上限值所指定的一定阈值以上的状态,并经过了一定时间以上时

    由于磁盘使用率持续超过通知级别上限值,因此判断为磁盘容量监视异常。

    _images/img_how-system-monitor-resources-perform-monitoring-50.png

    图 5.15 当磁盘使用率在一定时间持续高于通知级别上限值时(查出异常)

  • 磁盘使用率在一定范围内增减,不会超过通知级别上限值所指定的一定的阈值以上

    由于磁盘使用率在通知级别上限值前后有增加或减少,因此不判断为磁盘容量监视异常。

    _images/img_how-system-monitor-resources-perform-monitoring-60.png

    图 5.16 当磁盘使用率在一定时间没有持续高于通知级别上限值时(不查出异常)

5.27.3. 监视(固有)标签页

CPU使用率的监视

设置是否进行CPU使用率的监视。

  • 选中复选框
    进行CPU使用率的监视。
  • 不选中复选框
    不进行CPU使用率的监视。

使用率 (1~100)

设置查出CPU使用率异常的阈值。

持续时间 (1~1440)

设置查出CPU使用率异常的时间。
若持续高于阈值的时间超过指定时间,将会查出异常。

总内存使用量的监视

设置是否进行总内存使用量的监视。

  • 选中复选框
    进行总内存使用量的监视。
  • 不选中复选框
    不进行总内存使用量的监视。

使用量 (1~100)

设置查出内存使用量异常的阈值(占系统内存量百分比)。

持续时间 (1~1440)

设置查出总内存使用量异常的时间。
若持续高于阈值的时间超过指定时间,将会查出异常。

总虚拟内存使用量的监视

设置是否进行总虚拟内存使用量的监视。

  • 选中复选框
    进行总虚拟内存使用量的监视。
  • 不选中复选框
    不进行总虚拟内存使用量的监视。

使用量 (1~100)

设置查出虚拟内存使用量异常的阈值。

持续时间 (1~1440)

设置查出总虚拟内存使用量异常的时间。
超过阈值的持续时间在所指定的时间以上时,查出异常。

添加

添加要监视的磁盘。会显示出[输入监视条件]对话框。
按照[输入监视条件]对话框的说明,进行判定为异常的监视条件的详细设置。

删除

从监视对象中删除在[磁盘列表]上选择的磁盘。

编辑

会显示出[监视条件的输入]对话框。由于会显示出在[磁盘列表]上选择的磁盘的监视条件,因此可进行编辑,然后选择[OK]。

逻辑驱动器

设置进行监视的逻辑盘。

使用率

设置是否进行磁盘使用率的监视。

  • 选中复选框
    进行磁盘使用率的监视。
  • 不选中复选框
    不进行磁盘使用率的监视。

警告级别 (1~100)

设置检测磁盘使用率警報级别异常的阈值。

通知级别 (1~100)

设置检测磁盘使用率通知级别异常的阈值。

持续时间 (1~43200)

设置检测磁盘使用率通知级别异常的时间。
在指定时间以上持续超过阈值时,检测为异常。

剩余容量

设置是否进行磁盘空余容量的监视。

  • 选中复选框
    进行磁盘空余容量的监视。
  • 不选中复选框
    不进行磁盘空余容量的监视。

警告级别 (1~4294967295)

设置检测磁盘空余容量警報级别异常的容量(MB)。

通知级别 (1~4294967295)

设置检测磁盘空余容量通知级别异常的容量(MB)。

持续时间 (1~43200)

设置检测磁盘空余容量通知级别异常的时间。
在指定时间以上持续超过阈值时,检测为异常。

5.28. 设置进程资源监视资源

进程资源监视资源,是用来监视使用进程的资源的监视资源。它不断收集使用进程的资源的统计信息,并根据一定的知识信息进行分析。从分析结果中可以较早的发现发生资源耗尽的情况。

5.28.1. 进程资源监视资源的注意事项

关于进程资源监视资源的设定值,推荐使用默认值。

系统为高负荷等状态下,统计信息收集时间过长,可执行导致无法在收集统计信息的间隔内收集信息。

正在运行时若更改OS的日期或时间,会导致每10分钟进行一次的解析处理时刻在日期或时间更改后的第一次有偏差。由于可执行会发生以下问题,请进行挂起集群和恢复集群操作。

  • 已经到了异常查出时间,却没有查出异常。

  • 还没到异常查出时间,却查出异常。

进行集群的挂起/复原时,从其启动的瞬间即开始收集信息。
进程资源,系统资源使用量的解析每10分钟进行一次。因此,持续监视时间最多可执行经过10分钟后才会查出异常。
在监视资源的定义画面的类型栏中,没有显示[进程资源监视]时,请选择[获取License信息]获取证书信息。
从进程资源监视资源的监视开始,到实际进行监视处理为止的期间,系统监视资源的状态为"警告"。同时输出以下的警告日志信息。
监视psrw为警告状态。 (191 : 正常)

要使进程资源监视资源的状态从异常回到正常状态,请执行以下任意一种处理。

  • 集群的挂起·复原

  • 集群的停止·开始

请按照以下命令,确认并设定监视对象进程名的实际动作中进程的进程名。

EXPRESSCLUSTER安装路径\bin\GetProcess.vbs

从上面的命令中确认实际运行进程的进程名,并在输出信息的CommandLine部分指定监视对象的进程名。输出信息中包含「"」(双引号)时,「"」(双引号)也需要指定。

输出文件的列子

20XX/07/26 12:03:13
Caption     CommandLine
services.exe    C:\WINDOWS\system32\services.exe
svchost.exe     C:\WINDOWS\system32\svchost -k rpcss
explorer.exe    C:\WINDOWS\Explorer.EXE

从上面的命令输出信息来看,如果要监视 svchost.exe,需指定监视对象进程名 C:\WINDOWS\system32\svchost -k rpcss

指定为监视对象进程名的进程名可以将进程参数也作为进程名的一部分特定为监视对象的进程。指定监视对象进程名时,请指定包括参数在内的进程名。仅监视不含参数的进程名时,请使用通配符号(*)来指定不含参数的前方一致或部分一致。

如果注册的系统监视资源和进程资源监视资源的数量很大,则可能会在警报日志中输出以下消息并检测到异常。
如果输出此消息,请重新设定 [监视 (共通)] 选项卡中的超时设置。
Monitor psrw has detected an error. (99 : monitor was timeout)

5.28.2. 进程资源监视资源的监视方法

进程资源监视资源进行以下监视。
持续收集,分析进程资源的使用量。
如果资源使用量超过预设阈值,则会查出异常。
若查出异常的状态与监视持续时间连续,则会通知资源监视异常。
进程资源监视(CPU,内存,线程数)在默认值下运行时,24小时后将通知资源监视的异常。
查出进程资源监视的内存使用量异常的示例如下所示。
  • 内存使用量与经过时间同时增减,并且更新了规定次数以上的最大值,增加率变为初始值的10%以上时

    由于最大更新次数超过24小时(默认),并且增加率高于初始值的10%,因此判断为内存泄漏。

    _images/img_how-process-resource-monitor-resources-perform-monitoring-10.png

    图 5.17 内存使用量更新了规定次数以上的最大值,增加率超过初始值的10%(查出异常)

  • 在一定的范围内,内存使用量与经过时间同时增减

    由于内存使用量在一定值以下的范围内有增加或减少,因此不判断为内存泄漏。

    _images/img_how-process-resource-monitor-resources-perform-monitoring-20.png

    图 5.18 内存使用量在一定范围内增减(不查出异常)

5.28.3. 监视(固有)标签页

进程名 (1023字节以内)

设置监视对象进程的进程名。不设置进程名时,启动中的所有进程都作为监视对象。

此外,可使用下述的3种模式指定进程名的通配符号。其它模式不可指定。

【前方一致】 <包含进程名中的字符串>*

【后方一致】 *<包含进程名中的字符串>

【部分一致】 *<包含进程名中的字符串>*

CPU使用率的监视

设置是否进行CPU使用率的监视。

  • 选中复选框
    进行CPU使用率的监视。
  • 不选中复选框
    不进行CPU使用率的监视。

使用率 (1~100)

设置查出CPU使用率异常的阈值。

持续时间 (1~4320)

设置查出CPU使用率异常的时间。
若持续高于阈值的时间超过指定时间,将会查出异常。

总内存使用量的监视

设置是否进行内存使用量的监视。

  • 选中复选框
    进行内存使用量的监视。
  • 不选中复选框
    不进行内存使用量的监视。

相比初次监视的增加率(1~1000)

设置查出内存使用量异常的阈值。

最大更新次数(1~4320)

设置查出内存使用量异常的更新次数。
如果在指定的更新次数或更多时间内持续超过阈值,则会查出异常。

打开文件数的监视(最大值)

设置是否进行将打开文件数的监视。

  • 选中复选框
    进行打开文件数的监视。
  • 不选中复选框
    不进行打开文件数的监视。

刷新次数(1~4320)

设置查出打开文件数异常的刷新次数。
打开文件数的最大值超过指定次数更新时,查出异常。

线程数的监视

设置是否进行线程数的监视。

  • 选中复选框
    进行线程数的监视。
  • 不选中复选框
    不进行线程数的监视。

持续时间(1~4320)

设置查出线程数异常的时间。
如果有线程数增加,且超过指定时间以上的进程,则查出异常。

监视同一名称的进程

设置是否进行监视同一名称的进程。

  • 选中复选框
    进行监视同一名称的进程。
  • 不选中复选框
    不进行监视同一名称的进程。

个数(1~10000)

设置查出同一名称进程异常的个数。
同一名称进程超过指定个数时,查出异常。

5.29. 设置用户空间监视资源

用户空间监视资源是一种监视资源,它可对用户空间Stall操作进行监视。
用户空间监视资源是初始状态默认注册的。

5.29.1. 用户空间监视资源的监视方法

用户空间监视资源将进行如下监视操作。
监视操作开始后,该资源将启动keepalive 计时器,以后,每隔监视间隔时间,更新keepalive 计时器。通过用户空间Stall,当计时器在一定时间段内未进行更新时,该资源检测出异常。
为扩展监视操作,该资源将创建虚拟线程。设置值生效时,该资源将每隔一段监视间隔时间,就创建一次虚拟线程。虚拟线程创建失败时,该资源将不会更新keepalive 计时器。

用户空间监视资源的操作逻辑如下所示。

  • 处理概要
    反复执行如下2~3操作。
    1. 设置keepalive计时器

    2. 创建虚拟线程

    3. 更新keepalive计时器

    操作2. 为监视操作的扩展设置操作。若不进行各设置,则将不执行操作。

  • 未超时(可顺利实施上述2~3步骤)时的操作
    不执行重置等恢复操作。
  • 超时时(上述2~3中的某项操作停止或延迟了)的操作
    根据操作设置,通过EXPRESSCLUSTER的内核模块,进行HW重置或生成主动停止错误。

5.29.2. 监视(固有)标签页

监视方法

指定用户空间的监视方法。

  • keepalive

使用clphb驱动程序。

超时发生时的动作

指定超时发生时的动作。

  • 无操作
    不进行任何操作。
  • HW重置
    硬件reset
  • 停止错误
    生成停止错误。

注解

指定超时发生时动作时,无法生成模拟故障。

扩展监视设置

进行监视时,设置是否创建临时文件。

  • 选中复选框(默认值)
    创建临时文件
  • 不选中复选框
    不创建临时文件。

6. 其他设置的详细信息

本章中记载了EXPRESSCLUSTER X SingleServerSafe 其他监视设置的详细信息。
为提高与集群链接软件EXPRESSCLUSTER X的操作性等方面的兼容性,EXPRESSCLUSTER X SingleServerSafe 使用了相同的画面。

本章中说明的项目如下。

6.1. 集群属性

可以在[集群的属性]中显示EXPRESSCLUSTER X SingleServerSafe的详细信息或更改其设置。

6.1.1. 信息标签页

对集群名进行显示,登录注释,更改。

集群名

显示集群名。无法在此更改名称。

注释 (127字节以内)

设置集群的注释。只能输入半角的英文数字。

语言

从下面选择集群语言。在运行Cluster WebUI的OS语言(locale)中设置。

  • 英语

  • 日语

  • 中文

6.1.2. 私网标签页

不使用。

6.1.3. Fencing 标签页

不使用。

6.1.4. 超时标签页

设置超时值等。

服务启动延迟时间 (0~9999)

OS启动时延迟集群服务启动的时间。

网络初始化完成等待时间 (0~99)

服务器启动时,截至到自身服务器的NIC变为有效的完成时间。

同步等待时间 (0~99)

不使用。

心跳线

  • 间隔(1~99)
    心跳间隔。
  • 超时 (2~9999)
    心跳超时。如果在此处设置的时间内没有应答,则视为服务器宕机。
    需要大于间隔的值。

内部通信超时(1~9999)

在执行EXPRESSCLUSTER的命令,Cluster WebUI上的操作,显示画面时等,所执行的EXPRESSCLUSTER服务器的内部通信中使用的超时值。

默认值

返回默认值时使用。点击[默认值]则所有的项目都被设置为默认值。

6.1.5. 端口号标签页

设置TCP端口号,UDP端口号。

TCP

TCP的各端口号不能重复。

  • 内部通信端口号(1~65535 3)
    内部通信使用的端口号。
  • Information Base 端口号(1~65535 3)
    管理集群信息时使用的端口号。
  • 数据传送端口号(1~65535 3)
    事务(反映/备份集群配置信息,收发License信息,执行命令)使用的端口号。
  • WebManager HTTP端口号(1~65535 3)
    浏览器与EXPRESSCLUSTER X SingleServerSafe服务器通信时使用的端口号。
  • API HTTP 端口号(1~65535 3)
    Restful API客户端与ExpressCluster Server通信时使用的端口号。
  • API 内部通信端口号(1~65535 3)
    用于Restful API内部通信的端口号。
  • 磁盘Agent端口号(1~65535 3)
    不使用。
  • 镜像驱动端口号(1~65535 3)
    不使用。

UDP

UDP的各端口号不能重复。

  • 内核模式心跳端口号 (1~65535 3)
    内核模式心跳使用的端口号。
  • Alert同步端口号 (1~65535 3)
    服务器间进行警报消息的同步时使用的端口号。

默认值

返回默认值时使用。点击[默认值]则所有的项目被设为默认值。

3(1,2,3,4,5,6,7,8,9,10)

不推荐使用Well-known端口,特别是1~1023号的预定端口。

6.1.6. 监视标签页

进行监视相关设置。

系统资源

设置收集/不收集系统资源信息。
为了活用性的提高,定期收集系统资源信息。系统资源信息有益于调查EXPRESSCLUSTER的运行状况,可以比较容易找出因系统资源不足而产生的故障。
  • 选中复选框
    定期收集集群运行时的CPU,内存,进程等系统信息。
    收集系统信息可以用clplogcc命令和Cluster WebUI上的日志收集进行收集。
    用clplogcc命令收集日志时请指定type2,用Cluster WebUI收集日志时请指定模式2。关于日志收集的详细信息请参考《操作指南》的"收集日志 (clplogcc命令)"或者在线手册。
    进程的启动数等依赖于系统的工作状态的资源信息的保存,需要450MB以上的磁盘空间。
  • 不选中复选框
    不收集系统资源信息。

6.1.7. 复归标签页

进行恢复相关设置。

集群服务的进程异常时动作

指定集群服务的进程发生异常时动作。

  • 紧急关机
    关闭服务器。
  • 生成主动停止错误
    生成主动停止错误(Panic)后再重新启动服务器。
  • HW重置
    HW重设导致服务器重新启动。

HA进程异常时工作

  • 最大再启动次数 (0~99)
    指定HA进程异常时的重新启动次数。
  • 重试结束时动作
    指定HA进程异常时的动作。
    • 停止集群服务
      停止集群服务。
    • 停止集群服务和关闭操作系统
      停止集群服务和关闭操作系统。
    • 停止集群服务和重启操作系统
      停止集群服务和重启操作系统。

注解

HA进程是系统监视资源或进程资源监视资源,JVM监视资源,系统资源信息收集功能中使用的进程。

发生/失控指定组资源的启动/停止发生宕机时的动作

  • 紧急关机
    关闭发生宕机的服务器。
  • 生成主动停止错误
    使发生宕机的服务器产生故意停止错误(Panic)。
  • 无任何动作作(作为启动/停止异常来处理)
    进行检测出组资源的启动/停止异常时的复归动作。有

注解

  • 指定为「不进行任何操作(作为启动/停止异常来处理)」,在发生宕机时,对组资源的影响变为不确定,因此不建议将设定更改为「不进行任何操作(作为启动/停止异常来处理)」。

  • 指定为「不进行任何操作(作为启动/停止异常来处理)」时,检测出组资源的启动/停止异常时的复归动作的设定如下所示。

  • 启动/停止重试次数: 0次

  • 失效切换阈值: 0次

  • 最终动作:产生故意停止错误

在最终动作指定为[集群服务停止并关闭OS]或者[集群服务停止并重启OS]时,停止集群服务需花费较多时间。

抑制异常检测时操作系统停止执行的最终动作

点击[详细设置],设置随查出异常而OS停止时的最终动作控制。

  • 检测到组资源的启动异常时:
    查出组资源启动异常时的最终动作设置为随OS停止而发生的情况下,查出启动异常时控制最终动作。
  • 检测到组资源的停止异常时:
    查出组资源停止异常时的最终动作设置为随OS停止而发生的情况下,查出停止异常时控制最终动作。
  • 监视资源查出异常时:
    检测出监视资源异常时的最终动作设置为随OS停止而发生的情况下,查出异常时控制最终动作。

注解

  • 消息接收监视资源不属于查出异常时控制操作的对象。

  • 检测出组资源的启动/停止异常时的最终动作和检测出监视资源异常时的最终动作,伴随OS停止情况如下。

    • Cluster服务停止和OS关机

    • Cluster服务停止和OS重启

    • 发生主动停止错误

抑制检测到双重启动时的关机

不使用。

6.1.8. Alert服务标签页

设置警报通报,网络警告灯。

注解

要使用邮件通告功能,网络警告灯,请购买EXPRESSCLUSTER X SingleServerSafe Alert Service 5.0 for Windows,注册License。

使Alert通报设置生效

设置是否将警报通告目的地从默认设置更改为其他设置。如果要更改,请点击[编辑]按钮并设置输出目的地。
如果不选中此处的复选框,则可将更改后的输出目的地暂时恢复到默认值。
关于默认通报目的地,请参考《操作指南》的"错误消息一览表"中的"事件日志,警报消息"。

邮件地址 (255字节以内)

输入通报目标的邮件地址。如果要设置多个邮件地址,请用分号分隔邮件地址。

主题 (127字节以内)

输入邮件的主题。

邮件发送方法

设置邮件发送方法。当前只能选择SMTP。

  • SMTP
    直接与SMTP服务器通信并发送邮件。

发送地址设置

设置SNMP Trap发送功能。如果要设置SNMP Trap的发送地址时,点击[设置]进行发送地址的设置。

使用网络警告灯

不使用。

更改警报发送目标

点击[编辑],显示[Alert发送地址的变更]对话框。

添加

追加要定制通报接收方的警报ID。点击[添加]按钮后,显示输入消息对话框。

分类

选择模块类型的大分类。

模块类型 (31字节以内)

选择要更改发送方的模块类型名。

事件ID

输入要更改发送方的模块类型的消息ID。消息ID,请参考《操作指南》的"错误消息一览表"中的"事件日志,警报消息"。

发送地址

选择要作为消息发送执行的处理。

  • Alert Logs
    在警报日志中显示消息。
  • Alert Extension
    执行指定的命令(警报扩展功能)。设置,更改通过[添加]按钮,[编辑]按钮执行的命令。(最多可指定4个命令行)。
  • Mail Report
    通过邮件通报功能发送。
  • SNMP Trap
    使用SNMP Trap发送功能来送信。
  • Message Topic
    发送到Amazon SNS。
  • Event Log(DisableOnly)
    取消复选后不记录到OS的EventLog。(不能更改成输出不输出到EventLog的消息)。

添加

追加警报扩展功能的命令。点击[添加]按钮后,显示命令输入对话框。

命令 (511字节以内)

输入任意一个命令。

  • 关于关键词
    指定%%MSG%%后,将插入相应ID的消息正文。
    对于1个命令,不能够使用多个%%MSG%%。
    设置时,包括%%MSG%%的内容在内,长度需要控制在511个字节内。
    此外,%%MSG%%中有时会含有半角空格,指定为命令的参数时,请指定\"%%MSG%%\"。

删除

删除警报扩展功能的命令时使用。选择命令后,请点击[删除]按钮。

编辑

编辑警报扩展功能的命令时使用。请选择命令,点击[编辑]按钮。

SMTP设置

点击[SMTP设置],显示邮件通报使用的[SMTP设置]对话框。

邮件发送文书的字符编码(127字节以内)

设置邮件通报时发送邮件的字符编码。

通信应答的等待时间(1~999)

设置与SMTP服务器之间的通信超时时间。

主题的编码

设置是否对邮件主题进行编码。

SMTP服务器列表

显示当前设置的SMTP服务器。本版本能够设置1台SMTP服务器。

添加

添加SMTP 服务器。点击[添加]按钮后,显示SMTP的输入对话框。

删除

删除SMTP 服务器的设置时使用。

编辑

更改SMTP 服务器的设置时使用。

SMTP服务器 (255字节以内)

设置SMTP服务器的IP地址或主机名。

SMTP端口号 (1~65535)

设置SMTP服务器的端口号。

发信人邮件地址 (255字节以内)

设置邮件通报时发送邮件的发件人地址。

SMTP认证有效

设置是否进行SMTP认证。

认证方式

选择SMTP认证方式。

用户名 (255字节以内)

设置SMTP认证时使用的用户名。

密码 (255字节以内)

设置SMTP认证使用的密码。

SNMP设置

点击SNMP Trap的[设置] 按钮,在SNMP Trap中使用的 [发送地址设置]对话框会表示出来。

发送地址一览

显示设定的SNMP Trap发送地址。本版本中可设定的SNMP Trap发送地址最多为32件。

添加

添加SNMP Trap发送地址。点击[添加],显示发送地址的输入对话框。

删除

删除SNMP Trap发送地址的设置时使用。

编辑

更改SNMP Trap发送地址的设置时使用。

发送地址服务器 (255 字节以内)

设置SNMP Trap发送目的地的服务器名。

SNMP 端口号 (1-65535)

设置SNMP Trap发送目的地的端口号。

SNMP版本

设置SNMP Trap发送目的地的SNMP版本。

SNMP团体名 (255字节以内)

设置SNMP Trap发送目的地的SNMP Community名。

6.1.9. WebManager标签页

设置WebManager服务器。

使WebManager服务有效

将WebManager服务器设为有效。

  • 选中复选框
    WebManager服务器生效。
  • 未选中复选框
    WebManager服务器失效。

通信方式

  • HTTP
    与客户端的通信不使用加密。
  • HTTPS
    与客户端的通信使用加密。

可连接的客户端台数 (1~999)

设置可以连接的客户端台数。

由密码来控制连接

点击[设置],则显示[密码]对话框。

集群密码方式/OS认证方式

从下面选择登录到Cluster WebUI的方法。

  • 集群密码方式
    用设置的操作密码,参考密码进行认证的方式。
  • OS认证方式
    用OS的用户,密码进行认证的方式。

集群密码方式

  • 操作用密码

    在Cluster WebUI中设置以操作模式连接所需的密码。
    点击[更改],则显示[输入密码]对话框。
  • 参照用密码

    在Cluster WebUI中设置以只读模式连接所需的密码。
    点击[更改],则显示[输入密码]对话框。

  • 旧密码(255字节以内)

    输入更改前的密码。
    没有设置旧密码时不输入任何内容。
  • 新密码(255字节以内)

    输入新密码。
    删除密码时不输入任何内容。
  • 密码输入的确认(255字节以内)

    重新输入新密码。

OS认证方式

登录Cluster WebUI的用户必须预先在服务器中注册。此外,由于为每个组设置了集群的操作权限,因此需要在服务器上注册该组并使用户属于该组。

  • 服务器属于工作组时
    在服务器上注册用户和组。
  • 服务器属于域时
    在域上注册用户和组。

添加

在将组添加到[授权的组列表]中时使用。点击[添加],显示[组名]对话框。选中[操作权限]复选框的状态下添加新组。

  • 组名 (255 字节以内)
    输入授权的组名。向属于指定组的用户授权。
    组必须预先在服务器上注册。

删除

从[授权的组列表]中删除组时使用。
从[授权的组列表]中选择要删除的组,点击[删除]。

编辑

编辑组时使用。从[授权的组列表]中选择要编辑的组,点击[编辑]。显示输入被选中组的[组名]的对话框。编辑后的组的操作权限不变。

操作权限

设置[授权的组列表]中注册的组的操作权限。

  • 选中复选框
    属于该组的用户可以进行集群操作和状态显示。
  • 未选中复选框
    属于该组的用户只可以进行集群状态显示。

登录会话的有效时间(0~525600)

登录会话的有效时间。如果设置为0则不会过期。

自动注销时间(0~99999)

Cluster WebUI和WebManager服务器之间没有通信时,自动注销的时间。设置为0时不会自动注销。

锁定阈值(0~999)

用于锁定连续登陆失败的客户端IP地址的阈值。被锁定的客户端IP地址,在锁定期结束之前都无法登陆。设置为0时客户端IP地址不会被锁定。

锁定时间(1~99999)

锁定的客户端IP地址自动解锁之前的时间。

默认值

返回默认值时使用。点击[默认值] ,则 登录会话的有效时间自动注销时间锁定阈值锁定时间 都被设置为默认值。

通过客户端IP地址控制连接

通过客户端IP地址控制连接。

  • 选中复选框
    显示[添加],[删除],[编辑]按钮。
  • 取消选中复选框
    不显示[添加],[删除],[编辑]按钮。

添加

在[客户端IP地址限制连接列表]中添加IP地址时使用。点击[添加]按钮则显示IP地址的输入对话框。新添加有操作权的IP地址。

  • IP地址 (80字节以内)
    输入允许连接的客户端IP地址。
  • IP地址时 : 10.0.0.21
  • 网络地址时 : 10.0.1.0/24

删除

从[客户端IP地址限制连接列表]中删除IP地址时使用。从[客户端IP地址限制连接列表] 选择想要删除的IP地址,点击[删除]按钮。

编辑

编辑IP地址时使用。从[客户端IP地址限制连接列表]中选择想要编辑的IP地址,点击[编辑]按钮。显示输入选择的IP地址的IP地址输入对话框。编辑的IP地址的操作权不变。

操作权

给[客户端IP地址限制连接列表]中登录的IP地址设置操作权。

  • 选中复选框
    客户端执行EXPRESSCLUSTER X SingleServerSafe的操作和状态显示。
  • 取消选中复选框
    客户端只执行EXPRESSCLUSTER X SingleServerSafe的状态显示。

导出Cluster WebUI的操作日志

输出Cluster WebUI的操作日志。

  • 选中复选框
    输出Cluster WebUI的操作日志。
  • 不选中复选框
    不输出Cluster WebUI的操作日志。

日志输出路径 (255 字节内)

指定Cluster WebUI操作日志的输出目录。请指定绝对路径和ASCII字符。

文件大小 (1~10)

指定Cluster WebUI操作日志的大小。
当达到指定的文件大小时,将进行轮询。最多可以保存5代日志文件。

连接用IP地址

选择[设置]按钮,出现[集成WebManager用的IP地址]画面。
  • 添加
    添加集成WebManager用IP地址。点击各服务器列选择或者输入相关的IP地址。部分不能连接的服务器,服务器列不需要输入任何信息。
  • 删除
    删除通信线路。选择想要削除的通信线路列,点击[删除],删除所选择的IP地址。
  • 优先级
    当设置了多个集成WebManager用得IP地址时,优先选择[优先级]序号小的线路作为内部通信使用。点击箭头,可以更改选择行的优先等级。

调整

调整WebManager服务器时使用。点击[调整]按钮,则显示[Web管理器调整属性]对话框。
  • 客户端超时 (1~999)
    WebManager服务器无法与Cluster WebUI通信的超时时间。
  • 画面数据的更新间隔 (0~999)
    Cluster WebUI的画面数据更新的间隔。
  • 镜像Agent超时 (1~999)
    不使用。
  • 日志文件的有效期限 (60~43200)
    服务器上临时保存的日志收集信息的删除有效期限。从显示保存日志收集信息对话框开始,如果在不执行保存的状态下超过该处设置的有效期限,服务器上保存的日志收集信息将被删除。
  • 使用时刻信息显示功能
    设置时刻信息显示功能的有效/无效。
    • 复选框选中
      时刻信息显示功能有效。
    • 复选框未选中
      时刻信息显示功能无效。
  • 默认值
    返回默认值时使用。点击[默认值]则所有的项目被设为默认值。

6.1.10. API标签页

设置API服务。

启用API服务

启用API服务。

  • 选中复选框
    启用API服务。
  • 不选中复选框
    禁用API服务。

通信方式

  • HTTP
    与客户端通信时不使用加密。
  • HTTPS
    与客户端通信时使用加密。

以组为单位设置权限

为每个组设置和控制集群的搜查权限。

  • 选中复选框
    显示[添加],[删除],[编辑]。
  • 不选中复选框
    不显示[添加],[删除],[编辑]。

登录到发出请求的服务器的用户必须事先在服务器中注册。此外,由于为每个组设置了集群的操作权限,因此有必要在服务器中注册组,并且用户要属于该组。

  • 用户属于工作组时
    在发出请求的所有服务器上以相同名称注册用户和组。
  • 服务器属于域时
    在域中注册用户和组。

添加

在[授权组列表]中添加组时使用。点击[添加]显示[组名]对话框。在[操作权限]为ON的状态下添加新的组。

  • 组名 (255 字节以内)
    输入授权的组名。向属于指定组的用户授权。
    组必须预先在服务器上注册。

删除

从[授权组列表]中删除组时使用。
请从[授权组列表]中选择要删除的组,点击[删除]。

编辑

编辑组时使用。从[授权组列表]中选择要编辑的组,点击[编辑]。显示已输入选择组的[组名]对话框。已编辑的组的操作权限不会改变。

操作权限

设置[授权组列表]中注册的组的操作权限。

  • 选中复选框
    属于该组的用户可以进行集群操作和获取各种状态。
  • 不选中复选框
    属于该组的用户仅可以获取各种状态。

通过客户端IP地址控制连接

通过客户端IP地址控制连接。

  • 选中复选框
    显示[添加],[删除],[编辑]。
  • 不选中复选框
    不显示[添加],[删除],[编辑]。

添加

在[允许连接的客户端IP地址列表]中添加IP地址时使用。点击[添加]则显示输入IP地址的对话框。新添加的IP地址具有操作权限。

  • IP地址 (80 字节以内)

    输入允许连接的客户端IP地址。

    • IP地址示例: 10.0.0.21

    • 网络地址示例: 10.0.1.0/24

删除

在[允许连接的客户端IP地址列表]中删除IP地址时使用。请在[允许连接的客户端IP地址列表]中选择要删除的IP地址,点击[删除]。

编辑

编辑IP地址时使用。在[允许连接的客户端IP地址列表]中选择要编辑的IP地址,点击[编辑]。选择IP地址后,会在[IP地址]对话框中表示。

操作权

对[通过客户端IP地址控制连接]中登录的IP地址设置操作权。

  • 选中复选框
    客户端可进行集群的操作和状态显示。
  • 不选中复选框
    客户端仅能显示集群状态。

调整

调整API服务时使用。点击[调整],则显示[API调整属性]对话框。

  • 认证锁定的阈值
    设置确定对HTTP服务器的认证连续失败时锁定的次数。
  • 启动HTTP服务器的重试次数
    设置API服务启动HTTP服务器失败时的启动重试次数。
  • HTTP服务器启动间隔
    设置从API服务启动HTTP服务器失败到重试下一次启动之间的时间间隔。
  • 默认值
    返回默认值时使用。点击[默认值],所有项目都被设置为默认值。

6.1.11. 加密标签页

设置集群相关服务加密时使用的文件及库。

证书文件

设置与客户端通信时使用的服务器证书文件。服务器证书文件需要单独准备。

私钥文件

设置与客户端通信时使用的私钥文件。私钥文件需要单独准备。

SSL链接库

设置加密用的SSL链接库。请指定OpenSSL所提供的SSL链接库。请根据安装目录等环境不同而设定。

Crypto链接库

设置加密用的Crypto链接库。请指定OpenSSL所提同的Crypto链接库。请根据安装目录等环境不同而设定。

6.1.12. Alert日志标签页

设置警报日志。

使Alert服务有效

设置是否启动服务器的EXPRESSCLUSTER X SingleServerSafe Web Alert服务。

  • 选中复选框
    EXPRESSCLUSTER X SingleServerSafe Web Alert服务生效。
  • 取消选中复选框
    EXPRESSCLUSTER X SingleServerSafe Web Alert服务失效。

保存最大Alert记录数 (1~99999)

服务器的EXPRESSCLUSTER X SingleServerSafe Web Alert服务可以保存的最大警报消息数。

Alert同步:方式

不使用。

Alert同步:通信超时(1~300)

不使用。

默认值

返回默认值时使用。点击[默认值]则所有的项目被设为默认值。

6.1.13. 延迟警告标签页

设置延迟警告。关于延迟警告的详细内容,请参考"7. 监视动作的详细信息"的"监视资源延迟警告"。

心跳延迟警告 (1~99)

设置心跳延迟警告的比例。如果在此处指定的心跳超时时间的百分比内没有心跳应答,则在警报日志中显示警告。

监视延迟警告 (1~99)

设置监视延迟警告的比例。如果在此处指定的监视超时时间的百分比内没有监视器应答,则在警报日志中显示警告。

默认值

返回默认值时使用。点击[默认值]按钮则所有的项目被设为默认值。

6.1.14. 磁盘标签页

不使用。

6.1.15. 镜像磁盘标签页

不使用。

6.1.16. 账户标签页

集群系统执行的脚本等,登录/删除使用的用户账号。最大可以设置16个用户账号。

添加

在[账户列表]中添加用户账号时使用。点击[添加]则显示[输入账户]的对话框。
  • 用户名
    输入登录的用户账号名。指定域的账号时,输入格式如"域名/账号名"。
  • 密码
    输入登录的用户账号的密码。

删除

从[账户列表]中删除用户账号时使用。从[账户列表]中选择想要删除的用户账号,点击[删除]按钮。

编辑

编辑用户账号时使用。从[账户列表]选择想要编辑的用户账号,点击[编辑]按钮。显示输入了选择的用户账号的[账户输入]对话框。

6.1.17. RIP (互换) 标签页

不使用。

6.1.18. JVM监视标签页

设置JVM监视中使用的详细参数。

注解

使用Cluster WebUI的编辑模式时为了显示JVM监视标签页,在Java Resource Agent的License被登入的情况下,需要执行[更新服务器信息]。

Java安装路径 (255字节以内)

设置JVM监视中使用的Java VM的安装路径。请一定指定为绝对路径和ASCII文字。末尾不要添加"/"。设置例:C:\Program Files\Java\jdk1.8.0_102

最大Java堆大小 (7~4096)

JVM监视中使用的Java VM的最大堆大小使用兆字节来设定(相当于Java VM启动时的选项-Xmx)。

Java VM追加选项 (1024字节以内)

设置JVM监视中使用的Java VM的启动时选项。但是,-Xmx请在 [最大Java VM大小]中指定。
指定例:-XX:+UseSerialGC。

日志输出设定

点击[设置]按钮时,会显示输入日志输出设置的对话框。

资源测量设定

点击[设置]按钮时,会显示输入资源测试设置的对话框。

连接设定

点击[设置]按钮时,会显示输入连接设置的对话框。

日志输出设定

点击[设置]按钮时,会显示输入日志输出设置的对话框。

日志等级

选择JVM监视输出的日志的日志等级。

保有的世代数 (2~100)

对JVM监视输出的日志,进行保持版本数的设置。[轮循方式]中指定[时间]时,因为执行了集群挂起就重置轮循次数,所以请注意每次挂起< EXPRESSCLUSTER安装路径>\log\ha\jra 下的日志文件都会增加。

轮循方式

选择JVM监视输出的日志的Rotation方式。根据文件大小进行Rotation时,将JVM运用日志等每一个日志文件的最大容量设置为千字节(范围为200~2097151)。根据时间进行Rotation时,则将日志Rotation的开始时刻设置为"hh:mm"形式(hh:指定为0~23小时,mm:指定为0~59分),将Rotation间隔设置为小时(范围为1~8784)。

默认值

将日志等级,保持版本数和Rotataion方式设置为返回默认值。

资源测量设定[共通]

点击[设置]按钮,显示输入资源测量设定的对话框。关于JVM监视如何判断异常的构造,请参考"5. 监视资源的详细信息"。

重试次数 (1~1440)

设置JVM中的资源监测失败时资源监测的重试次数。

异常判定次数 (1~10)

当JVM中通过资源监测获得的Java VM,应用程序服务器的资源使用量连续超出客户定义的限度值时,判断为异常的设置次数。

间隔 内存使用量・动作线程数 (15~600)

设置JVM中的监测储存器使用量和工作线程数之间的间隔。

间隔 Full GC发生次数・执行时间 (15~600)

设置JVM中的监测Full GC发生次数和发生时间之间的间隔。

默认值

将重试次数,异常判断限度值和间隔的设置返回默认值。

资源测量设定[WebLogic]

点击[设置]按钮,显示输入资源测量设定的对话框。关于JVM监视如何判断异常的构造,请参考"5. 监视资源的详细信息"。

重试次数 (1~5)

设置JVM中的资源监测失败时资源监测的重试次数。

异常判定次数 (1~10)

当JVM中通过资源监测获得的Java VM,应用程序服务器的资源使用量连续超出客户定义的限度值时,判断为异常的设置次数。

间隔 请求数 (15~600)

设置JVM中的WebLogic监视中监测工作管理器和线程Poor的要求数之间的间隔。

间隔 平均值 (15~600)

设置JVM中的WebLogic监视中监测工作管理器和线程Poor的要求数平均值之间的间隔。请将此数值设置为间隔 要求数中设定数值的整数倍数。

默认值

将重试次数,异常判断限度值和间隔的设置返回默认值。

连接设定

点击[设置]按钮,显示连接监视目标的Java VM的设置输入对话框。

管理端口号 (1~65535)

设置JVM监视资源内部使用的端口号。请不要覆盖其他端口号。不推荐使用42424~61000号。

重试次数 (1~5)

设置连接监视对象的Java VM失败时的重试次数。

到再次连接为止的等待时间 (15~60)

设置连接监视对象的Java VM失败时,到下一次连接前的间隔时间。

默认值

将管理端口号,重试次数,下一次连接前的等待时间的设置返回默认值。

6.1.19. 云标签页

设置在云环境中使用的功能。

启用Amazon SNS联动功能

设置Amazon SNS联动功能。

TopicArn

设置要在Amazon SNS联动功能中使用的TopicArn。

启用Amazon CloudWatch联动功能

设置Amazon CloudWatch联动功能。

  • 选中复选框
    启用Amazon CloudWatch联动功能。
    将监视资源的监视处理时间发送到Amazon CloudWatch。
  • 不选中复选框
    禁用Amazon CloudWatch联动功能。

注解

使用Amazon CloudWatch联动功能时,必须选中[将Amazon CloudWatch联动功能设置为有效],并将对象监视资源的[监视(共通)]标签页-[发送监视处理时间度量]设置为有效。

Namespace

设置Amazon CloudWatch联动功能中使用的Namespace。

度量的发送间隔

设置将监视资源的监视处理时间发送到Amazon CloudWatch的频率。

6.1.20. 扩展标签页

设置集群的其他机能。

再启动限制

可以分别为组资源和监视器资源设置发现异常时最终运行是[Reboot OS]还是[Shut down OS]。如果进行了该设置,则可执行会一直重复重启。此时,可以通过设置重启次数限制重启重复。

  • 最大再启动次数 (0~99)
    设置重启的限制次数。此处指定的次数在组资源,监视资源中分别计算。
    在[最大重启次数]中设置0时,不限制重复重启次数。
  • 重置最大再启动次数的时间 (0~999)
    指定了最大重启次数时,如果从集群启动开始正常运行持续了此处所指定的时间,则重启次数将被重置。此处指定的时间将在组资源和监视资源中分别计算。

注解

[最大再启动次数]设置为大于等于1的数字时,[重置最大再启动次数的时间]也需要设置为大于等于1的数字。[重置最大再启动次数的时间]设置为0时,再启动次数限制为无效,不按照最大再启动次数的设置,每次发现异常时就关闭或重启。

自动复归

  • 自动复原。
  • 关闭
    不自动复原。

失效切换次数计算单位

不使用。

服务器组间失效切换的宽限时间(0~99999)

不使用。

将 OS 停止操作更改为 OS 重启操作

将所有OS停止操作更改为OS重启操作。
  • 选中复选框
    更改操作。
  • 不选中复选框
    不更改操作。
设置操作更改时,以下操作将被更改。
以下之外的操作不会更改。
  • 集群服务进程异常时的动作
    • 设置[紧急关机]时
      更改为紧急关机后重启OS。
  • 发生组资源的启动/停止失控时的动作
    • 设置[紧急关机]时
      更改为紧急关机后重启OS。
  • 组资源启动停止异常时的最终动作
    • 设置[停止集群服务和OS关机]时
      更改为停止集群服务和OS重启。
  • 监视资源异常时的最终动作
    • 设置[停止集群服务和OS关机]时
      更改为停止集群服务和OS重启。

注解

以下的监视资源不作为操作更改的对象。

  • 消息接收监视资源

  • 用户空间监视资源

禁用集群动作

  • 自动启动组
    • 选中复选框
      禁用组的自动启动。
    • 未选中复选框
      启用组的自动启动。
  • 检测到组资源的启动异常时的复归动作
    • 选中复选框
      禁用检测到组资源的启动异常时的复归动作。
    • 不选中复选框
      不禁用检测到组资源的启动异常时的复归动作。
  • 检测到组资源的停止异常时的复归动作
    • 选中复选框
      禁用检测到组资源的停止异常时的复归动作。
    • 不选中复选框
      不禁用检测到组资源的停止异常时的复归动作。
  • 监视资源异常检出时的复归动作
    • 选中复选框
      禁用监视资源查出异常时的复归动作。
    • 不选中复选框
      不禁用监视资源查出异常时的复归动作。
  • 服务器宕机时的失效切换
    • 不使用。

注解

以下操作不作为禁用监视资源查出异常时的复归动作的对象。
・在磁盘RW监视资源中检测到停止异常时的动作
・用户空间监视资源中发生超时时的动作
・消息接收监视资源的复归动作

集群统计信息

可以收集和查看组失效切换时需要的时间,资源启动处理时需要的时间等,跟集群运行相关的信息。
详细信息请参考EXPRESSCLUSTER X的《维护指南》-"维护信息" - "采集集群统计信息"。
  • 选中复选框
    收集集群统计信息。
    • 文件大小 (可设置的值因类型而异)
      指定集群统计信息的文件大小。
      达到指定的文件大小时,不进行轮循。最多可以存储两代信息。
  • 不选中复选框
    不收集集群统计信息。

注解

集群统计信息的文件大小可以设置的值如下。
  • 心跳资源:1~50 (MB)
  • 组:1~5 (MB)
  • 组资源:1~5 (MB)
  • 监视资源:1~10 (MB)

默认值

返回默认值时使用。点击[默认值]则所有项目均被设置为默认值。

6.2. 服务器属性

在服务器的属性中添加,删除,编辑构成集群的各服务器中使用的接口(IP地址或设备)。在各服务器中设置相同数量的接口(以下称I/F)。I/F编号表示在Builder中登录的顺序的编号。与OS中设置的编号无关。

  • 1台服务器内不能存在属于同一网络地址的IP地址。此外,也不能是如下所示的包含关系。

    • IP地址:10.1.1.10,子网掩码:255.255.0.0

    • IP地址:10.1.2.10,子网掩码:255.255.255.0

6.2.1. 信息标签页

进行服务器名的显示,登录注释,更改。

名称

显示服务器名。无法在此更改名称。

注释(127字节以内)

设置服务器的注释。只能输入半角英文数字。

6.2.2. 警告灯标签页

不使用。

6.2.3. HBA标签页

不使用。

6.3. 最大登录数量一览表

Version

最大登录数量

服务器

4.0.0-1以上

1

4.0.0-1以上

128

组资源
(每组)

4.0.0-1以上

512

监视资源

4.0.0-1以上

384

7. 监视动作的详细信息

7.1. 关于不间断监视和启动时监视

不间断监视是在服务器启动后,从EXPRESSCLUSTER X SingleServerSafe可以运行之际开始监视。
启动监视是指定的组启动后,该组在停止(停止)期间进行监视。
根据监视资源的不同,有固定进行的内容,也有可以选择的内容。
从服务器启动到服务器停止,不间断监视的区间和启动时监视的区间

图 7.1 监视资源的不间断监视和启动时监视

7.2. 发生/解除监视资源的模拟故障

可使监视资源发生模拟故障。此外,也可解除模拟故障。发生/解除模拟故障的方法有以下 2种。

  • 使用Cluster WebUI (验证模式)进行操作
    Cluster WebUI (验证模式)中,不能控制的监视资源的右点击菜单变为无效。
  • 使用[clpmonctrl]命令进行操作
    [clpmonctrl]命令中,对执行命令的服务器上的监视资源进行控制。如果对不能控制的监视资源执行命令时,虽然命令执行上成功,但是不能使监视资源发生模拟故障。

监视资源中含有可发生/解除模拟故障的资源和不能发生/解除模拟故障的资源。请参照《操作指南》的"EXPRESSCLUSTER X SingleServerSafe 命令参考"的"控制监视资源 (clpmonctrl命令)"。

如果在模拟故障发生状态中进行了下述的操作,则监视资源的模拟故障将被解除。

  • Cluster WebUI (验证模式)中执行监视资源的[解除模拟故障]时

  • 在Cluster WebUI的模式从[验证模式]变更为其他模式时输出的对话框中,选择 [确定]时

  • Clpmonctrl命令中指定了-n选项时

  • 停止了集群时

  • 挂起了集群时

7.3. 监视资源监视间隔机制

所有监视资源每隔固定的监视间隔时间执行监视。

下面通过时序来说明根据设置的监视间隔时间进行正常监视以及异常时对监视资源进行监视的流程。

发现监视正常执行时

设置值如下所示时的运行示例:

<监视>
监视间隔 30秒
监视超时 60秒
监视重试次数 0次
主监视进程,子监视进程以及监视间隔

图 7.2 监视间隔(发现监视正常执行时)

发现监视出现异常时(未进行监视重试设置)

发现监视异常后,在下次监视时会查出监视异常,然后对恢复对象进行重新启动。

设置值如下所示时的运行示例:

<监视>
监视间隔 30秒
监视超时 60秒
监视重试次数 0次
<发现异常>
恢复动作 重启以下的目标
复归对象 组
复归脚本执行次数 0次
最大重启动次数 0次
最终动作 无操作
主监视进程,子监视进程以及监视间隔

图 7.3 监视间隔(发现监视出现异常时 ・未进行监视重试设置)

查出监视异常时(对监视重试进行设置)

发生监视异常后,会在每次监视时发现监视异常,若在重试监视次数内无法恢复,则对恢复对象重新启动。

设置值如下所示时的运行示例:

<监视>
监视间隔 30秒
监视超时 60秒
监视重试次数 2次
<发现异常>
恢复动作 重启以下的目标
复归对象 组
复归脚本执行次数 0次
最大重启动次数 0次
最终动作 无操作
主监视进程,子监视进程以及监视间隔

图 7.4 监视间隔(查出监视异常时 ・对监视重试进行设置)

查出监视超时时(未进行监视重试设置)

发生监视超时后,会立即对针对恢复对象执行的恢复操作进行重新启动。

设置值如下所示时的运行示例:

<监视>
监视间隔 30秒
监视超时 60秒
监视重试次数 0次
<发现异常>
恢复动作 重启以下的目标
复归对象 组
复归脚本执行次数 0次
最大重启动次数 0次
最终动作 无操作
主监视进程,子监视进程以及监视间隔

图 7.5 监视间隔(查出监视超时时 ・未进行监视重试设置)

查出监视超时时(对监视重试进行了设置)

监视超时发生后,进行监视重试,对恢复对象进行重新启动。

设置值如下所示时的运行示例:

<监视>
监视间隔 30秒
监视超时 60秒
监视重试次数 1次
<发现异常>
恢复动作 重启以下的目标
复归对象 组
复归脚本执行次数 0次
最大重启动次数 0次
最终动作 无操作
主监视进程,子监视进程以及监视间隔

图 7.6 监视间隔(查出监视超时时 ・对监视重试进行了设置)

7.4. 监视资源发现异常时的操作

发现异常时对恢复对象执行的恢复操作如下所示。

  • 发现监视对象的异常后,执行复归脚本。

  • 按次数执行复归脚本后,重新启动复归对象。若设置有重新启动前执行脚本,则执行脚本后再重新启动。

  • 若发现监视对象出现异常,则重新启动恢复对象(恢复操作为[只执行最终动作]时,及[自定义设置]中重新启动界限值设置为0时不执行重新启动)。

  • 重新启动失败时,或者即使执行重新启动也发现异常时,进行最终操作。([自定义设置]中设置的重新启动次数的最大值大于2时,连指定次数都要再次进行重新启动。)

复归操作针对的复归对象必须处于以下状态。

恢复对象

状态

重新启动 4

最终运行 5

组/

已停止

No

No

组资源

正在启动/停止

No

No

已启动

Yes

Yes

异常

Yes

Yes

LocalServer

-

-

Yes

Yes:执行恢复运行 No:不执行恢复运行

4

仅在重新启动界限值设置为大于等于1的值时生效。

5

仅在最终运行设置为"无操作"之外的值时生效。

注解

在设置查出监视资源异常的情况下将恢复对象指定为组资源(例:磁盘资源,应用程序资源),而监视资源发现异常时,处于恢复操作过渡(重新启动 -> 失效切换 -> 最终运行)的状态下,请不要执行以下命令或在Cluster WebUI中执行以下操作。

  • 停止/暂停集群

  • 开始/停止/移动组

若由于监视资源出现异常而处于恢复操作过渡状态中执行上述控制操作,可执行其他组的组资源不会停止。
并且即便监视资源处于异常状态,只要执行了最终运行,也可执行上述控制操作。
当监视资源的异常状态恢复(正常)后,重新启动次数,失效切换次数以及是否执行最终运行的设置均被重置。但是,作为恢复对象,指定了组资源/失效切换组时,只有在指定了同一恢复对象的所有监视资源的状态都正常时,此计数器才会被重置。
请注意,即便恢复操作失败,重新启动恢复操作的次数以及失效切换的次数均为一次。

7.5. 监视状态由异常恢复(正常)

若发现监视异常,恢复操作过渡中或全部恢复操作结束后发现监视资源恢复,则该监视资源所保留的以下界限值的计数器被重置。但是,作为恢复对象,指定了组/组资源时,只有在指定了同一恢复对象的所有监视资源的状态都正常时,此计数器才会被重置。
最终运行的是否执行也被重置(重置为需要执行)。

7.6. 恢复操作时启动/停止恢复对象出现异常

当监视资源的监视目标与恢复对象的组资源为同一设备,发现监视异常时,可执行会在执行恢复操作过程中发生启动/停止组资源异常。

7.7. 关于复归脚本,复归操作前的脚本

可在查出监视资源异常后执行复归脚本。此外,在重新启动复归对象,执行失效切换及最终动作前,也可执行复归操作前的脚本。
任何情况下都会运行共同的脚本文件。

复归脚本,复归操作前脚本使用的环境变量

EXPRESSCLUSTER X SingleServerSafe在执行脚本时,需要在环境变量中设置脚本执行时的状态(复归操作类型)等信息。
在脚本内可以以下图中的环境变量为分支条件说明与系统操作相符的处理内容。

环境变量

环境变量的值

含义

CLP_MONITORNAME
...监视资源名
监视资源名
显示查出异常(该异常导致需要执行复归脚本,复归操作前脚本)的监视资源名称。
CLP_VERSION_FULL
...EXPRESSCLUSTER X SingleServerSafe完整版
EXPRESSCLUSTER X SingleServerSafe完整版
显示EXPRESSCLUSTER X SingleServerSafe完整版。
(例)) 13.01
CLP_VERSION_MAJOR
...EXPRESSCLUSTER X SingleServerSafe主版本
EXPRESSCLUSTER X SingleServerSafe主版本
显示EXPRESSCLUSTER X SingleServerSafe主版本。
(例)13
CLP_PATH
...EXPRESSCLUSTER X SingleServerSafe安装路径
EXPRESSCLUSTER X SingleServerSafe安装路径
显示EXPRESSCLUSTER X SingleServerSafe的安装路径。
(例) C:\Program Files\EXPRESSCLUSTER X SINGLESERVERSAFE SSS
CLP_OSNAME
...服务器OS名称

服务器OS名称

显示执行脚本的服务器OS名称。
(例)Windows Server 2016 Standard
CLP_OSVER
...服务器OS版本

服务器OS版本

显示执行脚本的服务器OS版本。
(例)6.2.0.0.274.3
CLP_ACTION
复归操作类型

RECOVERY

作为复归脚本执行时。

RESTART

重新启动前执行时。

FAILOVER

不使用。

FINALACTION

最终动作前执行时。

CLP_RECOVERYCOUNT
复归脚本的执行次数

复归脚本执行次数

显示第几次执行复归脚本。

CLP_RESTARTCOUNT
...重新启动次数

重新启动次数

显示第几次重新启动。

CLP_FAILOVERCOUNT
...失效切换次数

失效切换次数

不使用。

复归脚本,复归操作前脚本的描述流程

本节讲解了上节中说明的环境变量与实际脚本描述之间的关系。

复归脚本,复归操作前脚本的例子

rem ******************************************************
rem *                    preaction.bat                   *
rem ******************************************************

echo START

IF "%CLP_ACTION%"=="" GOTO NO_CLP

IF "%CLP_ACTION%"=="RECOVERY" GOTO RECOVERY
IF "%CLP_ACTION%"=="RESTART" GOTO RESTART
IF "%CLP_ACTION%"=="FINALACTION" GOTO FINALACTION
GOTO NO_CLP

:RECOVERY
echo RECOVERY COUNT: %CLP_RECOVERYCOUNT%

rem 在这里记述了复归处理。
rem 该处理在以下时机执行。
rem
rem  复归动作: 复归脚本

GOTO EXIT


:RESTART
echo RESTART COUNT: %CLP_RESTARTCOUNT%

rem 在这里记述了重启动前处理。
rem 该处理在以下时机执行。
rem
rem  复归动作: 重启动

GOTO EXIT


:FINALACTION
echo FINALACTION

rem 在这里记述了复归处理。
rem 该处理在以下时机执行。
rem
rem  复归动作:最终动作

GOTO EXIT

:NO_CLP

:EXIT
echo EXIT
exit

创建复归脚本,复归操作前脚本时的注意事项

创建脚本时请注意以下内容。

  • 如果要执行一些需要时间的命令,请在脚本中保留用于表示命令执行完成的跟踪信息。发生故障时,可以使用这些信息来区分故障。可使用clplogcmd保留跟踪信息。

复归脚本,复归操作前脚本的注意事项

  • 没有。

7.8. 监视资源延迟警告

监视资源由于业务应用程序的集中等原因,可执行会出现服务器负荷过大,出现监视超时的情况。发现监视超时之前,当监视的监视处理时间(实测时间)达到监视超时时间的一定比例后,可以发出警告通知。
以下用时序图对监视资源被发出延迟警告之前的过程进行说明。
指定监视超时为60秒,延迟警告是当延迟时间达到默认值的80%时发出。

该图显示了监视超时设置为60秒且延迟警告率设置为默认值的80%(48秒)的情况。 箭头表示监视轮询时间。

监视资源延迟警告之前的时间

图 7.7 监视轮询时间和延迟警告

  1. 监视处理时间为10秒,监视资源处于正常状态。
    此时不发出警告。
  2. 监视处理时间为50秒,发现监视延迟,监视资源处于正常状态。
    此时,由于延迟时间超过默认监视超时时间的80%,所以发出警告通知。
  3. 监视处理时间超过监视超时时间,即60秒,发生监视超时,监视资源处于异常状态。
    此时不发出警告。

参见

监视资源的延迟警告是在[Cluster属性]->[延迟警告]标签页中的[监视延迟警告]中进行设置。

7.9. 等待开始监视监视资源

等待开始监视时间是指从指定监视的等待监视开始时间开始。
以下将使用时序对等待监视开始时间设置为0秒的情况和指定为30秒的情况下进行监视的区别进行说明。

[监视资源配置]

<监视>
间隔 30秒
超时 60秒
重试次数 0次
开始监视的等待时间 0秒
每个监视开始等待时间的行为差异

图 7.8 监视资源的监视开始等待(监视开始等待时间0秒)

[监视资源配置]

<监视>
间隔 30秒
超时 60秒
重试次数 0次
开始监视的等待时间 30秒
每个监视开始等待时间的行为差异

图 7.9 监视资源的监视开始等待(监视开始等待时间30秒)

注解

使用监视控制命令,临时停止/重新启动监视资源时也是在指定的等待监视开始时间后进行。

应用程序监视资源监视的应用程序资源可执行会由于应用程序设置错误导致开始监视后立即退出,等待监视开始时间就是用于此类重新启动也无法恢复的情况。
例如下列情况中,若将等待监视开始时间设置为0,可执行会出现无限重复执行恢复操作的情况。

[应用程序监视资源配置]

<监视>
间隔 5秒
超时 60秒
重试次数 0次
开始监视的等待时间 0秒(默认值)
<发现异常>
恢复动作 重启以下的目标
复归对象 appli1
最终动作 停止组
应用程序资源,应用程序监视资源,应用程序动作转换

图 7.10 监视资源的监视开始等待(监视开始等待时间0秒)

该恢复操作无限重复进行的原因是由于第一次监视处理正常结束。当监视资源处于正常状态时,监视资源恢复操作的当前次数被重置。因此,当前次数总被重置为0,重新启动的恢复操作就会无限重复进行。
通过设置等待监视开始时间,可以避免以上现象的发生。
等待监视开始时间设置在应用程序启动后,结束时间默认设置为60秒。

[应用程序监视资源配置]

<监视>
间隔 5秒
超时 60秒
重试次数 0次
开始监视的等待时间 60秒
<发现异常>
恢复动作 重启以下的目标
复归对象 appli1
最终动作 停止组
应用程序资源,应用程序监视资源,应用程序动作转换

图 7.11 监视资源的监视开始等待(监视开始等待时间60秒)

7.10. 监视资源发现异常时的重启次数的限制

监视资源发现异常时的最终运行设置若为[停止集群服务并关闭操作系统]或[停止集群服务并操作系统重启],可设置由于监视资源出现异常而产生的关闭次数或重启次数。
使用clpregctrl命令重置重启次数。关于clpregctrl命令的详细信息,请参考《操作指南》的"EXPRESSCLUSTER X SingleServerSafe 命令参考"。

注解

启动,停止组出现异常时的最终运行引起的重启次数以及监视资源出现异常时的最终运行引起的重启次数也是分别记录的。

若将重置最大重启次数的时间设置为0,则不会重置重启次数。

8. 注意限制事项

在本章中对注意事项,现有问题及其避免方法进行说明。

本章中说明的项目如下。

8.1. 研究系统配置时

对HW的准备,系统配置需要留意的事项进行说明。

8.1.1. 关于EXPRESSCLUSTER X SingleServerSafe X Alert Service

EXPRESSCLUSTER X SingleServerSafe X Alert Service 的License可以使用邮件通报功能,但不能使用警报灯通报功能。

8.1.2. 关于JVM监视资源

  • 可同时进行监视的Java VM最多是25个。可同时监视的Java VM指,通过Cluster WebUI ([监视(固有)]标签-[识别名])可进行唯一识别的Java VM的数量。

  • Java VM和JVM监视资源之间的连接不支持SSL。

  • 对Java VM进行监视时,如果存在与监视对象的名称一样的其他进程时,可执行对不同的监视对象进行C堆监视。

  • 有时可执行不能检测出线程死锁。这是已经确认的来自JavaVM的缺陷。详细内容请参考Oracle的Bug Database的"Bug ID: 6380127 "。

  • JVM监视资源可监视的Java VM需与JVM监视器资源工作时的服务器在同一服务器内。

  • x86_64版OS上运行IA32版的监视对象的应用程序时,不能进行监视。

  • 如果将通过Cluster WebUI ([集群的属性]-[JVM监视]标签-[最大Java堆大小])设置的最大Java堆大小值设置为3000等大数值,则JVM监视资源会启动失败。由于依赖于系统环境,请根据系统的内存搭载容量来决定。

  • 在监视对象Java VM的启动选项中附加「-XX:+UseG1GC」时,Java 7以前版本不能监视JVM监视资源的[属性]-[监视(固有)]标签页-[调整]属性-[内存]标签页内的设置项目。
    Java 8以上版本可以通过在JVM监视资源的[属性]-[监视(固有)] 标签页-[JVM类型]中选择[Oracle Java(usage monitoring)],可以进行监视。

8.2. 创建EXPRESSCLUSTER X SingleServerSafe的配置信息时

在设计和创建EXPRESSCLUSTER X SingleServerSafe的配置信息前,需要根据系统的配置确认并留意以下事项。

8.2.1. 有关安装路径下的文件夹和文件

除了EXPRESSCLUSTER X SingleServerSafe本身外,请不要对安装路径下的目录或文件进行操作(编辑/创建/添加/删除等)。
EXPRESSCLUSTER X SingleServerSafe以外对目录或文件进行操作时的影响不在售后支持范围内。

8.2.2. 组资源停止异常时的最终运行

查出停止异常时的最终运行如选择了"无操作",则组不会在停止失败的状态下停止。
请注意在实际的业务中使用时不要设置为"无操作"。

8.2.3. 延迟警告比例

将延迟警告比例设置为0或者100,可进行以下操作。

  • 延迟警告比例设置为0时
    对每一监视以Alert通告延迟警告。
    使用该功能可计算出服务器在高负荷状态下对监视资源的轮询时间,确定监视资源的监视超时时间。
  • 延迟警告比例设置为100时
    不通告延迟警告。

除了测试外,请不要设置0%等低数值。

8.2.4. 关于能用于脚本注释等的两字节系字符编码

  • 在EXPRESSCLUSTER X SingleServerSafe中,Windows环境下编辑的脚本作为Shift-JIS使用,而Linux环境下编辑的脚本则作为EUC使用。如使用其他字符编码,可执行因环境不同而出现乱码的情况。

8.2.5. 关于JVM监视器的设定

  • 监视目标为WebLogic时,对于JVM监视器资源的设定值,由于系统环境(内存搭载量等)的原因,设定范围的上限值可执行会受到限制。

    • [监视Work Manager的要求]-[要求数]

    • [监视Work Manager的要求]-[平均值]

    • [监视线程Pool的要求]-[待机要求 要求数]

    • [监视线程Pool的要求]-[待机要求 平均值]

    • [监视线程Pool的要求]-[执行要求 要求数]

    • [监视线程Pool的要求]-[执行要求 平均值]

  • 要使用Java Resource Agent,请安装在《安装指南》- "关于EXPRESSCLUSTER X SingleServerSafe" - "确认EXPRESSCLUSTER X SingleServerSafe的运行环境" - "JVM监视器的运行环境"中记载的JRE(Java Runtime Environment),或者请安装JDK(Java Development Kit)。可与使用监视对象(WebLogic Server或WebOTX)的JRE或JDK在相同的项目中使用,也可使用在其他项目。如果一个服务器中同时安装了JRE和JDK,则使用其中任何一个即可。

  • 监视资源名中不要含空白字符。

8.2.6. 关于系统监视的设置

  • 资源监视的查出模式
    System Resource Agent中结合「阀值」和「监视持续时间」两个参数进行资源监视的查出。
    继续收集各系统资源(内存使用量,CPU 使用率,虚拟内存使用量),如果在一定时间(指定为持续时间的时间)内超过阀值时就会进行异常的查出。

8.2.7. 关于Windows Server 2012 以上的系统中服务失败时的恢复操作

在基于Windows Server 2012以上的系统下,将服务失败(异常结束)时所进行的恢复操作设置为[重新启动计算机]时,实际上服务失败时的操作从原来的(Windows Server 2008以前)的OS重启,更改为伴随STOP错误的OS重启。

作为恢复操作,按照默认值[重新启动计算机]所设置的EXPRESSCLUSTER的服务如下所示。

  • EXPRESSCLUSTER Disk Agent服务

  • EXPRESSCLUSTER Server服务

  • EXPRESSCLUSTER Transaction服务

8.3. 更改ExpressCluster X SingleServerSafe的配置时

开始集群运行后如果对配置进行变更时,需要对发生的事项留意。

8.3.1. 关于资源属性的依存关系

资源依存关系变化时,根据集群挂起,恢复,反映变化。
作为资源依赖关系和反映方法,资源停止做必要的设置时,恢复后的资源启动状态存在没有考虑依存关系的情况。
下一次组启动时会正常执行对依存关系的控制。

8.3.2. 关于消息接收监视资源的集群统计信息的设置

在更改监视资源的集群统计信息设置时,即使执行了挂起·复原,也无法在消息接收监视资源中反映集群统计信息的设置。如果要在消息接收资源中也反映集群统计信息,请重启操作系统。

8.3.3. 关于端口号的更改

启用服务器的防火墙,更改端口号时需要更改防火墙的设置。使用clpfwctrl命令可以进行防火墙的设置。详细内容请参考《操作指南》的"EXPRESSCLUSTER X SingleServerSafe命令参考"的"添加防火墙的规则(clpfwctrl命令)"。