1. 前言¶
1.1. 读者对象及用途¶
《EXPRESSCLUSTER ® X SingleServerSafe 设置指南》,面向导入集群系统的系统工程师以及导入系统后进行维护/操作的系统管理员,说明EXPRESSCLUSTER X SingleServerSafe构建工作的步骤。
1.2. 本手册的构成¶
1.3. 本手册记述的术语¶
- 集群,集群系统
导入了EXPRESSCLUSTER X SingleServerSafe的单一服务器系统
- 集群关闭/重启
导入了EXPRESSCLUSTER X SingleServerSafe的系统的关闭/重启
- 集群资源
EXPRESSCLUSTER X SingleServerSafe所使用的资源
- 集群对象
EXPRESSCLUSTER X SingleServerSafe所使用的各种资源的对象
- 失效切换组
汇集了EXPRESSCLUSTER X SingleServerSafe所使用的组资源(应用程序,服务等)的组
1.4. EXPRESSCLUSTER X SingleServerSafe手册体系¶
EXPRESSCLUSTER X SingleServerSafe的手册分为以下 4 类。各指南的标题和用途如下所示。
《EXPRESSCLUSTER X SingleServerSafe安装指南》(Install Guide)
本手册的读者对象为导入使用了EXPRESSCLUSTER X SingleServerSafe的集群系统的系统工程师,对EXPRESSCLUSTER X SingleServerSafe的安装设置步骤进行说明。
《EXPRESSCLUSTER X SingleServerSafe 设置指南》(Configration Guide)
本手册的读者对象为导入使用EXPRESSCLUSTER X SingleServerSafe的集群系统的系统工程师以及导入系统后进行维护和操作的系统管理员,对EXPRESSCLUSTER X SingleServerSafe的构建工作进行说明。
《EXPRESSCLUSTER X SingleServerSafe操作指南》(Operation Guide)
本手册的读者对象为使用EXPRESSCLUSTER X SingleServerSafe导入后的进行维护和操作的系统管理员,对EXPRESSCLUSTER X SingleServerSafe的操作方法进行说明。
《EXPRESSCLUSTER X SingleServerSafe兼容功能指南》(Legacy Feature Guide)
本手册的读者对象为导入使用EXPRESSCLUSTER X SingleServerSafe系统的系统工程师,对EXPRESSCLUSTER X SingleServerSafe 4.0 WebManager以及Builder进行了说明。
1.5. 本手册的标记规则¶
在本手册中,需要注意的事项,重要的事项以及相关信息等用如下方法标记。
注解
表示虽然比较重要,但是并不会引起数据损失或系统以及机器损伤的信息。
重要
表示为避免数据损失和系统,机器损坏所必需的信息。
参见
表示参考信息的位置。
另外,在本手册中使用以下标记法。
标记 |
使用方法 |
例 |
---|---|---|
[ ]方括号
|
在命令名的前后,
显示在画面中的字句 (对话框,菜单等) 的前后。
|
点击[启动]。
[详细信息]对话框
|
命令行中的[ ]方括号 |
表示括号内的值可以不予指定(可省)。 |
|
等宽字体 |
路径名,命令行,系统输出(消息,提示等),目录,文件名,函数,参数 |
|
粗体
|
表示用户在命令提示符后实际输入的值。
|
输入以下内容。
clpcl -s -a
|
斜体 |
用户将其替换为有效值后输入的项目。
|
|
2. 关于EXPRESSCLUSTER X SingleServerSafe¶
本章中对EXPRESSCLUSTER X SingleServerSafe的功能概要,及可以监视的故障进行了说明。
本章中介绍的内容如下。
2.1. 何谓EXPRESSCLUSTER X SingleServerSafe¶
EXPRESSCLUSTER X SingleServerSafe为可安装到服务器上,来查出服务器上的应用程序及硬件的故障,并可在发生故障时,通过自动重新启动应用程序及服务器,来提高服务器的可用性的产品。
在EXPRESSCLUSTER X SingleServerSafe中,通过指定希望查出异常的应用程序及硬件,自动查出故障,通过自动重新启动应用程序及服务器,进行故障的恢复动作。
2.2. EXPRESSCLUSTER X SingleServerSafe的故障监视原理¶
在EXPRESSCLUSTER X SingleServerSafe中通过执行各种监视,可以迅速确切地查出故障。以下介绍这些监视的详细内容。
- 应用程序的生存状态监视能够使用启动资源(称为应用程序资源,服务资源)启动应用程序,通过监视用资源 (称为应用程序监视资源,服务监视资源) 定期监视进程的生存。在由于业务应用程序异常退出造成业务中断时有效。
注解
如果EXPRESSCLUSTER X SingleServerSafe直接启动的应用程序为启动,结束监视对象的常驻进程的应用程序,则无法查出常驻进程的异常。
无法查出应用程序内部状态的异常 (应用程序的停止,结果异常) 。
- 资源的监视通过EXPRESSCLUSTER X SingleServerSafe 的监视资源能够监视各种资源(应用程序,服务等)和LAN的状态。在由于必须资源异常造成业务中断时有效。
3. 创建配置信息¶
在EXPRESSCLUSTER X SingleServerSafe中,记述配置内容的数据称为配置信息。使用Cluster WebUI创建配置信息。在本章中,说明了根据Cluster WebUI的启动方法及创建配置信息的步骤为示例的配置示例。
本章中介绍的内容如下。
3.1. 确认设置值¶
在使用Cluster WebUI实际创建配置信息之前,需要确认配置信息的设置值。写出值,确认信息有无遗漏。
3.1.1. 环境的示例¶
以下记载了配置信息的样例值。以下逐一说明在此条件下创建配置信息的步骤。实际设置值时,请换成构筑的配置信息后输入。关于取值方法,请参考"4. 组资源的详细信息"和"5. 监视资源的详细信息"。
配置设置示例
设置对象 |
设置参数 |
设置值 |
---|---|---|
服务器的信息 |
服务器名 |
server1 |
系统驱动器 |
C: |
|
组 |
类型 |
失效切换 |
组名 |
failover1 |
|
启动服务器 |
server1 |
|
第1个组资源 |
类型 |
应用程序资源 |
组资源名 |
appli1 |
|
常驻类型 |
常驻 |
|
开始路径 |
执行文件的路径 |
|
第1个监视资源 |
类型 |
用户空间监视 |
监视资源名 |
userw |
|
使用心跳的间隔/超时 |
使用 |
|
监视方法 |
keepalive |
|
发生超时时的动作 |
发生有意图地停止错误 |
|
新建模拟线程 |
新建 |
|
第2个监视资源 |
类型 |
IP监视 |
监视资源名 |
ipw1 |
|
监视 IP地址 |
192.168.0.254(网关) |
|
恢复对象 |
server1(服务器名) |
|
重新启动界限值 |
- |
|
最终动作 |
停止集群服务和重启OS |
|
第3个监视资源 |
类型 |
应用程序监视 |
监视资源名 |
appliw1 |
|
对象资源 |
appli1 |
|
恢复对象 |
failover1 |
|
重新启动界限值 |
3 |
|
最终动作 |
停止集群服务和重启OS |
注解
第1个监视资源的[用户空间监视]会自动设置。反映出服务器设置时的系统驱动器信息。
3.2. 启动Cluster WebUI¶
创建配置信息时,必须访问Cluster WebUI。在此,首先说明Cluster WebUI的概要,之后,访问Cluster WebUI,对创建配置信息的方法进行说明。
3.2.2. 启动Cluster WebUI¶
Cluster WebUI的启动步骤如下所示。
- 启动Web浏览器。在浏览器的地址栏中输入安装了EXPRESSCLUSTER X SingleServerSafe的服务器的IP地址和端口号。
http://ip-address:port/
- ip-address
指定安装了EXPRESSCLUSTER X SingleServerSafe的服务器的IP地址。如是自身服务器,则localhost就可以了。
- port
指定与安装时指定的WebManager的端口号相同的编号(默认值29003)。
启动Cluster WebUI。
从工具栏的下拉菜单中选择[编辑模式],切换为编辑模式。
3.3. 创建配置信息的步骤¶
创建配置信息分为设置服务器,创建组,创建监视资源的3个阶段。新建配置信息时,可使用生成向导。其步骤流程如下所示。
注解
创建的集群配置信息只能在使用名称更改功能或属性显示功能后进行更改。
-
设置运行EXPRESSCLUSTER X SingleServerSafe的服务器。
-
创建组。通过组控制应用程序的启动及结束。创建所需数量的组。通常需要创建的数量应与想要控制的应用程序数量相当,但在使用[脚本资源]时,也能用1个组控制多个应用程序。
- 添加启动和结束应用程序的资源。
-
监视被指定的监视对象,添加监视资源。创建希望监视的数。
- 添加进行监视的监视资源。
3.3.1. 服务器的设置¶
设置服务器。
3.3.1.1. 设置服务器¶
在安装了EXPRESSCLUSTER X SingleServerSafe之后,可通过重新启动OS来自动创建。Cluster WebUI的操作模式切换至编辑模式画面后,可显示出已经创建的信息。
画面如下所示。
3.3.2. 组的设置¶
3.3.2.1. 添加组¶
设置组。
点击[组]的[添加组]。
打开[组定义]画面。
请从以下类型中选择。
类型
- 失效切换通常选择此类型。
- 虚拟机使用虚拟机资源时选择此类型。在[名称]框中输入组名(failover1),然后点击[下一步]。
- 确认是否选中[所有服务器都可以失效切换] 的复选框,然后点击[下一步]。
设置组的各属性值的画面。直接点击 [下一步]。显示[组资源定义列表]。
3.3.2.2. 添加组资源 (应用程序资源)¶
启动/结束应用程序,添加应用程序资源。
[组资源列表] 中点击[添加]。
打开[组资源定义| failover1]对话框。在[类型]框中选择组资源的类型(应用程序资源),在[名称]框中输入组资源名(appli1)。然后,点击[下一步]。
会显示出依赖关系设置的页面。不作出任何指定,点击[下一步]。
会显示出[查出启动异常时的恢复动作],[查出停止异常时的恢复动作]。点击[下一步]。
在[常驻类型]中选择[常驻]。此外,在[起始路径]中指定执行文件的路径。点击[完成]。
注解
在[起始路径]及[结束路径]中设置可执行文件名的绝对路径,或环境变量中设置的路径完整的可执行文件名。不要指定相对路径。指定相对路径时,应用程序资源的启动可执行会失败。
- 点击[完成]。应用程序资源即被添加到[组资源列表]中。
点击[完成]。
3.3.3. 3. 创建监视资源¶
添加监视指定对象的监视资源。
3.3.3.1. 添加监视资源 (IP 监视资源)¶
点击[监视]的[添加监视资源]。会显示出[监视资源的定义]。
在[类型]框中选择监视资源的类型(IP监视),在[名称]框中输入监视资源名(ipw1)。点击[下一步]。
注解
监视资源显示在[类型]框中,请选择要监视的资源。没有安装可选产品的License时,对应License的资源及监视资源就不能显示在Cluster WebUI的列表中。如果已安装License但没有显示时,请点击[获取License信息]来取得License信息。输入监视设置。在此,保持默认值不变,点击[下一步]。
显示[IP地址列表]。点击[添加]。
在[IP地址列表]设置中输入IP地址(192.168.0.254)。点击[确定]。
注解
可在IP监视资源的监视对象中指定在LAN上不间断运行为前提的设备(例如网关)的IP地址。
所输入的IP地址被设置到[IP地址列表]。点击[下一步]。
设置复归对象,点击[参照]。
在所表示的树形图中点击[failover1] ,再点击[确定]。[复归对象]中选择[failover1]。
- 点击[完成]。设置后的画面如下。
3.4. 保存配置信息¶
在Cluster WebUI的编辑模式中点击[导出配置文件]。
选择保存地址,保存。
注解
被保存的是1个文件(clp.conf)和1个目录(scripts)。如果这些文件和目录不齐备,则不能成功生成集群,因此移动时请务必将它们作为一个整体进行移动。另外,更改了新建的配置信息时,除上述2点外,还会再创建一个clp.conf.bak。
注解
安装EXPRESSCLUSTER X SingleServerSafe时,如果在[通信端口号设置]画面中指定了和默认值不同的端口号,则保存集群配置信息前,请在[集群属性]-[端口号]标签页中将[WebManager HTTP端口号]设置为和安装时相同的值。
3.5. 反映配置信息¶
在Cluster WebUI的编辑模式中点击[应用配置文件]。
- 根据上传前后配置信息的差异,弹出窗口中将显示所需操作的确认消息。若操作内容没有问题,点击[确定]。上传成功后,显示"修改已经被成功反映。"的消息。点击[确认]。若上传失败,则请按照显示的消息进行操作。
- Cluster WebUI上显示状态。Cluster WebUI的操作和确认方法,可以参考在线手册。点击画面右上的[ ]打开在线手册。
4. 组资源的详细信息¶
在本章中对组资源进行详细说明。
为提高与集群链接软件EXPRESSCLUSTER X的操作性等方面的兼容性,EXPRESSCLUSTER X SingleServerSafe 使用了相同的画面。
本章说明的项目如下。
4.1. 组资源一览¶
当前所支持的组资源如下所示。
组资源名 |
功能 |
简称 |
---|---|---|
应用程序资源 |
提供启动/停止应用程序(包括用户制作的应用程序)的架构。 |
appli |
脚本资源 |
提供启动/停止用户制作脚本等的脚本(BAT)的架构。 |
script |
服务资源 |
提供启动/停止数据库及Web等的服务的架构。 |
service |
虚拟机资源 |
进行虚拟机的启动,停止。 |
vm |
4.1.1. 虚拟机资源的运行环境¶
已确认虚拟机资源运行的虚拟基础架构的版本信息如下所示。
虚拟化基础架构 |
版本 |
备注 |
---|---|---|
Hyper-V |
Windows Server 2012 Hyper-V
Windows Server 2012 R2 Hyper-V
|
注解
虚拟机资源在Windows Server 2016上不能动作。
4.2. 设置应用程序资源的详细信息¶
通过EXPRESSCLUSTER X SingleServerSafe进行管理,可以登录组启动时,结束时执行的应用程序。应用程序资源中也可以登录用户独有的应用程序等。
应用程序指文件的扩展名为exe/cmd/bat等文件时,可通过命令行等执行的应用程序。
4.2.1. 详细标签页¶
常驻类型(默认值:常驻)
设置应用程序的类型。从下面2者中选择。
常驻应用程序常驻时选择此项。 非常驻应用程序非常驻时 (执行后处理立即返回) 选择此项。
起始路径T (1023字节以内)
设置应用程序资源开始时可执行的文件的名称。
停止路径 (1023字节以内)
设置应用程序资源结束时可执行的文件的名称。常驻类型为常驻时执行以下的操作。
没有指定停止路径时在停止时,进行EXPRESSCLUSTER所启动的应用程序的结束处理。 指定停止路径时在停止时,通过执行停止路径所指定的应用程序,进行所启动的应用程序的结束处理。注解
[起始路径]以及[停止路径]中设置可执行文件名的绝对路径,或者由环境变量设置的路径畅通的可执行文件名。请不要指定相对路径。指定了相对路径时,应用程序资源的启动可执行会失败时。
调整
显示[应用程序资源的调整属性]对话框。进行应用程序资源的高级设置。
应用程序资源调整属性
参数标签页
显示参数相关的详细设置。同步 (启动)
常驻型应用程序时,忽略本设置。非常驻型应用程序时,当应用程序执行时等待其结束。异步 (启动)
常驻型应用程序时,忽略本设置。非常驻型应用程序时,当应用程序执行时不等待其结束。正常返回值 (启动) (1023字节以内)
选择了"异步"时,输入栏不能进行输入。常驻类型是非常驻的场合,在起始路径中设定的应用程序的"正常返回值"的输入规则如下。
没有值时忽略返回值。 有值时请遵守以下输入规则。
像0,2,3那样使用逗号进行分隔
像0-3那样使用连字号指定
注解
可执行文件是批处理文件的场合,启动批处理文件的加载程序cmd.exe如果发生错误,其返回值是"1"。如果正常的返回值也设置为"1",则无法区分该错误。
同步 (停止)
常驻型应用程序时,没有指定停止路径时,等待所启动的应用程序结束。指定停止路径时,等待停止路径所指定的应用程序结束。非常驻型应用程序时,应用程序执行时等待其结束。异步 (停止)
常驻型应用程序时,不等待所启动的应用程序结束或停止路径所指定的应用程序结束。非常驻型应用程序时,应用程序执行时不等待其结束。正常返回值 (停止)(1023字节以内)
选择了"异步"时,输入栏不能进行输入。常驻类型是非常驻的场合,在停止路径中设定的应用程序的"正常返回值"的输入规则如下。
没有值时忽略返回值。 有值时请遵守以下输入规则。
像0,2,3那样使用逗号进行分隔
像0-3那样使用连字号指定
注解
可执行文件是批处理文件的场合,启动批处理文件的加载程序cmd.exe如果发生错误,其返回值是"1"。如果正常的返回值也设置为"1",则无法区分该错误。
超时 (启动) (1~9999)
常驻型应用程序时,忽略本设置。非常驻型应用程序时,设置应用程序执行时等待其结束的情况下([同步])的超时时间。只有选择了[同步]时可以输入。如果在设置的时间内应用程序没有结束,则判断为异常。超时 (停止) (1~9999)
常驻型应用程序时,设置等待所启动的应用程序结束或停止路径所指定的应用程序结束([同步])的超时时间。非常驻型应用程序时,设置应用程序执行时等待其结束([同步])的超时时间。仅选择[同步]时可以输入。如果在设置的时间内应用程序没有结束,则判断为异常。对象VCOM资源名
不使用。
允许桌面对话
设置执行的应用程序可否与桌面进行交互。如可交互,则执行应用程序就会在桌面上显示应用程序的画面。
退出时强制结束应用程序
设置作为停止时的结束处理是否强制结束应用程序。设置为是时,不进行普通的结束处理而强制结束应用程序。仅在常驻类型设为「常驻」,并且没有指定停止路径时有效。
执行用户
指定执行应用程序的用户。执行用户可以从已在[集群属性]的[账户]标签页注册的用户中选择。当指定"个别指定"时,将使用开始标签页/结束标签页中执行用户的设置。当指定"个别指定"之外时,不使用开始标签页/结束标签页的设置,而是使用以本参数指定的执行用户的设置。默认值
按[默认值]按钮,所有项目内容均被设为默认值。
开始标签页,停止标签页 通用
显示关于开始/结束的详细设置。当前目录 (1023字节以内)
设置执行应用程序时的目录。
选项参数 (1023字节以内)
为应用程序设置输入的参数。如果有多个参数,设置以空格隔开。如果输入的参数中带有空格,则用双引号("")将参数括起来。
例:"param 1" param2
窗口大小
从下面各项中选择执行应用程序时的窗口大小。
[隐藏]不显示应用程序。 [普通]以正常的窗口显示应用程序。 [最大化]以最大化窗口显示应用程序。 [最小化]以最小化窗口显示应用程序。执行用户 域
指定执行应用程序的用户账号所属的域。[结束]标签页时,无需停止/重启组。执行用户 帐户
执行用户 密码
指定执行应用程序的用户账号的密码。[结束]标签页时,无需停止/重启组。从命令窗口执行
设置是否从命令行(cmd.exe)执行应用程序。执行文件的扩展名为exe/cmd/bat以外的应用程序(JavaScript或VBScript等)时指定此项。
默认值
点击[默认值]按钮,所有项目内容均被设为默认值。
4.3. 设置脚本资源¶
组A开始脚本:start.bat之例
rem ************************************************************** rem * START.BAT * rem ************************************************************** rem 参考脚本执行要因的环境变量分配处理。 IF "%CLP_EVENT%"=="START" GOTO NORMAL IF "%CLP_EVENT%"=="FAILOVER" GOTO FAILOVER IF "%CLP_EVENT%"=="RECOVER" GOTO RECOVER rem 不运行EXPRESSCLUSTER GOTO no_arm :NORMAL IF "%CLP_DISK%"=="FAILURE" GOTO ERROR_DISK rem 在此记述业务的正常启动处理。 rem 该处理在以下时机执行。 rem rem 正常启动 rem rem 参考执行服务器环境变量来分配处理。 IF "%CLP_SERVER%"=="OTHER" GOTO ON_OTHER1 rem 仅当在主服务器上正常启动业务时 rem 记述要进行的处理。 rem 该处理在以下时机执行。 rem rem 正常启动 rem GOTO EXIT :ON_OTHER1 rem 仅当在主服务器以外的其他服务器上正常启动业务时 rem 记述要进行的处理。 rem rem SingleServerSafe中不执行该处理。 rem GOTO EXIT :FAILOVER rem 参考DISK连接信息环境变量来进行错误处理。 IF "%CLP_DISK%"=="FAILURE" GOTO ERROR_DISK rem 记述业务的启动处理。 rem rem SingleServerSafe中不执行该处理。 rem rem 参考执行服务器环境变量来分配处理。 IF "%CLP_SERVER%"=="OTHER" GOTO ON_OTHER2 rem 仅当在主服务器上正常启动业务时 rem 记述要进行的处理。 rem rem SingleServerSafe中不执行该处理。 rem GOTO EXIT :ON_OTHER2 rem 仅当在主服务器以外的其他服务器上正常启动业务时 rem 记述要进行的处理。 rem rem SingleServerSafe中不执行该处理。 rem GOTO EXIT :RECOVER rem 记述了集群复归后的恢复处理。 rem 该处理在以下时机执行。 rem rem 集群复归 rem GOTO EXIT :ERROR_DISK rem 记述磁盘相关错误处理。 :no_arm :EXIT exit
组A结束脚本:stop.bat之例
rem ************************************************************** rem * STOP.BAT * rem ************************************************************** rem 参考脚本执行要因的环境变量来分配处理。 IF "%CLP_EVENT%"=="START" GOTO NORMAL IF "%CLP_EVENT%"=="FAILOVER" GOTO FAILOVER rem 不运行EXPRESSCLUSTER GOTO NO_ARM :NORMAL rem 参考DISK连接信息环境变量来进行错误处理。 IF "%CLP_DISK%"=="FAILURE" GOTO ERROR_DISK rem 在此记述业务正常结束处理。 rem 该处理在以下时机执行。 rem rem 正常关机 rem rem 参考执行服务器环境变量来分配处理。 IF "%CLP_SERVER%"=="OTHER" GOTO ON_OTHER1 rem 在此记述仅在主服务器中正常处理业务时 rem 要进行的处理。 rem 该处理在以下时机执行。 rem rem 正常关机 rem GOTO EXIT :ON_OTHER1 rem 在此记述仅在主服务器以外的其他服务器中正常结束业务时 rem 要进行的处理。 rem rem SingleServerSafe中不执行该处理。 rem GOTO EXIT :FAILOVER rem 参考DISK连接信息环境变量来进行错误处理。 IF "%CLP_DISK%"=="FAILURE" GOTO ERROR_DISK rem 记述失效切换后的正常结束处理。 rem rem SingleServerSafe中不执行该处理。 rem rem 参考执行服务器环境变量来分配处理。 IF "%CLP_SERVER%"=="OTHER" GOTO ON_OTHER2 rem 记述失效切换后,仅在主服务器中结束业务时 rem 要进行的处理。 rem rem SingleServerSafe中不执行该处理。 rem GOTO EXIT :ON_OTHER2 rem 记述失效切换后,仅在非主服务器中结束业务时 rem 要进行的处理。 rem rem SingleServerSafe中不执行该处理。 rem GOTO EXIT :ERROR_DISK rem 记述磁盘相关的错误处理。 :NO_ARM :EXIT exit
4.3.1. 创建脚本的提示¶
通过[clplogcmd]命令可在Alert日志中输出消息。在创建脚本时请灵活运用。
4.3.2. 关于脚本资源的注意事项¶
在开始/结束脚本中使用start命令时,通过start命令启动脚本侧请使用exit命令结束处理。
4.3.3. 详细标签页¶
在[脚本列表]中显示现有脚本文件名[start.bat],[stop.bat]。
添加
显示脚本的添加对话框。添加[start.bat],[stop.bat]以外的脚本。
请不要在要添加的脚本的文件名中使用2字节字符。请不要在要添加的脚本的文件名中使用"&(ampersand)"和" =(等号)"。删除
删除脚本。无法删除[start.bat],[stop.bat]。
表示
显示所选的脚本文件。无法显示那些正在显示或者正在编辑的脚本文件。
编辑
可以编辑所选的脚本文件。要反映更改内容,请点击[保存]。不能更改脚本文件名。
替换
显示文件选择对话框。
注解
即使在Cluster WebUI上执行[删除]删除脚本文件,也无法删除实际文件。删除脚本文件后,重启Cluster WebUI重新读入配置信息,则删除的脚本文件将显示在[脚本列表]中。
在[资源属性]中选择的脚本文件内容将被替换为文件选择对话框中选择的脚本文件内容。脚本正在显示或者正在编辑时无法替换。请在此处选择脚本文件。请勿选择二进制文件(应用程序等)。
调整
显示[脚本资源属性调优]对话框。进行脚本资源的详细设置。
脚本资源调整属性
参数标签页
显示参数相关的详细信息。
[开始],[停止]所有脚本通用
同步
脚本执行时等待脚本结束。
异步
无法选择。
正常返回值(1023字节以内)
设定脚本的返回值的正确和错误的情况。
没有值时忽略返回值。 有值时请遵守以下输入规则。
像0,2,3那样使用逗号进行分隔
像0-3那样使用连字号指定
注解
设定正常的返回值时,开始和停止请设定相同的值。当使用cmd.exe执行脚本,如果发生错误时,其返回值是"1"。如果正常的返回值也设置为"1",则无法区分该错误。执行恢复处理
设置是否在以下时间执行开始脚本。
服务器复归时
查出监视资源/ARMLOAD命令异常时
启动组资源处理异常结束时
作为恢复处理执行时,环境变量CLP_EVENT设置为RECOVER。
超时(1~9999)
设置脚本执行时等待结束时([同步])的超时时间。仅在选择[同步]时可以输入。如果设置时间内脚本没有结束,则判断为异常。
对象VCOM资源名
不使用。
允许桌面对话
在要执行的脚本中设置是否允许与桌面的交互。设置后,则可以在画面中确认脚本进度状况。在对脚本进行调试时使用有效。
执行用户
指定执行脚本的用户。执行用户可以从已在[集群属性]的[账户]标签页注册的用户中选择。如果未指定执行用户,则脚本将以本地系统帐户身份运行。默认值
点击[默认值]按钮,则所有项目均被设置为默认值。
4.4. 设置服务资源的详细信息¶
4.4.1. 服务资源相关注意事项¶
一般情况,服务资源设定的服务需要设定为手动启动。自动启动的服务,或者有可执行不通过服务资源启动的服务的场合,必须选择服务资源调整属性对话框的[服务]标签页下的[在服务已经启动的场合下,不产生错误]复选框。如果不选择的话,服务资源在启动已经启动的服务时会发生错误,导致资源启动失败。
- 为了通过服务资源启动的服务不被EXPRESSCLUSTER以外的程序控制,推荐不要使用服务控制管理器设定恢复操作。服务控制管理器的恢复操作里设定了服务再启动时,与EXPRESSCLUSTER的恢复操作重复,可执行导致不符合预期的结果。
4.4.2. 详细标签页¶
服务名 (1023字节以内)
设置服务资源中使用的服务名或服务显示名。组合框的选项将显示从所有服务器中获取服务的服务名列表。
连接
从所有服务器中获取服务列表后,将会更新[服务名]组合框中显示的服务名列表。
调整
显示[服务资源的调整属性]对话框。进行服务资源的详细设置。
服务资源的调整属性
参数标签页
显示参数相关的详细设置。同步
服务开始时等待服务状态变为"已启动"状态。一般开始服务后,状态便由"启动中"迁移到"已启动"。服务停止时等待服务状态变为"已停止"状态。一般停止服务后,状态便由"启动中" 迁移到"已停止"。异步
不进行等待。
超时(1~9999)
服务开始时,设置服务状态变为"已启动"状态为止的超时时间。仅在选择[同步]时可以输入。设置时间内如果服务未变为"已启动"状态,则判断为异常。服务停止时,设置服务状态变为"已停止"状态为止的超时时间。仅在选择[同步]时可以输入。设置时间内如果服务未变为"已停止"状态,则判断为异常。对象VCOM资源名
不使用。
默认值
点击[默认值]按钮,则所有项目均被设置为默认值。
服务标签页
显示服务相关的详细设置。开始参数(1023字节以内)
对服务设置输入参数。存在多个输入参数时,设置时用空格隔开。存在包含空格的输入参数时,用双引号("")将输入参数括起来。不能使用反斜线\。例:"param 1" param2在服务已经启动的场合下,不产生错误
复选框被选中服务开始时,如果服务已经开始,则直接变为启动状态。 复选框未选中服务开始时,如果服务已经开始,则视为启动异常。服务开始后的等待时间 (0~9999)
服务变为启动状态后,指定等待时间。等待了指定的时间后,服务资源的启动变为完成状态。
服务停止后的等待时间 (0~9999)
服务变为停止状态后,指定等待时间。等待了指定的时间后,服务资源的停止变为完成状态。
默认值
点击[默认值]按钮,则所有项目均被设置为默认值。
4.5. 设置虚拟机资源¶
虚拟机资源时,执行基于以下虚拟基板构筑的虚拟设备的控制。
4.5.1. 虚拟机资源相关的注意事项¶
虚拟机资源仅在已将EXPRESSCLUSTER安装到虚拟化基础架构((Hyper-V)的主机OS时才有效。
虚拟机资源,仅在组的类型为虚拟机时才能登录。
1个虚拟机资源只能登录到1个组。
停止虚拟机资源,会从Hyper-V Manager中删除虚拟机。
4.5.2. 详细标签页¶
虚拟机类型
指定虚拟设备是基于哪个虚拟基础架构创建。当前只能选择Hyper-V。
虚拟机名
Hyper-V时请输入Hyper-V管理器上显示的虚拟设备名。
虚拟机配置文件路径
输入虚拟设备的构成文件的路径。
调整
显示[虚拟机资源调整属性]对话框。对虚拟机资源进行详细设置。
调整虚拟机资源
参数标签
显示关于参数的详细设定信息。
请求超时
指定等待虚拟设备启动/停止等请求结束的时间。在指定时间内请求未完成时,视为超时,资源启动或不启动失败。虚拟机启动等待时间
资源启动时,指定从在虚拟机启动要求完成,且虚拟机处于[已启动]的状态开始,到虚拟机上的OS以及业务应用启动完成为止的等待时间。
虚拟机停止等待时间
资源停止时,指定等待虚拟机上的OS的关机等待时间。
默认值
点击[默认值]按钮,所有项目内容均被设为默认值。
5. 监视资源的详细信息¶
本章将对EXPRESSCLUSTER X SingleServerSafe中执行监视操作的单位,即监视资源进行具体说明。
为提高与集群链接软件EXPRESSCLUSTER X的操作性等方面的兼容性,EXPRESSCLUSTER X SingleServerSafe 使用了相同的画面。
本章说明的项目如下。
5.1. 监视资源一览¶
监视资源的可定义资源如下。
监视资源名 |
功能 |
监视时机 |
对象资源 |
---|---|---|---|
(粗字为默认值) |
|||
应用程序监视资源 |
对应用程序资源进行监视。 |
启动时 (固定) |
appli |
服务监视资源 |
对服务资源进行监视。 |
启动时 (固定) |
service |
磁盘RW监视资源 |
通过向文件系统写入虚拟数据对磁盘设备进行监视。 |
不间断监视/启动时 |
全部 |
IP监视资源 |
IP监视资源是使用ping 命令,通过是否有应答,对IP地址和通信路径进行监视。 |
不间断监视/启动时 |
全部 |
NIC Link Up/Down监视资源 |
获取NIC的Link状态,进行Link的Up/Down的监视。 |
不间断监视/启动时 |
全部 |
自定义监视资源 |
通过执行任意的脚本,进行监视。 |
不间断监视/启动时 |
全部 |
多目标监视资源 |
通过汇集复数个监视资源的状态,进行监视。 |
启动时 (固定) |
全部 |
消息接收监视资源 |
实现"接收发生异常通知时执行的异常时动作的设置"以及"发生异常通知的Cluster WebUI显示"。 |
不间断监视(固定) |
无 |
虚拟机监视资源 |
向虚拟机资源中启动的虚拟机提供监视结构。 |
启动时 (固定) |
vm |
进程名监视资源 |
监视任意进程名的进程。 |
不间断监视/启动时 |
全部 |
DB2监视资源 |
向IBM DB2数据库提供监视结构。 |
启动时 (固定) |
全部 |
FTP监视资源 |
向FTP服务器提供监视结构。 |
启动时 (固定) |
全部 |
HTTP监视资源 |
向HTTP服务器提供监视结构。 |
启动时 (固定) |
全部 |
IMAP4监视资源 |
向IMAP服务器提供监视结构。 |
启动时 (固定) |
全部 |
ODBC监视资源 |
向ODBC上可访问的数据库提供监视结构。 |
启动时 (固定) |
全部 |
Oracle监视资源 |
向Oracle数据库提供监视结构。 |
启动时 (固定) |
全部 |
POP3监视资源 |
向POP服务器提供监视结构。 |
启动时 (固定) |
全部 |
PostgreSQL监视资源 |
向PostgreSQL数据库提供监视结构。 |
启动时 (固定) |
全部 |
SMTP监视资源 |
向SMTP服务器提供监视结构。 |
启动时 (固定) |
全部 |
SQL Server监视资源 |
向SQL Server数据库提供监视结构。 |
启动时 (固定) |
全部 |
Tuxedo监视资源 |
向Tuxedo应用程序服务器提供监视结构。 |
启动时 (固定) |
全部 |
Weblogic监视资源 |
向WebLogic应用程序服务器提供监视结构。 |
启动时 (固定) |
全部 |
WebOTX监视资源 |
向WebOTX应用程序服务器提供监视结构。 |
启动时 (固定) |
全部 |
Websphere监视资源 |
向WebSphere应用程序服务器提供监视结构。 |
启动时 (固定) |
全部 |
JVM监视资源 |
进行Java VM的监视。 |
不间断监视/启动时 |
全部 |
系统监视资源 |
进行系统资源的监视。 |
不间断监视(固定) |
全部 |
进程资源监视资源 |
进行进程资源的监视。 |
不间断监视(固定) |
全部 |
用户空间监视 |
提供用户空间的stall监视功能 |
不间断监视(固定) |
无 |
5.1.1. License所需的监视资源¶
由于下表里的监视资源为可选产品,所以需要License。
使用时,请购买产品License,注册License。
可选产品名 |
监视资源名 |
---|---|
EXPRESSCLUSTER X SingleServerSafe Database Agent 4.3 for Windows |
DB2监视资源 |
ODBC监视资源 |
|
Oracle监视资源 |
|
PostgreSQL监视资源 |
|
SQL Server监视资源 |
|
EXPRESSCLUSTER X SingleServerSafe Internet Server Agent 4.3 for Windows |
FTP监视资源 |
HTTP监视资源 |
|
IMAP4监视资源 |
|
POP3监视资源 |
|
SMTP监视资源 |
|
EXPRESSCLUSTER X SingleServerSafe Application Server Agent 4.3 for Windows |
Tuxedo监视资源 |
Websphere监视资源 |
|
Weblogic监视资源 |
|
WebOTX监视资源 |
|
EXPRESSCLUSTER X SingleServerSafe Java Resource Agent 4.3 for Windows |
JVM监视资源 |
EXPRESSCLUSTER X SingleServerSafe System Resource Agent 4.3 for Windows |
系统监视资源 |
进程资源监视资源 |
关于License的注册步骤,请参考《安装指南》。
5.1.2. 监视选项的动作确认完毕应用程序信息¶
监视选项以下述的应用程序为监视对象进行动作的确认。
X86_64版
监视资源
|
监视对象的
应用程序
|
EXPRESSCLUSTER X SingleServerSafe
Version
|
备注
|
---|---|---|---|
Oracle监视 |
Oracle Database 12c Release 1 (12.1) |
12.00~ |
|
Oracle Database 12c Release 2 (12.2) |
12.00~ |
||
Oracle Database 18c (18.3) |
12.10~ |
||
Oracle Database 19c (19.3) |
12.22~ |
||
DB2监视 |
DB2 V10.5 |
12.00~ |
|
DB2 V11.1 |
12.00~ |
||
DB2 V11.5 |
12.20~ |
||
PostgreSQL监视 |
PostgreSQL 9.3 |
12.00~ |
|
PostgreSQL 9.4 |
12.00~ |
||
PostgreSQL 9.5 |
12.00~ |
||
PostgreSQL 9.6 |
12.00~ |
||
PostgreSQL 10 |
12.00~ |
||
PostgreSQL 11 |
12.10~ |
||
PostgreSQL 12 |
12.22~ |
||
PowerGres on Windows V9.1 |
12.00~ |
||
PowerGres on Windows V9.4 |
12.00~ |
||
PowerGres on Windows V9.6 |
12.00~ |
||
PowerGres on Windows V11 |
12.10~ |
||
SQL Server监视 |
SQL Server 2014 |
12.00~ |
|
SQL Server 2016 |
12.00~ |
||
SQL Server 2017 |
12.00~ |
||
SQL Server 2019 |
12.20~ |
||
Tuxedo 监视 |
Tuxedo 12c Release 2 (12.1.3) |
12.00~ |
|
Weblogic监视 |
WebLogic Server 11g R1 |
12.00~ |
|
WebLogic Server 11g R2 |
12.00~ |
||
WebLogic Server 12c R2 (12.2.1) |
12.00~ |
||
WebLogic Server 14c (14.1.1) |
12.20~ |
||
Websphere监视 |
WebSphere Application Server 8.5 |
12.00~ |
|
WebSphere Application Server 8.5.5 |
12.00~ |
||
WebSphere Application Server 9.0 |
12.00~ |
||
WebOTX监视 |
WebOTX Application Server V9.1 |
12.00~ |
|
WebOTX Application Server V9.2 |
12.00~ |
||
WebOTX Application Server V9.3 |
12.00~ |
||
WebOTX Application Server V9.4 |
12.00~ |
||
WebOTX Application Server V9.5 |
12.00~ |
||
WebOTX Application Server V10.1 |
12.00~ |
||
WebOTX Application Server V10.3 |
12.30~ |
||
JVM监视 |
WebLogic Server 11g R1 |
12.00~ |
|
WebLogic Server 12c R2 (12.2.1) |
12.00~ |
||
WebLogic Server 14c (14.1.1) |
12.20~ |
||
WebOTX Application Server V9.1 |
12.00~ |
||
WebOTX Application Server V9.2 |
12.00~ |
||
WebOTX Application Server V9.3 |
12.00~ |
||
WebOTX Application Server V9.4 |
12.00~ |
||
WebOTX Application Server V9.5 |
12.00~ |
||
WebOTX Application Server V10.1 |
12.00~ |
||
WebOTX Application Server V10.3 |
12.30~ |
||
WebOTX Enterprise Service Bus V8.4 |
12.00~ |
||
WebOTX Enterprise Service Bus V8.5 |
12.00~ |
||
WebOTX Enterprise Service Bus V10.3 |
12.30~ |
||
Apache Tomcat 8.5 |
12.00~ |
||
Apache Tomcat 9.0 |
12.00~ |
||
WebSAM SVF for PDF 9.1 |
12.00~ |
||
WebSAM SVF for PDF 9.2 |
12.00~ |
||
WebSAM Report Director Enterprise 9.1 |
12.00~ |
||
WebSAM Report Director Enterprise 9.2 |
12.00~ |
||
WebSAM Universal Connect/X 9.1 |
12.00~ |
||
WebSAM Universal Connect/X 9.2 |
12.00~ |
||
系统监视 |
不指定版本 |
12.00~ |
|
进程资源监视 |
不指定版本 |
12.10~ |
5.2. 设置监视资源的属性¶
5.2.2. 监视 (共通) 标签页¶
间隔(1~999)
设置确认监视对象状态的时间间隔。
超时(5~999)
若在指定时间内没有发现监视对象的正常状态,则判断为异常。
超时发生时获取监视进程的dump文件 (仅Oracle监视资源时)
指定发生超时时,是否收集监视进程的Dump文件。收集的Dump文件存放在EXPRESSCLUSTER 安装目录的work\rm\资源名\errinfo.cur
文件夹下。多次收集的情况下,之前收集的文件夹的名字重命名为errinfo.1,errinro.2等,并且只存放最新的5次收集的Dump文件。
超时发生时不进行重试
将本功能设为有效时,若监视资源发生超时则立即执行复归操作。
超时发生时不执行复归操作
将本功能设为有效时,若监视资源发生超时则不执行复归操作。仅在将[超时发生时不进行重试]功能设为有效时可以设置。注解
在以下监视资源中,不能设置[超时发生时不进行重试], [超时发生时不执行复归操作]功能。
自定义监视资源 (仅在监视类型为[异步]时)
多目标监视资源
消息接收监视资源
虚拟机监视资源
JVM监视资源
系统监视资源
进程资源监视资源
用户空间监视资源
重试次数(0~999)
发现异常状态后,若连续指定次数发现异常,则判断为异常。若指定为0,则在最初发现异常时即判断为异常。
开始监视的等待时间(0~9999)
设置等待监视开始的时间。
监视时间
设置监视的时机。
不间断监视一直进行监视。 指定资源被启动后开始监视指定资源启动之前不进行监视。[监视时间]选择[指定资源被启动后开始监视]时,必须要对[目标资源]进行设定。点击[参照]选择监视的目标资源。选择监视目标资源,点击[确定]。
目标资源
显示启动时进行监视的对象资源。
参照
显示[选择对象资源]对话框。树形显示服务器名和资源名。选择要设置的对象资源,点击[确定]。
选择监视服务器
不使用。
发送监视处理时间指标
设置监视处理时间指标的发送功能。
选中复选框发送监视资源的监视处理时间指标。 不选中复选框不发送监视资源的监视处理时间指标。
注解
消息接收监视资源
5.2.3. 监视 (固有) 标签页¶
有些监视资源需要设置监视操作时的参数。参数请参考各个资源的说明。
5.2.4. 复归操作标签页¶
通常的监视资源(外部监视关联资源以外)的场合
外部监视关联资源的场合
设置复归对象和查出异常时的运行。查出异常时可重新启动组的失效切换,资源和集群。但是,如果复归对象处于停止状态则不进行恢复运行。
复归动作
选择异常检出时的复归操作。
对复归对象进行重新启动对复归对象里选择的失效切换组或者组资源所属的组进行重新启动。重新启动失败,或者重新启动后发生相同的异常时,则执行最终动作里选择的动作。 只在最终动作时执行执行最终动作里选择的动作。 自定义设置在重启动次数范围内对复归对象里选择的失效切换组或者组资源所属的组进行重新启动。重新启动失败,或者重新启动后发生相同的异常,或者达到重启动次数上限,则执行最终动作里选择的动作。
复归对象
当发现资源异常时,显示要进行恢复的对象。
参照
显示[选择复归对象]对话框。树形显示LocalServer,All Groups和集群中登录的组名,资源名。选择要设置的恢复对象,点击[确定]。
复归脚本运行回数 (0~99)
发现异常时,设置[脚本设置]中脚本的执行次数。若设置为0,则不执行脚本。
重启动前运行脚本
指定是否在进行重新启动前执行脚本。
重启动次数(0~99)
设置出现异常时进行重新启动的次数。若设置为0,则不重新启动。若选择组或组资源为恢复对象,可进行设置。外部关联监视资源的场合该值不能设定。
失效切换执行前运行脚本
不使用。
失效切换之前执行迁移
不使用。
失效切换目标服务器
不使用。
最大失效切换次数
不使用。
在最终动作前运行脚本
指定是否在最终动作前运行脚本。
选中复选框在最终动作前运行脚本。要进行脚本/命令设置时,请点击[设置]按钮。 未选中复选框不运行脚本/命令。
复归动作前运行脚本
指定是否在执行复归运行前执行脚本仅在消息接收监视资源可设置。
选中复选框执行复归运行前执行脚本/命令。要进行脚本/命令的设置,请点击[设置]。 未选中复选框不执行脚本/命令。
脚本设置
显示[编辑脚本]对话框。设置复归脚本/命令。
用户应用程序
使用作为脚本的可在服务器上执行的文件(可执行的批处理文件,执行文件)。在文件名中设置服务器上的本地磁盘绝对路径或者可执行文件名。但是,只设置可执行文件名时,需要事先在环境变量中设置路径。此外,如果在绝对路径,文件名包含空格时,如下所示,请用双引号(")括起来。
例:
"C:\Program Files\script.bat"
另外,执行VB脚本时请输入以下所记的。
例:
cscript script.vbs各可执行文件不包含在Cluster WebUI的集群配置信息中。由于无法在Cluster WebUI中进行编辑和上传,所以需要在各服务器上准备。
用Cluster WebUI创建的脚本
使用作为脚本的在Cluster WebUI中准备的脚本文件。可以在Cluster WebUI中编辑脚本文件。脚本文件包含在集群配置信息中。
文件 (1023字节内)
选择[用户应用程序]时,设置执行的脚本(可执行的批处理文件,执行文件)。
显示
选择[用Cluster WebUI创建的脚本]时,显示脚本文件。
编辑
选择[用Cluster WebUI创建的脚本]时,编辑脚本文件。如要反映更改时,请点击[保存]。无法更改脚本文件名。
替换
选择[用Cluster WebUI创建的脚本]时,将脚本文件的内容替换为文件选择对话框中选择的脚本文件内容。如脚本已经为显示中或者编辑中时,无法替换。请选择脚本文件。请不要选择二进制文件(应用程序)。
超时 (1~9999)
指定等待脚本结束的最大时间。规定值为5秒。
执行用户
指定执行脚本的用户。执行用户可以从已在[集群属性]的[账户]标签页注册的用户中选择。如果未指定执行用户,则脚本将以本地系统帐户身份运行。
最终动作
选择通过重新启动复归失败后的复归动作。最终运行有以下选择。
无操作不进行任何操作。注解
以下情况下请使用[无操作]设置。
暂时控制最终动作时
查出异常后想仅显示警报时
通过多目标监视资源执行实际的最终动作时
- 停止资源若选择组资源为监视对象时,停止该组资源和依赖该组资源的组资源。若选择"LocalServer","All Groups",组为监视对象时,无法选择本项目。
- 停止组若选择监视对象为组时,停止该组,或选择组资源为监视对象时,停止该组资源所属的组。若选择"All Groups",则停止监测到异常的监视资源所在的服务器上启动的所有组。若选择LocalServer为复归对象,则无法选择。
- 停止集群服务停止出现异常的服务器的EXPRESSCLUSTER Server服务。
- 停止集群服务并关闭操作系统停止出现异常的服务器的EXPRESSCLUSTER Server服务,关闭OS。
- 停止集群服务并操作系统重启停止出现异常的服务器的EXPRESSCLUSTER Server服务,重启OS。
- 生成主动停止错误有意使查出异常的服务器发生停止错误。
5.3. 设置应用程序监视资源¶
应用程序监视资源对应用程序资源进行监视。在启动了应用程序资源的服务器中进行监视。仅在应用程序资源的常驻类型设置为[常驻]时,可以监视。
5.3.1. 应用程序监视资源的监视方法¶
定期对应用程序进行死活监视,发现应用程序关闭时判断为异常。
5.3.2. 应用程序监视资源相关注意事项¶
对成功启动的应用程序资源进行监视。仅在应用程序资源的常驻类型设置为[常驻]时,可以监视。
5.4. 设置服务监视资源¶
服务监视资源对服务资源进行监视。在服务资源启动的服务器中执行监视。
5.4.1. 服务监视资源的监视方法¶
定期向服务控制管理器询问服务的状态,若处于"已停止"状态,则判断为出现异常。
5.4.2. 关于服务监视资源的注意事项¶
5.5. 设置磁盘RW监视资源¶
磁盘RW监视资源通过对文件系统进行虚拟数据写入,对磁盘设备进行监视。
5.5.1. 使用磁盘RW监视资源进行监视的方法¶
注解
监视对象磁盘发生磁盘路径故障,磁盘路径冗余化软件等功能执行失效切换时,需将监视超时的时间(默认值300秒)设置成大于路径失效切换所需时间。
5.5.2. 监视 (固有) 标签页¶
文件名(1023字节以内)
输入用于访问的文件名。本文件在监视处理时创建,I/O结束时删除。
注解
文件名请指定为绝对路径。若指定为相对路径,有时监视的路径可执行是指定路径之外的其他路径。
重要
指定文件名时请不要指定已经存在的文件。若指定的文件已经存在,该文件信息将会丢失。
I/O大小 (1~9999999 默认值:2000000)
指定针对要监视的磁盘进行I/O的大小。
查出Stall异常时的动作
磁盘已满时的处理
指定查出磁盘已满(监视的磁盘没有空余容量的状态)时的运行。
执行复归操作磁盘RW监视资源将查出磁盘已满作为异常操作来处理。 不执行复归操作磁盘RW监视资源将查出磁盘已满作为警告操作来处理。
使用Write Through方式
监视I/O方式适用于Write Through方式。
有效时,提高磁盘RW监视的异常检测精确度,但会发生系统I/O负荷上升的现象。
5.6. 设置IP监视资源¶
IP监视资源是使用ping 命令,通过是否有应答,对IP地址进行监视的监视资源。
5.6.1. IP监视资源的监视方法¶
使用ping 命令对指定IP地址进行监视。若指定IP地址没有任何应答,则判断为异常。
- 在存在多个IP地址,且全部IP地址出现异常,被判断为异常的情况下,请在1个IP监视资源中登录所有IP地址。
下图是将所有IP地址都注册到1个IP监视资源中的示例。 指定的IP地址即使只有1个是正常的情况下,IP monitor 1都会判断为正常。
下图是将所有IP地址都注册到1个IP监视资源中的示例。 指定的IP地址全异常时,IP monitor 1判断为异常。
- 多个IP地址中,若要判断其中某一个为异常时,需要按照各个IP地址,分别创建IP监视资源。
5.6.2. 监视 (固有) 标签¶
添加
添加要监视的IP地址。显示IP地址的输入对话框。
删除
在监视对象中删除[IP地址列表]中选中的IP地址。
编辑
显示输入IP地址的对话框。显示[IP地址]中选中的IP地址,编辑后点击[确定]。
Ping超时 (1~999999 默认值:1000)
以毫秒为单位设置Ping所要监视的IP地址的超时时间。
输入IP地址
显示关于接口的详细设定。
IP地址 (255字节以内)
输入进行监视的IP地址,点击[确定]。请输入可常時通信的IP地址。
5.7. 设置NIC Link Up/Down监视资源¶
NIC Link Up/Down监视资源是获取使用WMI指定NIC的Link状态,对Link的Up/Down进行监视。
5.7.1. NIC Link Up/Down监视的配置以及范围¶
- 监视用LAN线缆直接连接其他服务器的NIC时,其他服务器宕机(尚未确立连接),会查出异常。设置监视异常时的恢复操作时,请设置适当值。例如,恢复操作设置为"停止集群服务并操作系统重启",则其余服务器端会无限反复重启OS。
5.7.2. 监视 (固有) 标签页¶
添加
将进行监视的NIC的IP地址添加到进行监视的服务器一览中。
删除
在进行监视的服务器一览中删除进行监视的NIC的IP地址。
编辑
编辑进行监视的NIC的IP地址。
输入IP地址
IP地址 (47字节以内)
指定监视的NIC的IP地址。
5.8. 设置自定义监视资源¶
自定义监视资源是通过执行任意的脚本对系统进行监视的一种监视资源。
5.8.1. 自定义监视资源的监视方法¶
5.8.2. 自定义监视资源相关注意事项¶
在bat文件内执行向命令窗口输出消息(标准输出,错误输出)的命令时,由于在命令执行时bat文件有可执行停止,请将消息输出点指定为文件或者null(重定向)。
监视类型为[异步]时,请在超时中设置比监视开始等待时间大的值。
5.8.3. 监视 (固有) 标签页¶
用户应用程序
使用作为脚本的可在服务器上执行的文件(可执行的批处理文件,执行文件)。各可执行文件名在服务器上的本地磁盘绝对路径中设置。各可执行文件不包含在Cluster WebUI的集群配置信息中。由于无法在Cluster WebUI中进行编辑和上传,所以需要在各服务器上准备。
用Cluster WebUI创建的脚本
使用作为脚本的在Cluster WebUI中准备的脚本文件。可以在 Cluster WebUI中编辑脚本文件。脚本文件包含在集群配置信息中。
文件 (1023字节以内)
执行的脚本(可执行的批处理文件,执行文件)在服务器上的本地磁盘绝对路径中设置。但是脚本的后面不能指定参数。
显示
选择[用Cluster WebUI创建的脚本]时,显示脚本文件。
编辑
选择[用Cluster WebUI创建的脚本]时,编辑脚本文件。如要反映更改时,请点击[保存]。无法更改脚本文件名。
替换
选择[用Cluster WebUI创建的脚本]时,将脚本文件的内容替换为文件选择对话框中选择的脚本文件内容。如脚本已经为显示中或者编辑中时,无法替换。请选择脚本文件。请不要选择二进制文件(应用程序)。
监视方式
选择监视方法。
同步(默认值)定期执行脚本,通过该错误代码判断是否异常。 异步在监视开始时执行脚本,如该进程消失则判断为异常。
正常的返回值 (1023字节以内)
监视类型为[同步]时,对于脚本的错误代码是什么值时判断为正常进行设置。有多个值时,像0,2,3这样用逗号分隔开,或者像0-3这样用连字号指定数值范围。
默认值 : 0
退出时强制结束应用程序
作为监视停止时的终了处理,设定是否强制停止应用。设定时不执行通常的停止处理, 强制停止应用。只有在监视类型为[异步]时有效。
执行用户
指定执行脚本的用户。执行用户可以从已在[集群属性]的[账户]标签页注册的用户中选择。如果未指定执行用户,则脚本将以本地系统帐户身份运行。
当停止集群时,等待启动时监控的停止
在集群停止时,等待自定义监视资源停止。只有在监视时间设置为[启动时]才有效。
5.9. 设置多目标监视资源¶
多目标监视资源对多个监视资源进行监视。
5.9.1. 多目标监视资源的注意事项¶
多目标监视资源将登录中监视资源的状态下线(offline)处理为异常。为此,已登录启动时监视的监视资源时,因监视资源不能查出异常的状态下,多目标监视器资源查出异常的现象。请勿登录启动时监视的监视资源。
5.9.2. 多目标监视资源的状态¶
已登录的监视资源数 2异常次数 2警告次数 1
多目标监视资源的状态如下所示。
监视资源1状态
正常
(normal)
|
监视资源1状态
异常
(error)
|
监视资源1状态
已停止
(offline)
|
|
---|---|---|---|
监视资源2状态
正常
(normal)
|
正常
(normal)
|
警告
(caution)
|
警告
(caution)
|
监视资源2状态
异常
(error)
|
警告
(caution)
|
异常
(error)
|
异常
(error)
|
监视资源2状态
已停止
(offline)
|
警告
(caution)
|
异常
(error)
|
正常
(normal)
|
- 多目标监视资源对已登录的监视资源状态进行监视。异常(error)状态的监视资源数超过异常次数时,多目标监视资源则会查出异常(error)。异常(error)状态的监视资源数超过警告次数时,多目标监视资源的状态会变为警告(caution)。若所有登录的监视资源状态都已停止(offline),多目标监视资源的状态将为正常(normal)。除了所有登录的监视资源状态均已停止(offline)的情况之外,多目标监视资源将已登录的监视资源状态处于已停止(offline)的情况判断为异常(error)。
- 即便已登录的监视资源状态为异常(error),也不会执行该监视资源出现异常时的操作。仅在多目标监视资源出现异常(error)时,才会执行多目标监视资源出现异常时的操作。
5.9.3. 监视 (固有) 标签页¶
添加
将选中监视资源添加到[监视资源列表]中。
删除
在[监视资源列表]中删除选中的监视资源。
调整
显示[多目标监视资源调整属性]的对话框。进行多目标监视资源的详细设定。
多目标监视资源的调整属性
参数标签页
显示关于参数的详细设定。
异常次数
选择多目标监视器为异常的条件。
与成员总数相同多目标监视器下指定的监视资源全都异常,或者既有异常又有已停止时,多目标监视器为异常。多目标监视器下指定的监视资源都为已停止时,属于正常。 设定数字在多目标监视器下指定的监视资源中,异常次数中设置的数值异常或者为已停止时,多目标监视器视为异常。在多目标监视器下指定的监视资源中,在多少个监视资源异常或者为已停止时,视为多目标监视器异常。设置该数值。异常次数的选择为[指定数值]时可以进行设置。
警告次数
选中复选框多目标监视器下指定的监视资源中,在多少个监视资源为异常或者已停止时,视为多目标监视器警告。设置该数值。 未选中复选框多目标监视器部显示警告Alert。
默认值
返回默认值时使用。点击[默认值],则所有项目被设置成默认值。
5.10. 设置消息接收监视资源¶
5.10.1. 消息接收监视资源监视方法¶
图为使用消息接收监视资源的配置示例。 从clprexec命令接收到异常发生通知的Server2的消息接收监视资源 (Message receive monitor resource) ,执行查出自身状态更改和异常时的复归动作。
5.10.2. 消息接收监视资源相关注意事项¶
在消息接收监视资源处于暂停状态下接收到外部的异常发生通知时,不执行异常时动作。
接收到外部的异常发生通知时,消息接收监视资源的状态变成异常。变成异常的消息接收监视资源的状态不会自动恢复到正常。请使用clprexec命令将其状态恢复到正常。关于clprexec命令,请参考《操作指南》的"EXPRESSCLUSTER X SingleServerSafe 命令参考"。
在接收到外部的异常发生通知,消息接收监视资源的状态变成异常的状态下,接收到异常发生通知时,不执行异常发生时的恢复动作。
5.10.3. 监视 (固有) 标签页¶
在监视类型和监视对象中使用clprexec命令参数-k设置要传递的关键词。可以省略监视对象。
分类(32字节以内)
[clprexec]命令的参数[-k]指定传递的分类参数。
关键字(1023字节以内)
[clprexec]命令的参数[-k]指定传递的关键字参数。
5.11. 设置虚拟机监视资源¶
5.11.1. 虚拟机监视资源的注意事项¶
有关运行确认完毕的虚拟基础架构的版本请参考"4. 组资源的详细信息"的"4.1.1. 虚拟机资源的运行环境"。
5.11.2. 虚拟机监视资源的监视方法¶
虚拟机监视资源按虚拟基础架构不同使用以下方法进行监视。
5.12. 设置进程名监视资源¶
进程名监视资源是监视任意的进程名的进程的监视资源。
5.12.1. 进程名监视资源的注意事项¶
进程数下限值为1,存在多个指定为监视对象的进程名之进程时,按以下条件选择一个进程作为监视对象,并进行监视。
进程间存在主从关系时,监视主进程。
进程间无主从关系时,监视启动时间最早的进程。
若进程间无主从关系,且启动时间也相同,则监视进程ID最小的进程。
同一名称的进程多个存在时,根据进程的启动个数进行监视时,设置监视进程数下限值的个数。低于同一名称进程的设置个数时判断为异常发生。进程数的下限值的个数可指定为1到999之间。进程数下限值设置为1时,选择一个进程作为监视对象,并进行监视。
监视对象的进程名过长时,输出到日志等的进程名信息以省略了后半部分的形式来显示。
监视的进程中如果进程名包含「"」(双引号),「,」(逗号)时,警报日志中的进程名有时可执行不能正确显示。
请按照以下命令,确认并设定监视对象进程名的实际动作中进程的进程名。
EXPRESSCLUSTER安装路径\bin\GetProcess.vbs
从上面的命令中确认实际运行进程的进程名,并在输出信息的CommandLine部分指定监视对象的进程名。输出信息中包含「"」(双引号)时,「"」(双引号)也需要指定。
输出文件的列子
20XX/07/26 12:03:13
Caption CommandLine
services.exe C:\WINDOWS\system32\services.exe
svchost.exe C:\WINDOWS\system32\svchost -k rpcss
explorer.exe C:\WINDOWS\Explorer.EXE
从上面的命令输出信息来看,如果要监视 svchost.exe,需指定监视对象进程名 C:\WINDOWS\system32\svchost -k rpcss
。
指定为监视对象进程名的进程名可以将进程参数也作为进程名的一部分特定为监视对象的进程。指定监视对象进程名时,请指定包括参数在内的进程名。仅监视不含参数的进程名时,请使用通配符号(*)来指定不含参数的前方一致或部分一致。
5.12.2. 进程名监视资源的监视方法¶
监视指定进程名的进程。进程数的下限值为1时,根据进程名确定进程ID,进程ID消失则判断为异常。无法检测出进程的停止。
进程数的下限值设置为大于1的数值时,根据个数对设置的进程名的进程进行监视。并根据进程名计算出监视对象进程的个数,低于下限值时判断为异常。不能查出进程的停止。
5.12.3. 监视 (固有) 标签页¶
进程名(1023字节以内)
设置监视的进程名。请务必进行设置。默认值 :无此外,可使用下述的3种模式指定进程名的通配符号。其它模式不可指定。
【前方一致】 <包含进程名中的字符串>*
【后方一致】*<包含进程名中的字符串>
【部分一致】*<包含进程名中的字符串>*
进程数量下限 (1~999)
设置作为监视对象的进程的监视个数。如果进程名中设置的监视对象的进程的个数低于设置值时,判断为异常。
5.13. 设置DB2监视资源¶
DB2监视资源是监视服务器上运行的DB2的数据库的监视资源。
5.13.1. DB2监视资源的注意事项¶
关于确认过运行的DB2版本,请参考"5. 监视资源的详细信息"的"5.1.2. 监视选项的动作确认完毕应用程序信息"。
因为监视处理使用DB2的CLI,所以需要在执行监视的服务器上安装用于接口的DLL (DB2CLI.DLL/DB2CLI64.DLL)。
请在监视对象资源中指定启动DB2的服务资源或脚本资源。启动监视对象资源后,开始监视。但如果启动监视对象资源后,发生数据库不能立即运行等情况,请通过[开始监视的等待时间]进行调整。
在对虚拟机资源进行控制的虚拟设备的目标OS上运行的DB2数据库进行监视时,请指定虚拟机资源为监视的对象资源,将虚拟机资源启动后到DB2数据库能够连接之前的足够长的等待时间设置成[监视开始等待时间]。此外,这种情况下需要在运行监视资源的主机OS侧安装DB2客户端,事先将虚拟设备上的数据库登录到数据库节点目录。
开始监视时,创建监视表。因为失效切换组停止导致监视也停止时,会删除监视表。监视暂时中断等情况下,不会删除监视表。另外,由于系统异常等导致服务器在失效切换组停止前发生宕机等现象时,不会删除监视表,所以下次开始监视时,会显示"a monitor table exists"的错误消息,这不属于异常。
针对每个监视操作,DB2自身将会输出运行日志等。请根据需要,通过DB2的设置进行控制。
选择的监视级别 |
事先创建监视表格 |
---|---|
级别1(在select中的监视) |
有必要 |
级别2(在update/select中的监视) |
没有必要 |
可按以下步骤创建监视表格。
(以监视表格名为db2watch时为例):
sql> create table DB2WATCH (num int not null primary key)
sql> insert into DB2WATCH values(0)
sql> commit
5.13.2. DB2监视资源的监视方法¶
DB2监视资源按从以下监视级别中选择的级别进行监视。
- 级别1(在select中的监视)该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select )。作为监视结果,如果出现以下情况则视为异常。
数据库连接失败时
SQL语句响应中通知异常时
- 级别2(在update/select中的监视)该监视也进行监视表格的更新。通过SQL语句,对最大10行数值数据进行写入和读入操作。监视的开始以及结束时进行监视表格的作成和删除。对监视表格发行的SQL文为create / update / select / drop。作为监视结果,如果出现以下情况则视为异常。
数据库连接失败时
在SQL语句的响应中通知有异常时
写入和读入的数据不一致时
5.13.3. 监视 (固有) 标签页¶
监视级别
从以下选项中选择一项。请务必进行设置。
级别1(在select中的监视)该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。 级别2(在update/select中的监视)该监视还对监视表格进行更新。对监视表格执行的SQL语句为(create /update / select /drop )。默认值 : 级别2(在update/select中的监视)
数据库名 (255字节以内)
指定要监视的数据库名。请务必设置。
默认值:无
实例名 (255字节以内)
指定要监视的数据库的实例名。请务必设置。
默认值:DB2
用户名 (255字节以内)
指定登录数据库时使用的用户名。
默认值 : db2admin
密码 (255字节以内)
指定登录数据库时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。
默认值:无
监视表名 (255字节以内)
指定在数据库上创建的用于监视的表格的名称。请务必设置。因为该表需要创建和删除,请注意不要与运行时用到的表格重名。另外,还需要注意不要与SQL语句的保留字重复。根据数据库的式样,监视的表名有不能设置的字符。详细请确认数据库的式样。默认值 : DB2WATCH
5.14. 设置FTP监视资源¶
FTP监视资源对服务器上运行的FTP服务进行监视。它监视FTP协议,而不是监视特定的应用程序。因此,可以对使用FTP协议的各种应用程序进行监视。
5.14.1. FTP监视资源的注意事项¶
5.14.2. FTP监视资源的监视方法¶
FTP资源连接失败时
在对FTP命令的响应中通知有异常时
5.14.3. 监视 (固有) 标签页¶
IP地址 (255字节以内)
指定要监视的FTP服务器的IP地址。请务必设置。由于一般情况下连接到在自身服务器中工作的FTP服务器上,因此设置回环地址(127.0.0.1)。但因FTP服务器设置对能够连接的地址进行了限制时,设置可连接的地址(浮动IP地址等)。此外,对在虚拟机资源中进行控制的虚拟设备的目标OS上工作的FTP服务器进行监视时,设置虚拟设备的IP地址。默认值 : 127.0.0.1
端口号 (1~65535)
指定要监视的FTP的端口号。请务必设置。
默认值 : 21
用户名 (255字节以内)
指定登录FTP时使用的用户名。
默认值 : 无
密码 (255字节以内)
指定登录FTP时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。
默认值 : 无
5.15. 设置HTTP监视资源¶
HTTP监视资源监视服务器上运行的HTTP服务。它监视HTTP协议,而不是特定的应用程序。因此,可以对使用HTTP协议的各种应用程序进行监视。
5.15.1. HTTP监视资源的注意事项¶
5.15.2. HTTP监视资源的监视方法¶
HTTP监视资源进行以下监视。
连接HTTP daemon时通知异常
应答HTTP request的信息不是以"HTTP/"开头
应答HTTP request的状态代码为400,500时(Request URI指定默认值以外的URI时)
5.15.3. 监视 (固有) 标签页¶
连接目的端 (255字节以内)
指定要监视的HTTP服务器的IP地址。请务必设置。由于一般情况下连接到在自身服务器中工作的HTTP服务器上,因此设置回环地址(127.0.0.1)。但因HTTP服务器设置对能够连接的地址进行了限制时,设置可连接的地址(浮动IP地址等)。此外,对在虚拟机资源中进行控制的虚拟设备的目标OS上工作的HTTP服务器进行监视时,设置虚拟设备的IP地址。默认值 : 127.0.0.1
端口号 (1~65535)
指定要监视的HTTP的端口号。请务必设置。
默认值 : 80 (HTTP)443 (HTTPS)
监视URI (255字节以内)
指定要监视的HTTP的URI。如果不指定,则对document root进行监视。不需要创建监视用页面。如果指定,则对指定的特定URI进行监视。指定的URI需要具备可匿名访问的权限。使用从document root开始的URI进行如下描述。(例) 监视对象Web页面的URL为http://WebServer:80/watch/sample.htm时
/watch/sample.htm
默认值:无
协议
设置和HTTP服务器通信使用的协议。一般选择HTTP,但是必须通过HTTP over SSL连接时选择HTTPS。
注解
如果选择了[HTTPS],则无论选择哪种请求类型选项,都将发出GET请求。
Request类型
设置连接到HTTP服务器时的HTTP Request的类型。请务必进行设置。
默认值 : HEAD
用户名(255字节以内)
设置登录HTTP时的用户名。仅在进行BASIC认证时设置。默认值 : 无
密码(255字节以内)
设置登录HTTP时的密码。仅在进行BASIC认证时设置。默认值 : 无
5.16. 设置IMAP4监视资源¶
IMAP4监视资源对服务器上运行的IMAP4服务进行监视。它监视IMAP4协议,而不是特定的应用程序。因此,可以对使用IMAP4协议的各种应用程序进行监视。
5.16.1. IMAP4监视资源的注意事项¶
请在监视对象资源中指定启动IMAP4服务器的服务资源及脚本资源等。虽然在启动对象资源后开始进行监视,但如果对象资源启动后IMAP4服务器不能立即运行或其他情况下,请通过[开始监视的等待时间]进行调整。
在对虚拟机资源进行控制的虚拟设备的目标OS上运行的IMAP4服务器进行监视时,请指定虚拟机资源为监视的对象资源,将虚拟机资源启动后到IMAP4服务器能够连接之前的足够长的等待时间设置成[监视开始等待时间]。
针对每个监视动作,IMAP4服务本身会输出运行日志等,请通过IMAP4服务器侧的设置进行适当控制。
5.16.2. IMAP4监视资源的监视方法¶
连接IMAP4服务器失败
在对命令的响应中通知有异常时
5.16.3. 监视 (固有) 标签页¶
IP地址 (255字节以内)
指定要监视的IMAP4服务器的IP地址。请务必设置。由于一般情况下连接到在自身服务器中工作的IMAP4服务器上,因此设置回环地址(127.0.0.1)。但因IMAP4服务器设置对能够连接的地址进行了限制时,设置可连接的地址(浮动IP地址等)。此外,对在虚拟机资源中进行控制的虚拟设备的目标OS上工作的IMAP4服务器进行监视时,设置虚拟设备的IP地址。默认值 : 127.0.0.1
端口号 (1~65535)
指定要监视的IMAP4的端口号。请务必设置。
默认值 : 143
用户名 (255字节以内)
指定登录IMAP4时使用的用户名。
默认值 : 无
密码 (189字节以内)
指定登录IMAP4时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。
默认值 : 无
认证方式
指定登录IMAP4时使用的认证方法。需要与使用的IMAP4的设置保持一致。
AUTHENTICATE LOGIN(默认值)使用AUTHENTICATE LOGIN命令的加密认证方式。 LOGIN使用LOGIN命令的明文方式。
5.17. 设置ODBC监视资源¶
ODBC监视资源用于监视服务器上运行的ODBC数据库。
5.17.1. ODBC监视资源的注意事项¶
选择的监视级别 |
事先创建监视表格 |
---|---|
级别1(在select中的监视) |
有必要 |
级别2(在update/select中的监视) |
没有必要 |
可按以下步骤创建监视表格。
(以监视表格名为odbcwatch时为例):
sql> create table ODBCWATCH (num int not null primary key);
sql> insert into ODBCWATCH values(0);
sql> commit;
5.17.2. ODBC监视资源的监视方法¶
ODBC监视资源按从以下监视级别中选择的级别进行监视。
- 级别1(在select中的监视)该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select )。作为监视结果,如果出现以下情况则视为异常。
连接数据库失败时
在响应SQL语句响应中通知异常时
- 级别2(在update/select中的监视)该监视也进行监视表格的更新。通过SQL语句,对最大10 行数值数据进行写入和读入操作。监视的开始以及结束时进行监视表格的作成和删除。对监视表格发行的SQL文为create / update / select / drop。作为监视结果,如果出现以下情况则视为异常。
数据库连接失败时
在SQL语句的响应中通知有异常时
写入和读入的数据不一致时
5.17.3. 监视 (固有) 标签页¶
监视级别
从以下选项中选择一项。请务必进行设置。
级别1(在select中的监视)该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。 级别2(在update/select中的监视)该监视还对监视表格进行更新。对监视表格执行的SQL语句为(create /update / select /drop)。默认值 : 级别2(在update/select 中的监视)
数据源名 (255字节以内)
指定要监视的数据源名。请务必设置。
默认值 : 无
用户名 (255字节以内)
指定登录数据库时使用的用户名。如果在设置数据源时已经设置用户名,则不需要指定。
默认值 : 无
密码 (255字节以内)
指定登录数据库时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。
默认值 : 无
监视表名 (255字节以内)
指定在数据库上创建的用于监视的表格的名称。请务必设置。因为该表需要创建和删除,请注意不要与运行时用到的表格重名。另外,还需要注意不要与SQL语句的保留字重复。根据数据库的式样,监视的表名有不能设置的字符。详细请确认数据库的式样。默认值 : ODBCWATCH
5.18. 设置Oracle监视资源¶
Oracle监视资源是监视服务器上运行的监视Oracle数据库的监视资源。
5.18.1. Oracle监视资源的注意事项¶
参数中"操作系统认证"复选框未选中时,通常以密码认证方式监视Oracle。但是在以下条件下,以操作系统认证方式监视Oracle时,将忽略用户名和密码的设置。
参数中认证方式指定为SYSDBA。
Administrator用户属于Windows OS的ora_dba组。
指定为参数用户名的用户默认为sys,但另外创建用于监视的用户时,需授予各监视级别以下访问权限。(不授予sysdba权限时)
监视级别 |
必要的权限 |
---|---|
级别0(数据库状态) |
对于V$PROCESS的SELECT权限/对于V$INSTANCE的SELECT权限 |
级别1(在select中的监视) |
对于V$PROCESS的SELECT权限/对于监视表格的SELECT权限 |
级别2(在update/select中的监视) |
对于V$PROCESS的SELECT权限/对于CREATE TABLE/DROP ANY TABLE/监视表格的INSERT权限/对于监视表格的UPDATE权限/对于监视表格的SELECT权限 |
针对每个监视操作,Oracle自身将会输出运行日志等。请根据需要,通过Oracle的设置进行控制。
选择的监视级别 |
事先创建监视表格 |
---|---|
级别0(数据库状态) |
无必要 |
级别1(在select中的监视) |
有必要 |
级别2(在update/select中的监视) |
无必要 |
可按以下步骤创建监视表格。
(以监视表格名为orawatch时为例):
sql> create table ORAWATCH (num int not null primary key);
sql> insert into ORAWATCH values(0);
sql> commit;
※请创建指定为参数用户名的用户架构。
5.18.2. Oracle监视资源的监视方法¶
Oracle监视资源按从以下监视级别中选择的级别进行监视。
- 级别0(数据库状态)参考Oracle的管理表格(V$INSTANCE表格),确认DB的状态(实例的状态)。该监视为简单监视,不对监视表格执行SQL语句。作为监视结果,如果出现以下情况则视为异常。
(DB(实例)为未启动状态(MOUNTED,STARTED)时
- 级别1(在select中的监视)该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。作为监视结果,如果出现以下情况则视为异常。
连接数据库失败时
在响应SQL语句响应中通知异常时
- 级别2(在update/select中的监视)该监视也进行监视表格的更新。通过SQL语句,对最大10 行数值数据进行写入和读入操作。监视的开始以及结束时进行监视表格的作成和删除。对监视表格发行的SQL文为create / update / select / drop。作为监视结果,如果出现以下情况则视为异常。
数据库连接失败时
在SQL语句的响应中通知有异常时
写入和读入的数据不一致时
5.18.3. 监视 (固有) 标签页¶
监视方式
选择作为监视对象的Oracle功能。
监视监听器和实例按照设置的监视级别,监视数据库的连接,参照及更新等操作。 只监视监听器执行Oracle的命令(tnsping ),监视监听器是否在运行。需在监视资源属性中预先设置ORACLE_HOME。若没有设置ORACLE_HOME,则只对指定为连接字符串的目标进行连接处理动作的监视。在连接异常时,利用重启监听器的服务来尝试复原时使用。若选择本设置,则会忽略监视级别的设置。 只监视实例不经过监听器而直接连接(BEQ连接)数据库,按照设置的监视级别,监视数据库的连接,参照,更新等操作。需在监视资源属性中预先设置ORACLE_HOME。本方法用于监听不经过监听器而直接监视实例来设置复归操作。若没有设置ORACLE_HOME,则会连接指定为连接字符串的目标,当连接处理异常时选择忽略。本方法可与[只监视监听器]方法中的Oracle监视资源并用,可以对连接处理以外的异常进行的复原动作进行设置。默认值:监视监听器和实例
监视级别
从以下选项中选择一项。监视方式为"只监视监听器"时,会忽略本设置。
级别0(数据库状态)参考Oracle的管理表格(V$INSTANCE表格),确认DB的状态(实例的状态)。该监视为简单监视,不对监视表格执行SQL语句。 级别1(在select中的监视)该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。 级别2(在update/select中的监视)该监视还对监视表格进行更新。对监视表格执行的SQL语句为( create / update / select / drop )。默认值 : 级别2 (在update/select中的监视)
连接字符串 (255字节以内)
指定要监视的数据库的连接字符串。请务必设置。监视方式为"只监视实例"时,设置ORACLE_SID。
监视方式
ORACLE_HOME
连接字符串
监视级别
监视监听器和实例
不输入
指定连接字符串
按设置的级别监视
只监视监听器
已输入时,使用Oracle的命令监视
指定连接字符串
忽略级别设置
未输入时,确认经由监听器的实例连接
指定连接字符串
忽略级别设置
只监视实例
已输入时,通过BEQ连接确认实例
指定ORACLE_SID
按设置的级别监视
未输入时,确认经由监听器的实例
指定连接字符串
按设置的级别监视
默认值 :无连接字符串的默认值
用户名 (255字节以内)
指定登录数据库时使用的用户名。作为监视方法选择[只监视监听器]以外时,以及使用OS认证时,请务必设置。
默认值:sys
密码 (255字节以内)
指定登录数据库时使用的密码。点击[Change]按钮,显示指定密码的对话框,可在此进行设置。
默认值:无
操作系统认证
指定登录Oracle时的认证方式。需要与Oracle的设置保持一致。
选中复选框使用OS认证。 不选中复选框 (默认值)使用数据库认证。
认证方式
指定登录Oracle时的用户权限。需要与指定的用户名的权限保持一致。
SYSDBA(默认值)使用SYSDBA连接。 DEFAULT使用普通用户权限连接。
监视表名 (255字节以内)
指定在数据库上创建的用于监视的表格的名称。请务必设置。因为该表需要创建和删除,请注意不要与运行时用到的表格重名。另外,还需要注意不要与SQL语句的保留字重复。根据数据库的式样,监视的表名有不能设置的字符。详细请确认数据库的式样。默认值:ORAWATCH
ORACLE_HOME (255字节以内)
指定ORACLE_HOME设置的路径名。需要设置为[/]开头的名字。当监视方式为"只监视监听器","只监视实例"时使用。
默认值 : 无
字符编码
选择Oracle的字符编码。
(Following the setting of the application)(默认值)选择安装在服务器上的Oracle的字符编码 AMERICAN_AMERICA.US7ASCII使用普通用户权限连接。Oracle的语言是日语或英语以外时,选择[AMERICAN_AMERICA.US7ASCII]。
发生故障时收集应用程序的详细信息
指定查出Oracle数据库异常时是否收集Oracle的详细信息。
选中复选框收集Oracle的详细信息。 不选中复选框(默认值)不收集Oracle的详细信息。使用本功能时,由于利用本地系统帐户执行为收集信息的数据库处理,因此,本地系统帐户需要DBA权限。收集的详细信息文件存放在EXPRESSCLUSTER X SINGLESERVERSAFE安装目录的
work\rm\资源名\errinfo.cur
文件夹下。多次收集的情况下,之前收集的文件夹的名字重命名为errinfo.1,errinro.2等,并且只存放最新的5次收集的信息文件。注解
在收集过程中,因为EXPRESSCLUSTER X SINGLESERVERSAFE停止等原因造成Oracle服务停止的场合,有可执行无法正确收集信息文件。收集过程中请不要执行停止组等手动操作。根据手动操作的时机,之后的监视处理可执行不能正常动作。
收集超时(1~9999)
按秒单位来指定收集详细信息时的超时时间。
默认值:120
Oracle初始化或关闭时当作错误
在运行本功能时,查出Oracle启动中或关闭中的状态,则立即判定为监视错误。
与Oracle Clusterware等联动运行中自动重启Oracle时,请关闭此功能。即使Oracle启动中或关闭中的状态也判定为监视正常。但是,持续一个小时以上的Oracle启动中或关闭中的状态时,则判定为监视错误。默认值:关闭
5.19. 设置POP3监视资源¶
POP3监视资源用于监视服务器上运行的POP3服务。它监视POP3协议,而不是监视特定的应用程序。因此,可以对使用POP3协议的各种应用程序进行监视。
5.19.1. POP3监视资源的注意事项¶
请在监视对象资源中指定启动POP3服务器的服务资源或脚本资源等。启动监视对象资源后,开始监视。但如果启动监视对象资源后,发生POP3不能立即运行等情况,请通过[开始监视的等待时间]进行调整。
在对虚拟机资源进行控制的虚拟设备的目标OS上运行的POP3服务器进行监视时,请指定虚拟机资源为监视的对象资源,将虚拟机资源启动后到POP3服务器能够连接之前的足够长的等待时间设置成[监视开始等待时间]。
针对每个监视操作,POP3自身会输出运行日志等。请根据需要,通过POP3的设置进行控制。
5.19.2. POP3监视资源的监视方法¶
POP3服务器连接失败时
在对命令的响应中通知有异常时
5.19.3. 监视 (固有) 标签页¶
IP地址(255字节以内)
指定要监视的POP3服务器的IP地址。请务必指定。由于一般情况下连接到在自身服务器中工作的POP3服务器上,因此设置回环地址(127.0.0.1)。但因POP3服务器设置对能够连接的地址进行了限制时,设置可连接的地址(浮动IP地址等)。此外,对在虚拟机资源中进行控制的虚拟设备的目标OS上工作的POP3服务器进行监视时,设置虚拟设备的IP地址。默认值 : 127.0.0.1
端口号 (1~65535)
指定要监视的POP3的端口号。请务必指定。
默认值 : 110
用户名 (255字节以内)
指定登录POP3时使用的用户名。
默认值 : 无
密码 (255字节以内)
指定登录POP3时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。
默认值 : 无
认证方式
选择登录POP3时使用的认证方式。需要与使用的POP3的设置保持一致。
APOP(默认值)使用APOP命令的加密认证方式。 USER/PASS使用USER/PASS命令的明文方式。
5.20. 设置PostgreSQL监视资源¶
PostgreSQL监视资源是用于监视服务器上运行的PostgreSQL数据库的监视资源。
5.20.1. PostgreSQL监视资源的注意事项¶
关于已经进行操作确认的PostgreSQL/PowerGres版本,请参考"5. 监视资源的详细信息"的"5.1.2. 监视选项的动作确认完毕应用程序信息"。
因为监视处理使用PostgreSQL/PowerGres的库,所以需要在执行监视的服务器上安装用于接口的DLL (LIBPQ.DLL)。执行PostgreSQL的监视时,请在环境变量中设置该DLL的路径。
请在监视对象资源中指定启动PostgreSQL/PowerGres的服务资源。启动监视对象资源后,开始监视。但如果启动监视对象资源后,发生数据库不能立即运行等情况,请通过[开始监视的等待时间]进行调整。
在对虚拟机资源进行控制的虚拟设备的目标OS上运行的PostgreSQL数据库进行监视时,请指定虚拟机资源为监视的对象资源,将虚拟机资源启动后到PostgreSQL数据库能够连接之前的足够长的等待时间设置成[监视开始等待时间]。
开始监视时,创建监视表。因为失效切换组停止导致监视也停止时,会删除监视表。监视暂时中断等情况下,不会删除监视表。另外,由于系统异常等导致服务器在失效切换组停止前发生宕机等现象时,不会删除监视表,所以下次开始监视时,会显示"a monitor table exists"的错误消息,这不属于异常。
针对每个监视操作,PostgreSQL/PowerGres自身将会输出运行日志等。请根据需要,通过PostgreSQL/PowerGres的设置进行控制。
PostgreSQL因为是开放源码软件 (OSS),虽然进行了运行确认,但是不保证其运行。请分别进行测试后再运行。
因OS和PostgreSQL版本的原因,执行PostgreSQL监视时,可执行出现找不到程序库的错误输出。此时,请在系统环境系数的PATH上添加PostgreSQL的bin之后,请执行集群重启。
环境系数添加PATH时(下面以PostgreSQL9.6的bin的PATH为例)
利用本监视资源时,PostgreSQL的日志里会输出以下信息。由于这是监视处理过程中的输出信息,没什么问题。
YYYY-MM-DD hh:mm:ss JST moodle moodle LOG: statement: DROP TABLE psqlwatch YYYY-MM-DD hh:mm:ss JST moodle moodle ERROR: table "psqlwatch" does not exist YYYY-MM-DD hh:mm:ss JST moodle moodle STATEMENT: DROP TABLE psqlwatch YYYY-MM-DD hh:mm:ss JST moodle moodle LOG: statement: CREATE TABLE psqlwatch (num INTEGER NOT NULL PRIMARY KEY) YYYY-MM-DD hh:mm:ss JST moodle moodle NOTICE: CREATE TABLE / PRIMARY KEY will create implicit index "psqlwatch_pkey" for table "psql watch" YYYY-MM-DD hh:mm:ss JST moodle moodle LOG: statement: DROP TABLE psqlwatch
选择的监视级别
事先创建监视表格
级别1(在select中的监视)
有必要
级别2(在update/select中的监视)
没有必要
可按以下步骤创建监视表格。
(以监视表格名为psqlwatch时为例)
sql> create table PSQLWATCH (num int not null primary key); sql> insert into PSQLWATCH values(0); sql> commit;
5.20.2. PostgreSQL监视资源的监视方法¶
PostgreSQL监视资源按从以下监视级别中选择的级别进行监视。
- 级别1(在select中的监视)该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。作为监视结果,如果出现以下情况则视为异常。
数据库连接失败时
SQL语句响应中通知异常时
- 级别2(在update/select中的监视)该监视也进行监视表格的更新。通过SQL语句,对最大10 行数值数据进行写入和读入操作。监视的开始以及结束时进行监视表格的作成和删除。对监视表格发行的SQL文为create / update / select / reindex / drop / vacuum。作为监视结果,如果出现以下情况则视为异常。
数据库连接失败时
在SQL语句的响应中通知有异常时
写入和读入的数据不一致时
5.20.3. 监视 (固有) 标签页¶
监视级别
从以下选项中选择一项。请务必进行设置。
级别1(在select中的监视)该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。 级别2(在update/select中的监视)该监视还对监视表格进行更新。对监视表格执行的SQL语句为(create /update / select / reindex / drop / vacuum )。默认值 : 级别2(在update/select中的监视)
数据库名 (255字节以内)
指定监视的数据库名。请务必指定。
默认值 : 无
IP地址
指定监视的数据库服务器的IP地址。请务必指定。由于一般情况下连接到在自身服务器中工作的PostgreSQL服务器上,因此设置回环地址(127.0.0.1)。但对在虚拟机资源控制的虚拟设备的目标OS上运行的PostgreSQL数据库进行监视时,设置虚拟设备的IP地址。默认值 : 127.0.0.1
端口号
指定监视的PostgreSQL的端口号。请务必指定。
默认值 : 5432
用户名 (255字节以内)
指定登录数据库时使用的用户名。
默认值 : postgres
密码 (255字节以内)
指定登录数据库时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。
默认值 : 无
监视表名 (255字节以内)
指定在数据库上创建的用于监视的表格的名称。请务必指定。因为该表需要创建和删除,请注意不要与运行时用到的表格重名。另外,还需要注意不要与SQL语句的保留字重复。根据数据库的式样,监视的表名有不能设置的字符。详细请确认数据库的式样。默认值 : PSQLWATCH
在PostgreSQL的初始化中或关机中出错
将本功能设置为有效时,若检测出PostgreSQL的初始化中或关机中的状态,则马上变为监视错误。将本功能设置为无效时,即使检测出PostgreSQL的初始化中或关机中的状态也变为监视正常。但是,若持续保持PostgreSQL的初始化中或关机中的状态1个小时以上,则变为监视错误。默认值 : 有效
5.21. 设置SMTP监视资源¶
SMTP监视资源对服务器上运行的SMTP服务进行监视。它监视SMTP协议,而不是监视特定的应用程序。因此,可以对使用SMTP协议的各种应用程序进行监视。
5.21.1. SMTP监视资源的注意事项¶
5.21.2. SMTP监视资源的监视方法¶
SMTP服务器连接失败时
在对命令的响应中通知有异常时
5.21.3. 监视 (固有) 标签页¶
IP地址
指定监视的SMTP服务器的IP地址。请务必指定。由于一般情况下连接到在自身服务器中工作的SMTP服务器上,因此设置回环地址(127.0.0.1)。但对在虚拟机资源控制的虚拟设备的目标OS上运行的SMTP数据库进行监视时,设置虚拟设备的IP地址。默认值 : 127.0.0.1
端口号
指定监视的SMTP的端口号。请务必指定。
默认值 : 25
用户名 (255字节以内)
指定登录SMTP时使用的用户名。如果没有指定用户名,则不执行SMTP认证。
默认值 : 无
密码 (255字节以内)
指定登录SMTP时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。
默认值 : 无
认证方式
指定登录SMTP时使用的认证方式。需要与使用的SMTP的设置保持一致。
CRAM-MD5(默认值)使用CRAM-MD5的密码认证方式。 LOGIN使用LOGIN命令的明文方式。
邮件地址 (255字节以内)
指定监视时的邮件地址。如果不指定,仅通过运行确认命令进行监视。内部执行使用伪邮件地址的命令。如果指定,则对指定的地址实际发送邮件进行监视。建议准备一个专门用于监视的邮件地址来指定。默认值 : 无
5.22. 设置SQL Server监视资源¶
SQL Server监视资源用于监视服务器上运行的SQL Server数据库。
5.22.1. SQL Server监视资源的注意事项¶
针对每个监视操作,SQL Server自身会输出运行日志等。请根据需要,通过SQL Server的设置进行控制。
选择的监视级别 |
事先创建监视表格 |
---|---|
级别0(数据库状态) |
无必要 |
级别1(在select中的监视) |
有必要 |
级别2(在update/select中的监视) |
无必要 |
可按以下步骤创建监视表格。
(以监视表格名为sqlwatch时为例)
SET IMPLICIT_TRANSACTIONS关闭时
sql> create table SQLWATCH (num int not null primary key) sql> go sql> insert into SQLWATCH values(0) sql> go
SET IMPLICIT_TRANSACTIONS打开时
sql> create table SQLWATCH (num int not null primary key) sql> go sql> insert into SQLWATCH values(0) sql> go sql> commit sql> go
5.22.2. SQL Server监视资源的监视方法¶
SQL Server监视资源按从以下监视级别中选择的级别进行监视。
- 级别0(数据库状态)参照SQL Server的管理表格,确认DB的状态。该监视为简单监视,不进行SQL语句的发行。作为监视结果,如果出现以下情况则视为异常。
数据库的状态为非通信状态
- 级别1(在select中的监视)该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。作为监视结果,如果出现以下情况则视为异常。
连接数据库失败时
在响应SQL语句过程中接到异常通知时
- 级别2(在update/select中的监视)该监视还对监视表格进行更新。通过SQL语句,对最大为10位的数值数据进行写入和读入操作。监视开始,结束时将创建,删除监视表格。对监视表格执行的SQL语句为(create / update / select / drop)。作为监视结果,如果出现以下情况则视为异常。
连接数据库失败时
在响应SQL语句过程中接到异常通知时
写入和读入的数据不一致时
5.22.3. 监视 (固有) 标签页¶
监视级别
从以下选项中选择一项。请务必进行设置。
级别0(数据库状态)参照SQL Server的管理表格进行DB的状态确认。是对监视表格不发行SQL命令的简单监视。 级别1(在select中的监视)该监视只对监视表格进行参照。对监视表格执行的SQL语句为(select)。 级别2(在update/select中的监视)该监视还对监视表格进行更新。对监视表格执行的SQL语句为(create /update / select /drop )。默认值 : 级别2(在update/select中的监视)
数据库名 (255字节以内)
指定监视的数据库名。请务必设置。
默认值 : 无
实例名 (255字节以内)
指定监视的数据库的实例名。请务必设置。对在虚拟机资源进行控制的虚拟设备的客机OS上运用的SQL Server数据库进行监视时,也需要以[服务器名\接口名]的格式指定虚拟设备的服务器名。默认值 : MSSQLSERVER
用户名 (255字节以内)
指定登录数据库时使用的用户名。如果没有指定用户名,则使用Windows认证。
默认值 : SA
密码 (255字节以内)
指定登录数据库时使用的密码。点击[更改]按钮,显示指定密码的对话框,可在此进行设置。
默认值 : 无
监视表名 (255字节以内)
指定在数据库上创建的用于监视的表格的名称。请务必设置。因为该表需要创建和删除,请注意不要与运行时用到的表格重名。另外,还需要注意不要与SQL语句的保留字重复。根据数据库的式样,监视的表名有不能设置的字符。详细请确认数据库的式样。默认值 : SQLWATCH
ODBC驱动名 (255字节以内)
设置[开始]菜单->[管理工具] ->[数据源(ODBC)]的[驱动]标签页中显示的对象数据库设备名。SQL Server 2014时请选择或直接输入SQL Server Native Client 11.0SQL Server 2016,SQL Server 2017时请选择或直接输入ODBC Driver 13 for SQL ServerSQL Server 2019时请选择或直接输入ODBC Driver 17 for SQL Server默认值 : ODBC Driver 13 for SQL Server
5.23. 设置Tuxedo监视资源¶
Tuxedo监视资源用于监视服务器上运行的Tuxedo。
5.23.1. Tuxedo监视资源的注意事项¶
5.23.2. Tuxedo监视资源的监视方法¶
应用程序服务器的连接或对状态取得的应答中通知异常时
5.23.3. 监视 (固有) 标签页¶
应用服务器名 (255字节以内)
设置要监视的应用程序服务器名。请务必设置。
默认值 : BBL
TUXCONFIG文件 (1023字节以内)
设置Tuxedo的配置文件名。请务必设置。
默认值 : 无
5.24. 设置Weblogic监视资源¶
Weblogic监视资源用于监视服务器上运行的Weblogic。
5.24.1. Weblogic监视资源的注意事项¶
5.24.2. Weblogic监视资源的监视方法¶
Weblogic监视资源进行以下监视。
监视方式:选择REST API 时
WebLogic提供了称为WebLogic RESTful管理服务的REST API。
通过此REST API执行应用程序服务器监视。
作为监视结果,当以下应答通知异常时都视为异常。
REST API 的应答中通知异常时
注解
监视方式:与WLST相比,可以减少监视时应用程序服务器的CPU负荷。
监视方式:选择WLST时
利用[weblogic.Admin]命令或[weblogic.WLST]命令执行connect,执行应用程序服务器监视。[weblogic.Admin]命令可执行时,执行[weblogic.Admin]命令。[weblogic.Admin]命令不可执行时,执行[weblogic.WLST]命令。
作为监视结果,如果出现以下情况则视为异常。
connect应答中通知异常时
根据不同的[认证方式]执行以下的动作。
DemoTrust: 使用WebLogic的Demo用认证文件的SSL认证方式
CustomTrust: 使用用户做成的认证文件的SSL认证方式
Not Use SSL: 不执行SSL认证
5.24.3. 监视 (固有) 标签页¶
IP地址 (80字节以内)
设置要监视的服务器的IP地址。请务必设置。
默认值 : 127.0.0.1
端口号 (1~65535)
设置连接服务器时的端口号。请务必设置。
默认值 : 7002
监视方式
设置服务器的监视方式。请务必设置。
默认值:REST API
协议
设置要监视的服务器的协议。[监视方式]中选择REST API时,请务必选择。
默认值:HTTP
用户名 (255字节以内)
设置WebLogic的用户名。[监视方式]中选择REST API时,请务必输入。
默认值:weblogic
密码 (255字节以内)
设置WebLogic的密码。[监视方式]中选择REST API时,如有必要请输入。
默认值:无
账户隐藏
直接指定用户名和密码时请指定[关闭],文件中记述时请指定[开]。请务必设置。
默认值 : [关闭]
配置文件 (1023字节以内)
设置保存用户信息的文件名。帐户Shadow为[开]时,请务必设置。
默认值 : 无
注册文件名 (1023字节以内)
以全路径的形式设置用于保存访问配置文件路径的密码的文件名。帐户Shadow为[开]时,请务必设置。
默认值 : 无
用户名 (255字节以内)
设置WebLogic的用户名。帐户Shadow为[关闭]时,请务必设置。
默认值 :weblogic
密码 (255字节以内)
设置WebLogic的密码。
默认值 : 无
认证方式
设置连接应用程序服务器时的认证方式。请务必设置。如果想使用SSL通信进行监视时,[认证方式]请指定为[DemoTrust]或[CustomTrust]。是否选择[DemoTrust]或[CustomTrust]取决于Weblogic Administraion Console上的设置。如果Weblogic Administraion Console的[Keystore]是[Demo Identity and Demo Trust],请指定[DemoTrust]。 在这种情况下,不必设置[密钥文件]。如果Weblogic Administraion Console的[Keystore]是[Custom Identity and Custom Trust],请指定[CustomTrust]。在这种情况下,必须设置[密钥文件]。默认值 : DemoTrust
密钥文件 (1023字节以内)
设置SSL认证时的认证文件。认证方式为[CustomTrust]时,请务必设置。请设定为Weblogic Administraion Console上[Custom Identity Keystore]指定的文件。
默认值 : 无
安装路径 (255字节以内)
设置WebLogic的安装路径。请务必设置。
默认值 :
C:\Oracle\Middleware\Oracle_Home\wlserver
附加命令参数(1023字节以内)
变更向[webLogic.WLST]传递的选项时设定。
默认值:-Dwlst.offline.log=disable -Duser.language=en_US
5.25. 设置WebOTX监视资源¶
WebOTX监视资源是用于监视服务器上运行的WebOTX的监视资源。
5.25.1. WebOTX监视资源的注意事项¶
系统环境变量PATH中添加otxadmin.bat命令所在的位置。
在[安装路径]中设置WebOTX Application Server的安装路径(例. C:\WebOTX)。
5.25.2. WebOTX监视资源的监视方法¶
取得的应用程序服务器的状态中通知异常时
5.25.3. 监视 (固有) 标签页¶
连接目的端 (255字节以内)
设置要监视的服务器的服务器名。请务必设置。
默认值 : localhost
端口号 (1~65535)
设置连接服务器时的端口号。请务必设置。监视WebOTX用户域时,请设置WebOTX域的管理端口号。管理端口号为创建域时<域名>.properties的domain.admin.port处设置的端口号。关于<域名>.properties 的详细请参考WebOTX的文档。默认值 : 6212
用户名 (255字节以内)
设置WebOTX的用户名。请务必设置。监视WebOTX用户域时,请设置WebOTX域的登录用户名。默认值 :无
密码 (255字节以内)
设置WebOTX的密码。
默认值 : 无
安装路径(1023 字节以内)
设置WebOTX Application Server 的安装路径。监视WebOTX Application Server V10.1 以上版本请务必设置。
默认值 : 无
5.26. 设置Websphere监视资源¶
Websphere监视资源用于监视服务器上运行的Websphere。
5.26.1. Websphere监视资源的注意事项¶
5.26.2. Websphere监视资源的监视方法¶
取得的应用程序服务器的状态中通知异常时
5.26.3. 监视 (固有) 标签页¶
应用服务器名 (255字节以内)
设置监视的应用程序服务器名。请务必设置。
默认值 : server1
配置文件名 (1023字节以内)
设置Websphere的Profile名。请务必设置。
默认值 : default
用户名 (255字节以内)
设置Websphere的用户名。请务必设置。
默认值 :无
密码 (255字节以内)
设置Websphere的密码。
默认值 : 无
安装路径 (255字节以内)
设置WebSphere的安装路径。请务必设置。
默认值 :
C:\Program Files\IBM\WebSphere\AppServer
5.27. 设置JVM监视资源¶
JVM监视资源监视在服务器上操作的Java VM,或监视应用程序服务器使用的资源利用信息。
5.27.1. JVM监视资源的注意事项¶
Monitor jraw is in the warning status. (100 : not ready for monitoring.)
5.27.2. JVM监视资源的监视方法¶
作为监视结果,如果出现以下情况则视为异常。
无法连接监视对象的Java VM或应用程序服务器时
获取的Java VM或应用程序服务器的资源使用量规定次数(异常判定次数)超出客户定义的界限值时
出现以下监视结果则视为恢复正常。
重新开始复原操作后的监视时低于临界值时
注解
Cluster WebUI的[收集集群日志]不收集监视对象(WebLogic Server和WebOTX)的设置文件及日志文件。
超过基本界限值时的操作如下。
连续发生异常时情况如下。
5.27.3. LB联动(存活侦测功能)¶
对象LB:HTML文件中带存活侦测功能的LB
JVM监视资源可进行LB联动。下面以监视对象的应用程序服务器是WebOTX时为例说明。LB联动可提供存活侦测功能及监视对象Java VM的负载计算功能。
与BIG-IP Local Traffic Manager联动时,请参考"5.27.5. BIG-IP Local Traffic Manager联动"。
均衡节点指负载均衡对象服务器,均衡节点模块指各均衡节点上安装的模块。分布式节点模块包含在InterSec/LB400*中。请参考《InterSec/LB400* 用户指南》和各LB手册。
若使用本功能,请在Cluster WebUI的[集群的属性]->[JVM监视标签页]->[LB联动设置]对话框中设置。
该服务器构筑LB的负载均衡系统时,若JVM监视检测出WebOTX的故障(例如:采集信息超过设置的界限值),则将[HTML文件名]中设置的HTML文件重命名为[HTML重命名目标文件名]中设置的文件名。
JVM监视对HTML文件名进行重命名后,等待20秒(待机时间)后重新启动WebOTX。待机是为了防止在LB断开均衡节点前重新启动WebOTX。
JVM监视在WebOTX重启后检测出WebOTX的正常状态时(例如:连接后的采集信息未超出设置的界限值),将[HTML重命名目标文件名]中设置的HTML文件改回[HTML文件名]中设置的文件名。
LB会定期对HTML文件执行存活侦测,但若存活侦测失败,则均衡节点判定为宕机,LB会将其断开。InterSec /LB400*时,存活侦测的间隔,存活侦测的超时,存活侦测中判定为节点宕机的重试次数,请分别从LB的[ManagementConsole]中[LoadBalancer]->[系统信息]内的存活侦测(均衡节点)间隔参数,HTTP存活侦测超时值参数,存活侦测(均衡节点)次数参数中进行设置。InterSec /LB400*以外的LB的设置,请参阅各使用说明书。
请参考以下提示设置各参数。
待机时间20秒>=(存活侦测(均衡节点)间隔+HTTP存活侦测超时值)×存活侦测(均衡节点)次数
请参考《InterSec /LB400*用户指南》。
负载均衡器的JVM监视资源存活侦测功能设置
存活侦测(均衡节点)间隔: 10秒
HTTP存活侦测超时值: 1秒
存活侦测(均衡节点)次数: 2次
需要LB侧进行设置。
5.27.4. LB联动(监视对象Java VM的负载计算功能)¶
对象LB:InterSec /LB400*
要使用本功能,需要以下的设定。与通过LB的CPU负载进行重要性附加的功能联动。
[属性]-[监视(固有)]标签页->[调整]属性-[内存]对话框-[监视堆使用率]-[区域全体]
[属性]- [监视(固有)]标签页->[调整]属性-[LB联动]对话框-[监视内存Pool]
同时,按以下步骤,将均衡节点模块安装到各服务器后,针对均衡节点模块执行设定。
注解
请以拥有Administrator权限的账户执行。
请在注册编辑器中设置以下的注册表键值。
X86_64版
对应的注册编辑器
HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\NEC\IPLB4\Parameter\JVMSaver\ 下属 |
含义
|
范围
|
省略指定时的默认值
|
---|---|---|---|
Enabled |
指定本功能禁用/启用。 |
0~1
0:禁用功能
1:启用功能
|
0 |
JVMSaverCheckInterval |
以秒为单位,对计算监视对象Java VM负载的命令执行间隔进行指定。 |
1~2147483646 |
120(秒) |
ActionTimeout |
以秒为单位,对计算监视对象Java VM负载的命令之超时值进行指定。 |
1~2147483646 |
1800(秒) |
CommandPath |
对计算监视对象Java VM负载的命令路径进行指定。 |
请在以下路径中指定。
<EXPRESSCLUSTER X SingleServerSafe安装路径>\ha\jra\bin\clpjra_lbadmin.bat weight |
无 |
Java VM负载(%)=当前内存使用量(MB)×100÷阈值(MB)
在安装于操作服务器上的均衡节点模块中,JVM监视会定期执行命令,比较所采集的监视对象Java VM的负载与另采集的CPU负载,将较高的值作为CPU负载并通知LB。LB根据均衡节点的CPU负载情况,将信息(要求)分散到最适合的服务器。
均衡节点模块的负载计算功能设置
命令执行间隔: JVMSaverCheckInterval(秒)
要在均衡节点模块中反映JVM监视的设置,请重新启动均衡模块。将监视对象Java VM的负载计算功能从有效变为无效,由或者从无效变为有效时,也需要重新启动均衡模块。
Windows 版时,请重新启动[开始]菜单->[控制面板]->[管理工具]->[服务]的[plb4]服务。
5.27.5. BIG-IP Local Traffic Manager联动¶
对象LB:BIG-IP Local Traffic Manager
JVM监视资源可以与BIG-IP LTM进行联动。下面,将监视对象的应用服务器作为Tomcat进行说明。通过与BIG-IP LTM联动,提供均衡节点的控制功能和监视对象Java VM的负载计算功能。
通过BIG-IP系列API(iControl),实现BIG-IP LTM与JVM监视资源的联动。
均衡节点是指负载分散对象服务器,联动模块是指安装各均衡节点的模块。Java Resource Agent包括联动模块。
使用均衡节点的控制功能时,请执行Cluster WebUI的[集群的属性]->[JVM监视标]签页->[LB联动设定]对话框,JVM监视资源的[属性]-[监视(固有)]标签页-[调整]属性-[LB联动]标签页的设置。
使用监视对象Java VM的负载计算功能时, 请执行Cluster WebUI的[集群的属性]->[JVM监视]标签页->[LB联动设定]对话框的设置。
BIG-IP LTM联动的错误消息,在JVM运用日志中输出如下内容。请详阅《EXPRESSCLUSTER X 参考指南》-"错误消息一览表"的"JVM监视资源的日志输出消息"。
Error: Failed to operate clpjra_bigip.[错误代码]
由此服务器构筑BIG-IP LTM负载分散系统的情况下,JVM监视检测出Tomcat的故障动态 (例:大于采集信息设定的阈值) 时,使用iControl将BIG-IP LTM的均衡节点状态从enable更改为disable。
JVM监视更改BIG-IP LTM的均衡节点状态后,等到均衡节点的连接数变0为止。等待后,通过JVM监视资源的[属性]-[监视(固有)]标签页-[调整]属性-[LB联动]标签页来执行指定的[重启命令]。即使经过JVM监视资源的[属性]-[监视(固有)]标签页-[调整]属性-[LB联动]标签页来指定[超时],均衡节点的连接数也没有变0时,不能执行由[重启命令]指定的动作。
JVM监视检测出Tomcat的故障恢复时,使用iControl将BIG-IP LTM的均衡节点状态从disable更改为enable。此时,不能通过JVM监视资源的[属性]-[监视(固有)]标签页-[调整]属性-[LB联动]标签页来指定的[重启命令]执行动作。
BIG-IP LTM的均衡节点状态为disable时,判定为均衡节点挂掉,BIG-IP LTM执行均衡节点的隔离。使用均衡节点的控制功能时,BIG-IP LTM侧无需设定。
BIG-IP LTM的均衡节点状态以JVM监视的故障查出和故障恢复为契机而更改。因此,以JVM监视以外为契机的失效切换时,即使失效切换后BIG-IP LTM的均衡节点状态也有可执行为enable的情况。
在JVM监视中,从采集的Java内存信息算出监视对象Java VM的负载。通过以下等式计算Java VM负载。阈值,是指Java堆大小乘以由[监视(固有)]标签页-调整属性- [内存]标签页-[监视堆使用率]-[区域全体]设定的使用率而算出的值。
Java VM负载(%)=当前内存使用量(MB)×100÷阈值(MB)
在动作中服务器上安装的联动模块上,JVM监视定期执行命令,将采集的监视对象Java VM的负载通知给BIG-IP LTM。BIG-IP LTM根据均衡节点的Java VM负载状况,将通信量(要求)分散给最合适的服务器。
在EXPRESSCLUSTER侧的Cluster WebUI的编辑模式中进行以下设置。
- JVM监视资源[属性]-[监视(固有)]标签页-[调整]属性-[负载均衡器联动]标签页打开[监视内存Pool]。
- 自定义监视资源[属性]-[监视(共通)]标签页打开[监视时间]-[不间断监视]单选按钮。[属性]-[监视(固有)]标签页选择[用Cluster WebUI创建的脚本]。选择[文件]-[编辑],添加记录下面的强调部分。
rem ***************************************** rem * genw.bat * rem ***************************************** echo START "<EXPRESSCLUSTER的安装路径>\ha\jra\bin\clpjra_bigip.exe" weight echo EXIT
打开[监视类型]-[同步]单选按钮。
BIG-IP LTM侧设定在BIG-IP Configration Utility的LocalTrafic] - [Pools:PoolList] - [对应的pool] - [Members] - [LoadBalancing] - [ Load Balancing Method]上指定[Ratio(node)]。
负载计算功能设置
命令执行间隔: [属性] - [监视(共通)]标签页 - [间隔] 秒
5.27.6. 何谓JVM统计日志¶
JVM统计日志是保存了JVM监视资源所集的监视对象Java VM的统计信息的文件。文件格式为csv格式。目标位置如下所示。
<EXPRESSCLUSTER X SingleServerSafe安装路径>\log\ha\jra\*.stat
监视项目和相应的JVM统计日志如下所示。
监视项目 |
相应的JVM统计日志 |
---|---|
[内存]标签页[监视堆内存使用率]
[内存]标签页[监视非堆内存使用率]
[内存]标签页[监视堆使用量]
[内存]标签页[监视非堆使用量]
|
jramemory.stat
|
[线程]标签页[监视运行中的线程数] |
jrathread.stat |
[GC]标签页[监视Full GC执行时间]
[GC]标签页[监视Full GC发生次数]
|
jragc.stat
|
[WebLogic]标签页[监视Work Manager的请求]
[WebLogic]标签页[监视线程Pool的请求]
选中上述任意一个时,输出wlworkmanager.stat和wlthreadpool.stat。不提供只输出一方的设置。
|
wlworkmanager.stat
wlthreadpool.stat
|
5.27.7. 确认监视对象Java VM的Java内存领域的使用量(jramemory.stat)¶
记录监视对象Java VM的Java内存领域使用量的日志文件。文件名可按照日志输出设置的周转方式,采用如下的任意一种。
选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[文件大小]时:
jramemory<从0开始的整数>.stat
选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[时间]时:
jramemory<YYYYMMDDhhmm>.stat
格式如下所示。
No |
格式 |
说明 |
---|---|---|
1 |
yyyy/mm/dd hh:mm:ss.SSS |
表示记录日志的日期和时间。 |
2 |
半字节英文数字符号 |
表示监视对象Java VM的名称。是在JVM监视资源的[属性]-[监视固有]标签页[识别名]上所设置的值。 |
3 |
半字节英文数字符号 |
Java内存Pool的名称。详情请参阅"关于Java内存Pool名"。 |
4 |
半字节英文数字符号 |
Java内存Pool的类型。
Heap,Non-Heap
|
5 |
半字节数字 |
Java VM启动时向OS要求的内存量。单位为字节。(init)
在监视对象Java VM的启动时。可在以下的Java VM启动时以选项指定大小。
・HEAP:-Xms
・NON_HEAP permanent领域(Perm Gen):-XX:PermSize
・NON_HEAP code cache领域(Code Cache):-XX:InitialCodeCacheSize
|
6 |
半字节数字 |
Java VM目前使用的内存量。单位为字节。(used) |
7 |
半字节数字 |
保证Java VM目前使用的内存量。单位为字节。(committed)
因内存的使用状况会发生增减,但务必要在used以上,max以下。
|
8 |
半字节数字 |
Java VM可使用的最大内存量。单位为字节。(max)
可在以下的Java VM启动时以选项指定大小。
・HEAP:-Xmx
・NON_HEAP permanent领域(Perm Gen):-XX:MaxPermSize
・NON_HEAP code cache领域(Code Cache):-XX:ReservedCodeCacheSize
例)
java -XX:MaxPermSize=128m -XX:ReservedCodeCacheSize=128m javaAP
上述的例子中,NON_HEAP的max为 128m+128m=256m。
(注意)
若-Xms与-Xmx指定为相同的值,则可执行变为(init)>(max)。这是因为,HEAP的max为-Xmx的指定而确保的领域大小减去Survivor Space的大小的一半后的大小。
|
9 |
半字节数字 |
从测量对象的Java VM启动开始的使用内存量的峰值。Java内存Pool的名称为HEAP,NON_HEAP时,与Java VM目前使用的内存量(used)相同。单位为字节。 |
10 |
半字节数字 |
[JVM类型]选择[Oracle Java(usage monitoring)]时请忽略。
[JVM类型]选择[Oracle Java(usage monitoring)]以外时,Java内存Pool的类型(No.4的field)为HEAP时,为max(No.8的field)×阈值(%)的内存量。单位为字节。
Java内存Pool的类型为HEAP以外时,固定为0。
|
5.27.8. 确认监视对象Java VM的线程运行状况(jrathread.stat)¶
记录监视对象Java VM的线程运行状况的日志文件。文件名可按照日志输出设置的周转方式,采用如下的任意一种。
选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[文件大小]时:
jrathread<从0开始的整数>.stat
选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[时间]时:
jrathread<YYYYMMDDhhmm>.stat
格式如下所示。
No |
格式 |
说明 |
---|---|---|
1 |
yyyy/mm/dd hh:mm:ss.SSS |
表示记录日志的日期和时间。 |
2 |
半字节英文数字符号 |
表示监视对象Java VM的名称。是在JVM监视资源的[属性]-[监视固有]标签页[识别名]所设置的值。 |
3 |
半字节英文数字符号 |
表示监视对象Java VM目前运行中的线程数。 |
4 |
[半字节数字: 半字节数字:...] |
表示监视对象Java VM死锁的线程ID。反复死锁数份额的ID。 |
5 |
半字节英文数字符号 |
表示监视对象Java VM死锁的线程的详细信息。按照以下形式反复线程数份额。
线程名, 线程ID, 线程状态, UserTime, CpuTime, WaitedCount, WaitedTime, isInNative, isSuspended <换行>
stacktrace<换行>
:
stacktrace<换行>
stacktrace=ClassName, FileName, LineNumber, MethodName, isNativeMethod
|
5.27.9. 确认监视对象Java VM的GC运行状况(jragc.stat)¶
记录监视对象Java VM的GC运行状况的日志文件。文件名可按照日志输出设置的周转方式,采用如下的任意一种。
选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[文件大小]时:
jragc<从0开始的整数>.stat
选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[时间]时:
jragc<YYYYMMDDhhmm>.stat
MarksweepCompact
MarkSweepCompact
PS Marksweep
ConcurrentMarkSweep
格式如下所示。
No |
格式 |
说明 |
---|---|---|
1 |
yyyy/mm/dd hh:mm:ss.SSS |
表示记录日志的日期和时间。 |
2 |
半字节英文数字符号 |
表示监视对象Java VM的名称。是在JVM监视资源的[属性]-[监视固有]标签页[识别名]所设置的值。 |
3 |
半字节英文数字符号 |
表示监视对象Java VM的GC名称。
监视对象Java VM为Oracle Java时
具有以下。
Copy
MarksweepCompact
MarkSweepCompact
PS Scavenge
PS Marksweep
ParNew
ConcurrentMarkSweep
|
4 |
半字节数字 |
表示从监视对象Java VM的启动后开始到测量点为止的GC发生次数。值中也包含JVM监视资源开始监视前发生的GC的发生次数。 |
5 |
半字节数字 |
表示从监视对象Java VM的启动后开始到测量点为止的GC总执行时间。单位为豪秒。值中也包含JVM监视资源开始监视前发生的GC的执行时间。 |
5.27.10. 确认WebLogic Server的Work Manager的运行状况(wlworkmanager.stat)¶
记录WebLogic Server的Work Manager的运行状况的日志文件。文件名可按照日志输出设置的周转方式,采用如下的任意一种。
选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[文件大小]时:
wlworkmanager<从0开始的整数>.stat
选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[时间]时:
wlworkmanager<YYYYMMDDhhmm>.stat
格式如下所示。
No |
格式 |
说明 |
---|---|---|
1 |
yyyy/mm/dd hh:mm:ss.SSS |
表示记录日志的日期和时间。 |
2 |
半字节英文数字符号 |
表示监视对象Java VM的名称。是在JVM监视资源的[属性]-[监视固有]标签页[识别名]所设置的值。 |
3 |
半字节英文数字符号 |
表示应用程序名。 |
4 |
半字节英文数字符号 |
表示Work Manager名。 |
5 |
半字节数字 |
表示已执行的请求的数量。 |
6 |
半字节数字 |
表示待机中的请求的数量。 |
5.27.11. 确认WebLogic Server的线程Pool的运行状况(wlthreadpool.stat)¶
记录WebLogic Server的线程Pool的运行状况的日志文件。文件名可按照日志输出设置的周转方式,采用如下的任意一种。
选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[文件大小]时:
wlthreadpool<从0开始的整数>.stat
选择[集群的属性]-[JVM监视]标签页[日志输出设置]-[周转方式]-[时间]时:
wlthreadpool<YYYYMMDDhhmm>.stat
格式如下所示。
No |
格式 |
说明 |
---|---|---|
1 |
yyyy/mm/dd hh:mm:ss.SSS |
表示记录日志的日期和时间。 |
2 |
半字节英文数字符号 |
表示监视对象Java VM的名称。是在JVM监视资源的[属性]-[监视固有]标签页[识别名]所设置的值。 |
3 |
半字节数字 |
表示已执行的请求的总数。 |
4 |
半字节数字 |
表示等待处理的请求数。 |
5 |
半字节数字 |
表示每一单位时间(秒)的请求处理数。 |
6 |
半字节数字 |
表示为了执行应用程序的线程的合计数。 |
7 |
半字节数字 |
表示处于idle状态的线程数。 |
8 |
半字节数字 |
表示执行中的线程数。 |
9 |
半字节数字 |
表示处于待机状态的线程数。 |
5.27.12. 关于Java内存Pool名¶
下述的监视项目表示JVM监视资源的[属性]-[监视(固有)]标签页[内存]标签页内的设置项目。
以下所记载的Java内存Pool名为在Oracle Java的实际确认结果。
在[JVM类型]选择[Oracle Java]时,并且在监视对象Java VM的启动选项附加「-XX:+UseSerialGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。
监视项目 |
作为memory_name输出的字符串 |
---|---|
[监视堆内存使用率]-[领域整体] |
HEAP |
[监视堆内存使用率]-[Eden Space] |
Eden Space |
[监视堆内存使用率]-[Survivor Space] |
Survivor Space |
[监视堆内存使用率]-[Tenured Gen] |
Tenured Gen |
[监视非堆内存使用率]-[领域整体] |
NON_HEAP |
[监视非堆内存使用率]-[Code Cache] |
Code Cache |
[监视非堆内存使用率]-[Perm Gen] |
Perm Gen |
[监视非堆内存使用率]-[Perm Gen[shared-ro]] |
Perm Gen [shared-ro] |
[监视非堆内存使用率]-[Perm Gen[shared-rw]] |
Perm Gen [shared-rw] |
在[JVM类型]选择[Oracle Java]时,并且在监视对象Java VM的启动选项附加「-XX:+UseParallelGC」,「-XX:+UseParallelOldGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。
监视项目 |
作为memory_name输出的字符串 |
---|---|
[监视堆内存使用率]-[领域整体] |
HEAP |
[监视堆内存使用率]-[Eden Space] |
PS Eden Space |
[监视堆内存使用率]-[Survivor Space] |
PS Survivor Space |
[监视堆内存使用率]-[Tenured Gen] |
PS Old Gen |
[监视非堆内存使用率]-[领域整体] |
NON_HEAP |
[监视非堆内存使用率]-[Code Cache] |
Code Cache |
[监视非堆内存使用率]-[Perm Gen] |
PS Perm Gen |
[监视非堆内存使用率]-[Perm Gen[shared-ro]] |
Perm Gen [shared-ro] |
[监视非堆内存使用率]-[Perm Gen[shared-rw]] |
Perm Gen [shared-rw] |
在[JVM类型]选择[Oracle Java]时,并且在监视对象Java VM的启动选项附加「-XX:+UseConcMarkSweepGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。
监视项目 |
作为memory_name输出的字符串 |
---|---|
[监视堆内存使用率]-[领域整体] |
HEAP |
[监视堆内存使用率]-[Eden Space] |
Par Eden Space |
[监视堆内存使用率]-[Survivor Space] |
Par Survivor Space |
[监视堆内存使用率]-[Tenured Gen] |
CMS Old Gen |
[监视非堆内存使用率]-[领域整体] |
NON_HEAP |
[监视非堆内存使用率]-[Code Cache] |
Code Cache |
[监视非堆内存使用率]-[Perm Gen] |
CMS Perm Gen |
[监视非堆内存使用率]-[Perm Gen[shared-ro]] |
Perm Gen [shared-ro] |
[监视非堆内存使用率]-[Perm Gen[shared-rw]] |
Perm Gen [shared-rw] |
在[JVM类别]选择[Oracle Java(usage monitoring)]时,并且在监视对象Java VM的启动选项附加「-XX:+UseSerialGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。
监视项目 |
作为memory_name输出的字符串 |
---|---|
[监视堆内存使用量]-[领域整体] |
HEAP |
[监视堆内存使用量]-[Eden Space] |
Eden Space |
[监视堆内存使用量]-[Survivor Space] |
Survivor Space |
[监视堆内存使用量]-[Tenured Gen] |
Tenured Gen |
[监视非堆内存使用量]-[领域整体] |
NON_HEAP |
[监视非堆内存使用量]-[Code Cache] |
Code Cache (Java 9以上时不输出) |
[监视非堆内存使用量]-[Metaspace] |
Metaspace |
[监视非堆内存使用量]-[CodeHeap non-nmethods] |
CodeHeap non-nmethods |
[监视非堆内存使用量]-[CodeHeap profiled] |
CodeHeap profiled nmethods |
[监视非堆内存使用量]-[CodeHeap non-profiled] |
CodeHeap non-profiled nmethods |
[监视非堆内存使用量]-[Compressed Class Space] |
Compressed Class Space |
在[JVM类别]选择[Oracle Java(usage monitoring)]时,并且在监视对象Java VM的启动选项附加「-XX:+UseParallelGC」,「-XX:+UseParallelOldGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。
监视项目 |
作为memory_name输出的字符串 |
---|---|
[监视堆内存使用量]-[领域整体] |
HEAP |
[监视堆内存使用量]-[Eden Space] |
Eden Space |
[监视堆内存使用量]-[Survivor Space] |
Survivor Space |
[监视堆内存使用量]-[Tenured Gen] |
Tenured Gen |
[监视非堆内存使用量]-[领域整体] |
NON_HEAP |
[监视非堆内存使用量]-[Code Cache] |
Code Cache (Java 9以上时不输出) |
[监视非堆内存使用量]-[Metaspace] |
Metaspace |
[监视非堆内存使用量]-[CodeHeap non-nmethods] |
CodeHeap non-nmethods |
[监视非堆内存使用量]-[CodeHeap profiled] |
CodeHeap profiled nmethods |
[监视非堆内存使用量]-[CodeHeap non-profiled] |
CodeHeap non-profiled nmethods |
[监视非堆内存使用量]-[Compressed Class Space] |
Compressed Class Space |
在[JVM类别]选择[Oracle Java(usage monitoring)]时,并且在监视对象Java VM的启动选项附加「-XX:+UseConcMarkSweepGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。
监视项目 |
作为memory_name输出的字符串 |
---|---|
[监视堆内存使用量]-[领域整体] |
HEAP |
[监视堆内存使用量]-[Eden Space] |
Par Eden Space |
[监视堆内存使用量]-[Survivor Space] |
Par Survivor Space |
[监视堆内存使用量]-[Tenured Gen] |
CMS Old Gen |
[监视非堆内存使用量]-[领域整体] |
NON_HEAP |
[监视非堆内存使用量]-[Code Cache] |
Code Cache (Java 9以上时不输出) |
[监视非堆内存使用量]-[ Metaspace] |
Metaspace |
[监视非堆内存使用量]-[CodeHeap non-nmethods] |
CodeHeap non-nmethods |
[监视非堆内存使用量]-[CodeHeap profiled] |
CodeHeap profiled nmethods |
[监视非堆内存使用量]-[CodeHeap non-profiled] |
CodeHeap non-profiled nmethods |
[监视非堆内存使用量]-[Compressed Class Space] |
Compressed Class Space |
在[JVM类别]选择[Oracle Java(usage monitoring)]时,并且在监视对象Java VM的启动选项附加「-XX:+UseParNewGC」时,jramemory.stat中的No3的Java内存Pool名如下所示。Java 9以上时,附加「-XX:+UseParNewGC」会导致监视对象Java VM不启动。
监视项目 |
作为memory_name输出的字符串 |
---|---|
[监视堆内存使用量]-[领域整体] |
HEAP |
[监视堆内存使用量]-[Eden Space] |
Par Eden Space |
[监视堆内存使用量]-[Survivor Space] |
Par Survivor Space |
[监视堆内存使用量]-[Tenured Gen] |
Tenured Gen |
[监视非堆内存使用量]-[领域整体] |
NON_HEAP |
[监视非堆内存使用量]-[Code Cache] |
Code Cache |
[监视非堆内存使用量]-[ Metaspace] |
Metaspace |
[监视非堆内存使用量]-[CodeHeap non-nmethods] |
CodeHeap non-nmethods |
[监视非堆内存使用量]-[CodeHeap profiled] |
CodeHeap profiled nmethods |
[监视非堆内存使用量]-[CodeHeap non-profiled] |
CodeHeap non-profiled nmethods |
[监视非堆内存使用量]-[Compressed Class Space] |
Compressed Class Space |
在[JVM类别]选择[Oracle Java(usage monitoring)] 时,并且在监视对象Java VM的启动选项附加「-XX::+UseG1GC」时,jramemory.stat中的No3的Java内存Pool名如下所示。
监视项目 |
作为memory_name输出的字符串 |
---|---|
[监视堆内存使用量]-[领域整体] |
HEAP |
[监视堆内存使用量]-[Eden Space] |
G1 Eden Space |
[监视堆内存使用量]-[Survivor Space] |
G1 Survivor Space |
[监视堆内存使用量]-[ Tenured Gen(Old Gen)] |
G1 Old Gen |
[监视非堆内存使用量]-[领域整体] |
NON_HEAP |
[监视非堆内存使用量]-[Code Cache] |
Code Cache(Java 9以上时不输出) |
[监视非堆内存使用量]-[ Metaspace] |
Metaspace |
[监视非堆内存使用量]-[CodeHeap non-nmethods] |
CodeHeap non-nmethods |
[监视非堆内存使用量]-[CodeHeap profiled] |
CodeHeap profiled nmethods |
[监视非堆内存使用量]-[CodeHeap non-profiled] |
CodeHeap non-profiled nmethods |
[监视非堆内存使用量]-[Compressed Class Space] |
Compressed Class Space |
在JVM统计日志jramemory.stat中,Java内存Pool名和Java VM内存空间的关系如下所示。
Oracle Java 7时
图中的No |
监视项目 |
jramemory.stat的Java内存Pool名 |
---|---|---|
(1) |
[监视堆内存使用率]-[领域整体] |
HEAP |
(2) |
[监视堆内存使用率]-[Eden Space] |
EdenSpace
PS Eden Space
Par Eden Space
|
(3)+(4) |
[监视监视堆内存使用率]-[Survivor Space] |
Survivor Space
PS Survivor Space
Par Survivor Space
|
(5) |
[监视堆内存使用率]-[Tenured Gen] |
Tenured Gen
PS Old Gen
CMS Old Gen
|
(6) |
[监视非堆内存使用率]-[Perm Gen]
[监视非堆内存使用率]-[Perm Gen[shared-ro]]
[监视非堆内存使用率]-[Perm Gen[shared-rw]]
|
Perm Gen
Perm Gen [shared-ro]
Perm Gen [shared-rw]
PS Perm Gen
CMS Perm Gen
|
(7) |
[监视非堆内存使用率]-[Code Cache] |
Code Cache |
(8) |
- |
- |
(6)+(7) |
[监视非堆内存使用率]-[领域整体] |
NON_HEAP
※不包含stack trace
|
Oracle Java 8/Oracle Java 9/Oracle Java 11时
图中的No |
监视项目 |
jramemory.stat的Java内存Pool名 |
---|---|---|
(1) |
[监视堆内存使用量]-[领域整体] |
HEAP |
(2) |
[监视堆内存使用量]-[Eden Space] |
EdenSpace
PS Eden Space
Par Eden Space
G1 Eden Space
|
(3)+(4) |
[监视堆内存使用量]-[Survivor Space] |
Survivor Space
PS Survivor Space
Par Survivor Space
G1 Survivor Space
|
(5) |
[监视堆内存使用量]-[Tenured Gen] |
Tenured Gen
PS Old Gen
CMS Old Gen
G1 Old Gen
|
(6) |
[监视非堆内存使用量]-[Code Cache] |
Code Cache(Java 9以上时不输出) |
(7) |
[监视非堆内存使用量]-[CodeHeap non-nmethods] |
CodeHeap non-nmethods (Java 9以上时输出) |
(6) |
[监视非堆内存使用量]-[CodeHeap profiled] |
CodeHeap profiled nmethods (Java 9以上时输出) |
(6) |
[监视非堆内存使用量]-[CodeHeap non-profiled] |
CodeHeap non-profiled nmethods (Java 9以上时输出) |
(7) |
[监视非堆内存使用量]-[Metaspace] |
Metaspace |
(8) |
[监视非堆内存使用量]-[Compressed Class Space] |
Compressed Class Space |
(6)+(7)+(8) |
[监视非堆内存使用量]-[领域整体] |
NON_HEAP |
5.27.13. 检测出异常时想按照故障原因执行命令时¶
故障原因 |
设置项目 |
---|---|
・连接到监视对象的Java VM失败
・资源测量失败
|
[监视(固有)]标签页[命令]
|
・堆内存使用率
・非堆内存使用率
・堆内存使用量
・非堆内存使用量
|
[监视(固有)]标签页[调整]属性[内存]标签页[命令] |
・运行中的线程数 |
[监视(固有)]标签页[调整]属性[线程]标签页[命令] |
・Full GC执行时间
・Full GC发生次数
|
[监视(固有)]标签页[调整]属性[GC]标签页[命令] |
・WebLogic的Work Manager的请求
・WebLogic的线程Pool的请求
|
[监视(固有)]标签页[调整]属性[WebLogic]标签页[命令] |
故障原因的详细 |
作为参数移交的字符串 |
---|---|
・连接到监视对象的Java VM失败
・资源测量失败
|
无
|
[监视(固有)]标签页[调整]属性[内存]标签页[监视堆内存使用率]-[领域整体]
(Oracle Java时)
|
HEAP
|
[内存]标签页[监视堆内存使用率]-[Eden Space]
(Oracle Java时)
|
EdenSpace
PSEdenSpace
ParEdenSpace
|
[内存]标签页[监视堆内存使用率]-[Survivor |
SurvivorSpace |
Space] |
PSSurvivorSpace |
(Oracle Java时) |
ParSurvivorSpace |
[内存]标签页[监视堆内存使用率]-[Tenured Gen]
(Oracle Java时)
|
TenuredGen
PSOldGen
CMSOldGen
|
[内存]标签页[监视非堆内存使用率]-[领域整体]
(Oracle Java时)
|
NON_HEAP |
[内存]标签页[监视非堆内存使用率]-[Code Cache]
(Oracle Java时)
|
CodeCache |
[内存]标签页[监视非堆内存使用率]-[Perm Gen]
(Oracle Java时)
|
PermGen
PSPermGen
CMSPermGen
|
[内存]标签页[监视非堆内存使用率]-[Perm Gen[shared-ro]]
(Oracle Java时)
|
PermGen[shared-ro] |
[内存]标签页[监视非堆内存使用率]-[Perm Gen[shared-rw]]
(Oracle Java时)
|
PermGen[shared-rw] |
[内存]标签页- [监视堆内存使用使用量]-[领域整体]
(Oracle Java(usage monitoring) 时)
|
HEAP |
[内存]标签页- [监视堆内存使用使用量]-[Eden Space]
(Oracle Java(usage monitoring) 时)
|
EdenSpace
PSEdenSpace
ParEdenSpace
G1EdenSpace
|
[内存]标签页- [监视堆内存使用使用量]-[Survivor Space]
(Oracle Java(usage monitoring) 时)
|
SurvivorSpace
PSSurvivorSpace
ParSurvivorSpace
G1SurvivorSpace
|
[内存]标签页- [监视堆内存使用使用量]-[Tenured Gen]
(Oracle Java(usage monitoring) 时)
|
TenuredGen
PSOldGen
CMSOldGen
G1OldGen
|
[内存]标签页- [监视非堆内存使用量]-[领域整体]
(Oracle Java(usage monitoring) 时)
|
NON_HEAP |
[内存]标签页- [监视非堆内存使用量]-[Code Cache]
(Oracle Java(usage monitoring) 时)
|
CodeCache |
[内存]标签页- [监视非堆内存使用量]-[Metaspace]
(Oracle Java(usage monitoring) 时)
|
Metaspace |
[内存]标签页- [监视非堆内存使用量]-[CodeHeap non-nmethods]
(Oracle Java(usage monitoring) 时)
|
non-nmethods |
[内存]标签页- [监视非堆内存使用量]-[CodeHeap profiled]
(Oracle Java(usage monitoring) 时)
|
profilednmethods |
[内存]标签页- [监视非堆内存使用量]-[CodeHeap non-profiled]
(Oracle Java(usage monitoring) 时)
|
non-profilednmethods |
[内存]标签页- [监视非堆内存使用量]-[Compressed Class Space]
(Oracle Java(usage monitoring) 时)
|
CompressedClassSpace |
[线程]标签页[监视运行中的线程数] |
Count |
[GC]标签页[监视Full GC执行时间] |
Time |
[GC]标签页[监视Full GC发生次数] |
Count |
[WebLogic]标签页[监视Work Manager的请求]-[待机请求 请求数] |
WorkManager_PendingRequests |
[WebLogic]标签页[监视线程Pool的请求]-[待机请求 请求数] |
ThreadPool_PendingUserRequestCount |
[WebLogic]标签页[监视线程Pool的请求]-[执行请求数] |
ThreadPool_Throughput |
以下表示执行例。
例1)
设置项目
设置内容
[监视(固有)]标签页[调整]属性[GC]标签页[命令]
/Program Files/bin/command.bat
[监视(固有)]标签页[调整]属性[GC]标签页[监视Full GC发生次数]
1
[集群]属性[JVM监视]标签页[资源测量设置]-[共通]标签页[异常判定阈值]
3
若JVM监视资源连续异常判定阈值次数(3次)发生Full GC,则检测出监视异常,作为「/Program Files/bin/command.bat Cont
」执行命令。
例2)
设置项目
设置内容
[监视(固有)]标签页[调整]属性[GC]标签页[命令]
"/Program Files/bin/command.bat" GC
[监视(固有)]标签页[调整]属性[GC]标签页[监视Full GC执行时间]
65536
[集群]属性[JVM监视]标签页[资源测量设置]-[共通]标签页[异常判定阈值]
3
若JVM监视资源连续异常判定阈值次数(3次),Full GC执行时间超过65535豪秒,则检测出监视异常,作为「/Program Files/bin/ command.bat GC Time
」执行命令。
例3)
设置项目
设置内容
[监视(固有)]标签页[调整]属性[内存]标签页[命令]
"/Program Files/bin/ command.bat" memory
[监视(固有)]标签页[调整]属性[内存]标签页[监视堆内存使用率]
On
[监视(固有)]标签页[调整]属性[内存]标签页[Eden Space]
80
[监视(固有)]标签页[调整]属性[内存]标签页[Survivor Space]
80
[集群]属性[JVM监视]标签页[资源测量设置]-[共通]标签页[异常判定阈值]
3
若JVM监视资源连续异常判定阈值次数(3次),Java Eden Space的使用率以及Java Survivor Space的使用率超过了80%,则检测出监视异常,作为"/Program Files/bin/ command.bat memory EdenSpace SurvivorSpace"执行命令。
等待在[命令]所设置的命令的结束的超时(秒),可在[集群的属性][JVM监视]标签页[命令超时]设置。借此,在上述各标签页的[命令]可适用相同的值。不能进行[命令]个别的设置。
发生超时时,不执行强制结束[命令]进程的处理。在[命令]进程后的处理(例:强制结束)请由客户自己执行。发生超时时,以下的消息会输出到JVM运行日志中。
action thread execution did not finish. action is alive = <命令>
注意事项如下所示。
检测出Java VM的正常复归时(异常->正常时)不执行[命令]。
以检测出Java VM异常时(按照异常判定阈值次数,连续发生超过阈值时)为契机执行[命令]。不是每超过阈值便执行。
若在多个标签页上设置[命令],同时发生故障时,会执行多个的[命令]。因此,请注意系统负载。
- 监视[监视(固有)]标签页[调整]属性[WebLogic]标签页[监视Work Manager的请求]-[待机请求 请求数]和[监视(固有)]标签页[调整]属性[WebLogic]标签页[监视Work Manager的请求]-[待机请求 平均值]的双方时,有可执行同时执行2次[命令]。这是因为,有可执行同时检测出[集群]属性[JVM监视]标签页[资源测量设置]-[WebLogic]标签页[间隔请求数]和[集群]属性[JVM监视]标签页[资源测量设置]-[WebLogic]标签页[间隔平均值]的异常。作为回避的对策,请仅监视任意一方。以下的监视项目的组合也同样。
[监视(固有)]标签页[调整]属性[WebLogic]标签页[监视线程Pool的请求]-[待机请求数]和[监视(固有)]标签页[调整]属性[WebLogic]标签页[监视线程Pool的请求]-[待机请求平均值]
[监视(固有)]标签页[调整]属性[WebLogic]标签页[监视线程Pool的请求]-[执行请求 请求数]和[监视(固有)]标签页[调整]属性[WebLogic]标签页[监视线程Pool的请求]-[执行请求平均值]
5.27.14. 监视WebLogic Server¶
完成监视对象WebLogic Server的设置,并作为应用程序服务器运行的步骤请参考WebLogic Server的使用说明书。
本章只介绍JVM监视资源监视时所必需的设置。
- 启动WebLogic Server Administration Console。启动方法请参考WebLogic Server使用说明书的"Administration Console的概要"。选择域设置-域-设置-整体。在这里请先确认"启用管理端口"复选框为未选中状态。
在域设置-服务器中选择监视对象的服务器名。选择的服务器名设置为可以从Cluster WebUI编辑模式中选择的[属性]-[监视(固有)]标签的[识别名]。
在监视对象服务器的设置-整体中,确认"监听端口"中管理连接的端口号。
停止WebLogic Server。停止方法请参考WebLogic Server使用说明书的"WebLogic Server的启动和停止"。
打开WebLogic Server的启动脚本。
在打开的脚本中记载以下内容。
监视对象为WebLogic Server的管理服务器时
set JAVA_OPTIONS=%JAVA_OPTIONS% -Dcom.sun.management.jmxremote.port=n -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false -Djavax.management.builder.initial=weblogic.management.jmx.mbeanserver.WLSMBeanServerBuilder
※在实际操作中请将上述内容记载为1行。
注解
n用来指定监视时使用的端口号。指定的端口号请指定为与监视对象Java VM的监听端口号不同的号码。此外,同一设备有多个监视对象的WebLogic Server时,请指定不同于监听端口号和其他应用程序端口号的号码。
监视对象为WebLogic Server的管理对象服务器时
if "%SERVER_NAME%" == "SERVER_NAME"( set JAVA_OPTIONS=%JAVA_OPTIONS% -Dcom.sun.management.jmxremote.port=n -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false -Djavax.management.builder.initial=weblogic.management.jmx.mbeanserver.WLSMBeanServerBuilder )
※在实际操作中,请将if语句记载为1行。
注解
SERVER_NAME指定为"选择监视对象服务器"中确认的监视对象服务器名。存在多个监视对象服务器时,按照同样的设置(1~6行)更改服务器名,重复设置。
注解
上述内容中添加的部分请放在以下记载的前面。
%JAVA_HOME%\bin\java %JAVA_VM% %MEM_ARGS%
-Dweblogic.Name=%SERVER_NAME%
-Djava.security.policy=%WL_HOME%\server\lib\weblogic.policy %JAVA_OPTIONS
% %PROXY_SETTINGS% %SERVER_CLASS%
※在实际操作中请将上述内容记载为1行
- 启动监视对象的WebLogic Server的WSLT(wlst.cmd)。启动方法是选择[开始]菜单的 [Oracle WebLogic]-[WebLogic Server <版本号>]-[Tools]-[WebLogic Scripting Tool]。
- 监视Work Manage或线程Pool的请求时,请进行以下设置。启动监视对象WebLogic Server的WLST(wlst.cmd)。启动方法为在[开始]菜单中选择[Oracle WebLogic]-[WebLogic Server <版本编号>]-[Tools]-[WebLogic Scripting Tool]。请在显示的提示画面上执行以下命令。
> connect('USERNAME','PASSWORD','t3://SERVER_ADDRESS:SERVER_PORT') > edit() > startEdit() > cd('JMX/DOMAIN_NAME') > set('PlatformMBeanServerUsed','true') > activate() > exit()
请将上面的USERNAME,PASSWORD,SERVER_ADDRESS,SERVER_PORT,DOMAIN_NAME替换为符合域环境的值。
重启监视对象WebLogic Server
5.27.15. 监视WebOTX¶
以下设置中,监视WebOTX上JMX代理的Java进程与监视进程组上的Java进程其设定内容有所不同。请根据监视对象进行设置。
5.27.16. 监视WebOTX域代理的Java进程¶
不需要设置操作。
5.27.17. 监视WebOTX进程组的Java进程¶
通过集成操作管理工具连接域。
在树形图中选择[<域名>]-[TP系统]-[应用程序组]-[<应用程序组名>]-[进程组]-[<进程组名>]。
在右侧显示的[JVM选项]标签内的[其他参数]属性中,用1行指定下一个Java选项。n用来指定端口号。若同一设备有多个监视对象Java VM存在,请指定不同的端口号。这里指定的端口号在Cluster WebUI([监视资源的属性]->[监视(固有)]标签页->[连接端口号] )中也会设置。
-Dcom.sun.management.jmxremote.port=n -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false -Djavax.management.builder.initial=com.nec.webotx.jmx.mbeanserver.JmxMBeanServerBuilder
- 完成设置后点击[更新]。完成设置后,重启进程组。本设置也可在WebOTX集成操作管理工具[Java系统属性]标签内的[Java系统属性]中进行指定。此时,"-D"为不指定,"="之前的字符串指定为"名称","="之后的字符串指定为"值"。
注解
设定标签名 |
项目名 |
设定值 |
---|---|---|
监视(共通) |
监视时间 |
不间断监视 |
复归操作 |
复归动作 |
只在最终动作时执行 |
复归操作 |
最终动作 |
无操作 |
再者,WebOTX 进程组的监视,不支持LB联动功能。
5.27.18. 接收WebOTX notification通知¶
通过登录特定的监听器类,当WebOTX查出故障时就发行notification。JVM监视资源接收到该notification,就会向JVM运行日志发出以下的通知。
%1$s:Notification received. %2$s.
%1$s,%2$s的意思如下。
%1$s:监视对象Java VM
%2$s:notification的通知 (ObjectName=**,type=**,message=**)
现在,可监视的资源的Mbean的详细信息如下表所述。
ObjectName |
[domainname]:j2eeType=J2EEDomain,name=[domainname],category=runtime |
---|---|
Notification类型 |
nec.webotx.monitor.alivecheck.not-alive |
消息 |
failed |
5.27.19. 监视Tomcat¶
对JVM监视资源中,监视对象的Tomcat 的设置步骤进行说明。
停止Tomcat,从[开始]-(Tomcat的文件夹)-[Configure Tomcat]打开。
在打开的窗口的[java]标签页的[Java Option]中用1行来记述以下的内容。n 指定端口编号。如果同一机器中存在多个监视对象的Java VM,则需要指定不重复的端口编号。此处指定的端口编号也可通过Cluster WebUI ([监视资源的属性]->[监视(固有)标签页]->[连接端口编号])来设置。
-Dcom.sun.management.jmxremote.port=n -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false
保存上述的设置后,启动Tomcat。
在Cluster WebUI (JVM监视资源名->[属性]->[监视(固有)] 标签页->[识别名])中,请设置为与其他监视对象不重复的任意的字符串(例:tomcat)。
5.27.20. 监视SVF¶
JVM监视资源中,监视对象的SVF 的设置进行说明。
从下表中选择监视对象,从编辑器打开该当的脚本。
监视对象
编辑的文件
Report Director EnterpriseServer
<SVF安装路径>\launcher\ReportDirectorEnterpriseServer.run
Report Director Svf Server
<SVF安装路径>\launcher\ReportDirectorSvfServer.run
Report Director Spool Balancer
<SVF安装路径>\launcher\ReportDirectorSpoolBalancer.run
Tomcat
%FIT_PRODUCTS_BASE%\SetupUtils\setup_tomcat.bat
SVF Print Spooler services
<SVF安装路径>\svfjpd\launcher\SpoolerDaemon.run
- (监视对象为Tomcat时)setup_tomcat.bat 中的:install 的 --JvmOption 的地方,添加如下。n 指定端口编号。如果同一机器中存在多个监视对象的Java VM,则需要指定不重复的端口编号。此处指定的端口编号也可通过Cluster WebUI ([监视资源的属性]->[监视(固有)]标签页->[连接端口编号])来设置。
更改前:
--JvmOptions=...
更改后:
--JvmOptions=...;-Dcom.sun.management.jmxremote.port=n;-Dcom.sun.management.jmxremote.ssl=false;-Dcom.sun.management.jmxremote.authenticate=false
(监视对象不是Tomcat时)在指定Arguments的[-Xms]后面用1行来记述以下的内容。n 指定端口编号。如果同一机器中存在多个监视对象的Java VM,则需要指定不重复的端口编号。此处指定的端口编号也可通过Cluster WebUI ([监视资源的属性]->[监视(固有)]标签页->[连接端口编号])来设置。
-Dcom.sun.management.jmxremote.port=n -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false
5.27.21. 监视自己制造的Java应用程序¶
-Dcom.sun.management.jmxremote.port=n -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false
根据Java应用程序还需要添加以下内容。
-Djavax.management.builder.initial=<MBeanServerBuilder 的类名>
5.27.22. 监视(固有)标签页¶
监视对象
从列表中选择监视对象。监视WebSAM SVF for PDF,WebSAM Report Director Enterprise和WebSAM Universal Connect/X 时,请选择[WebSAM SVF]。监视自己制造的Java应用程序时,请选择[Java应用程序]。
默认值 : 无
JVM类型
从列表中选择监视对象应用程序操作的Java VM。Java 8以上时请选择[Oracle Java(usage monitoring)]。Java 8时需进行以下的规格更改。
无法获得非堆领域的各内存的最大值。
Perm Gen被更改为Metaspace。
追加了Compressed Class Space。
因此,Java 8时的[内存]标签页的监视项目需进行以下的更改。
使用率监视被更改为使用量监视。
无法监视[Perm Gen],Perm Gen[shared-ro],Perm Gen[shared-rw]。请将复选框设置为OFF。
可以监视[Metaspace],[Compressed Class Space]。
Java 9时有以下的设计变更。
Code Cache 被分割。
因此,Java 9时的[内存]标签页的监视项目需进行以下的变更。
无法监视[Code Cache]。请将复选框设置为OFF。
可以监视[CodeHeap non-nmethods] ,[CodeHeap profiled] ,[CodeHeap non-profiled]。
默认值 : 无
识别名(255字节以内)
识别名是在JVM监视的JVM运行日志中输出监视对象信息时,为了识别与其他JVM监视资源而设定的。为此,请在JVM监视资源之间设定唯一的字符串。请务必进行设置。
监视对象为[WebLogic Server]时参考"5.27.14. 监视WebLogic Server "中的2,设置监视对象的服务器实例名。 监视对象为[WebOTX进程组]时请设置进程组名。 监视对象为[WebOTX域代理]时请设置域名。 监视对象为[WebOTX ESB]时与"WebOTX 进程组"时一样设置。 监视对象为[Java应用程序]时请将监视对象的Java VM 进程指定为一个唯一可识别的字符串。默认值 : 无
连接端口号 (1024~65535)
设置JVM监视资源在进行监视对象Java VM和JMX连接时所使用的端口号。JVM监视资源从监视对象Java VM所进行的JMX连接来取得信息。为此,登录JVM监视资源时,需要在监视对象Java VM上开放JVM连接用的端口。请务必设置。不建议设置42424~61000。
监视对象为[WebLogic Server]时请参考"5.27.14. 监视WebLogic Server"中的6,设置连接端口号。 监视对象为[WebOTX进程组]时参考"5.27.17. 监视WebOTX进程组的Java进程"进行设置。 监视对象为[WebOTX域代理]时请设置"(WebOTX安装路径)/<域名>.properties"中的"domain.admin.port"。 监视对象为[WebOTX ESB]时与"WebOTX 进程组"时一样设置。 监视对象为[Java应用程序]时请确认连接端口编号在监视对象的Java 应用程序上之后才设置。默认值 : 无
进程名(255字节以内)
由于可以通过[连接端口号]识别监视目标Java VM ,因此不需要设置。内部版本11.35为止的版本中,在获取虚拟内存使用量时或在JVM运行日志中输出监视目标的信息时,也是用本参数识别的,因此需要指定。但是,内部版本12.00之后的版本中,由于"监视虚拟内存使用量"已经被删除,因此无法设置。
默认值 : 无
用户名 (255字节以内)
设置连接监视对象Java VM的管理员名称。监视对象选择为[WebOTX域代理]时请设置"/opt/WebOTX/<域名>.properties"中"domain.admin.user"的值。默认值 :无
密码 (255字节以内)
设置连接监视对象Java VM的管理员密码。监视对象选择为[WebOTX域代理]时请设置"(WebOTX安装路径)\<域名>.properties"的"domain.admin.passwd"的值。请点击[更改],在显示的密码输入对话框内进行设置。密码将被隐藏。默认值 : 无
命令(255字节以内)
查出监视对象的Java VM异常时,设置要执行的命令。可指定根据不同异常原因执行的命令和参数。请指定绝对路径。另外,请用双引号("")将执行文件名括起来。例) "\Program Files\bin\command.bat" arg1 arg2在此设置无法连接监视对象Java VM或获取使用资源量查出异常时要执行的命令。请同时参考" 5.27.13. 检测出异常时想按照故障原因执行命令时"。默认值 :无
点击[调整]后,弹出的对话框中会显示以下内容。根据以下说明进行详细设置。
5.27.23. 内存标签(在[JVM类型]选择[Oracle Java]时)¶
监视堆内存使用率
对监视对象Java VM使用的Java堆空间使用率进行监视设置。
复选框选中(默认值)监视。 复选框未选中不监视。
领域整体 (1~100)
设置监视对象Java VM使用的Java堆内存使用率之界限值。
默认值 : 80[%]
Eden Space (1~100)
设置监视对象Java VM使用的Java Eden Space使用率之界限值。作为监视对象的Java VM的GC方式指定为G1 GC时,请改读为G1 Eden Space。
默认值 : 100[%]
Survivor Space (1~100)
设置监视对象Java VM使用的Java Survivor Space使用率之界限值。作为监视对象的Java VM的GC方式指定为G1 GC时,请改读为G1 Survivor Space。
默认值 : 100[%]
Tenured Gen (1~100)
设置监视对象Java VM使用的JJava Tenured(Old) Gen空间使用率之界限值。作为监视对象的Java VM的GC方式指定为G1 GC时,请改读为G1 Old Gen。
默认值 : 80[%]
监视非堆内存使用率
对监视对象Java VM使用的Java非堆空间之使用率进行监视设置。
复选框选中(默认值)监视。 复选框未选中不监视。
领域整体 (1~100)
设置监视对象Java VM使用的Java非堆空间使用率之界限值。
默认值 : 80[%]
Code Cache (1~100)
设置监视对象Java VM使用的Java Code Cache空间使用率之界限值。
默认值 : 100[%]
Perm Gen (1~100)
设置监视对象Java VM使用的Java Perm Gen空间使用率之界限值。
默认值 : 80[%]
Perm Gen[shared-ro] (1~100)
设置监视对象Java VM使用的Java Perm Gen [shared-ro]空间使用率之界限值。Java Perm Gen [shared-ro] 范围,是其监视对象Java VM启动选项 -client -Xshare:on -XX:+UseSerialGC 启动时设置的使用范围。默认值 : 80[%]
Perm Gen[shared-rw] (1~100)
设置监视对象Java VM使用的Java Perm Gen [shared-rw]空间使用率之界限值。Java Perm Gen [shared-rw] 范围,是其监视对象Java VM启动选项 -client -Xshare:on -XX:+UseSerialGC 启动时设置的使用范围。默认值 : 80[%]
命令 (255字节以内)
查出监视对象的Java VM异常时,设置要执行的命令。可指定根据不同异常原因执行的命令和参数。请指定绝对路径。另外,请用双引号("")将执行文件名括起来。例) "\Program Files\bin\command.bat" arg1 arg2在此设置查出监视对象Java VM的Java堆内存,Java非堆内存异常时要执行的命令。请同时参考"5.27.13. 检测出异常时想按照故障原因执行命令时"。默认值 :无
默认值
点击[默认值]按钮后,所有项目将设置为默认值。
5.27.24. 内存标签(在[JVM类型]选择[Oracle Java(usage monitoring)] 时)¶
监视堆内存使用量
对监视对象Java VM使用的Java堆空间使用量进行监视设置。
复选框选中(默认值)监视。 复选框未选中不监视。
领域整体 (0~102400)
设置监视对象Java VM使用的Java堆内存使用量之界限值。为0时不进行监视。
默认值 : 0[MB]
Eden Space(0~102400)
设置监视对象Java VM使用的Java Eden Space使用使用量之界限值。为0时不进行监视。作为监视对象的Java VM的GC方式指定为G1 GC时,请改读为G1 Eden Space。
默认值 :0[MB]
Survivor Space(0~102400)
设置监视对象Java VM使用的Java Survivor Space使用量之界限值。为0时不进行监视。作为监视对象的Java VM的GC方式指定为G1 GC时,请改读为G1 Survivor Space。
默认值 :0[MB]
Tenured Gen(0~102400)
设置监视对象Java VM使用的JJava Tenured(Old) Gen空间使用量之界限值。为0时不进行监视。作为监视对象的Java VM的GC方式指定为G1 GC时,请改读为G1 Old Gen。
默认值 :0[MB]
监视非堆内存使用量
对监视对象Java VM使用的Java非堆空间之使用量进行监视设置。
复选框选中(默认值)监视。 复选框未选中不监视。
领域整体 (0~102400)
设置监视对象Java VM使用的Java非堆空间使用量之界限值。为0时不进行监视。
默认值 : 0[MB]
Code Cache(0~102400)
设置监视对象Java VM使用的Java Code Cache空间使用量之界限值。为0时不进行监视。
默认值 :0[MB]
CodeHeap non-nmethods(0~102400)
设置监视对象Java VM使用的Java CodeHeap non-nmethods空间使用量之界限值。为0时不进行监视。
默认值 :0[MB]
CodeHeap profiled(0~102400)
设置监视对象Java VM使用的Java CodeHeap profiled空间使用量之界限值。为0时不进行监视。
默认值 :0[MB]
CodeHeap non-profiled(0~102400)
设置监视对象Java VM使用的Java CodeHeap non-profiled空间使用量之界限值。为0时不进行监视。
默认值 :0[MB]
Compressed Class Space(0~102400)
设置监视对象Java VM使用的Java Compressed Class Space空间使用量之界限值。为0时不进行监视。
默认值 :0[MB]
Metaspace(0~102400)
设置监视对象Java VM使用的Metaspace空间使用量之界限值。
默认值 :0[MB]
命令 (255字节以内)
查出监视对象的Java VM异常时,设置要执行的命令。可指定根据不同异常原因执行的命令和参数。请指定绝对路径。另外,请用双引号("")将执行文件名括起来。例) "\Program Files\bin\command.bat" arg1 arg2在此设置查出监视对象Java VM的Java堆内存,Java非堆内存异常时要执行的命令。请同时参考"5.27.13. 检测出异常时想按照故障原因执行命令时"。默认值 :无
默认值
点击[默认值]按钮后,所有项目将设置为默认值。
5.27.25. 线程标签¶
监视动作中的线程数 (1~65535)
设置监视对象Java VM中正在运行的线程上限值。
默认值 : 65535[线程]
命令 (255字节以内)
查出监视对象的Java VM异常时,设置要执行的命令。可指定根据不同异常原因执行的命令和参数。请指定绝对路径。另外,请用双引号("")将执行文件名括起来。例) "\Program Files\bin\command.bat" arg1 arg2在此设置查出监视对象Java VM目前运行中的线程数的异常时要执行的命令。请同时参考"5.27.13. 检测出异常时想按照故障原因执行命令时"。默认值 :无
默认值
点击[默认值]按钮后,所有项目将设置为默认值。
5.27.26. GC标签¶
监视Full GC执行时间 (1~65535)
在监视对象Java VM中,设置前一次测量后的Full GC执行时间之界限值。Full GC执行时间指的是,除以前一次测量后Full GC发生次数而得出的平均值。若希望将Full GC执行时间3000毫秒,Full GC发生次数3次的情况判定为异常,则请将前一次测量后的Full GC执行时间设置为1000毫秒以下。默认值 : 65535[毫秒]
监视Full GC发生次数 (1~65535)
在监视对象Java VM中,设置前一次测量后的Full GC发生次数之界限值。
默认值 : 1(次)
命令 (255字节以内)
查出监视对象的Java VM异常时,设置要执行的命令。可指定根据不同异常原因执行的命令和参数。请指定绝对路径。另外,请用双引号("")将执行文件名括起来。例) "\Program Files\bin\command.bat" arg1 arg2在此设置查出监视对象Java VM的Full GC执行时间或Full GC发生次数的异常时要执行的命令。请同时参考"5.27.13. 检测出异常时想按照故障原因执行命令时"。默认值 :无
默认值
点击[默认值]按钮后,所有项目将设置为默认值。
5.27.27. WebLogic标签页¶
监视Work Manager的请求
在WebLogic Server中,对Work Manager的待机请求状态进行监视设置。
选中复选框监视。 不选中复选框(默认值)不监视。
监视对象Work Manager(255字节以内)
对监视对象的WebLogic Server,设置监视目标应用程序的Work Manager名称。执行Work Manager监视时,请务必设置。App1[WM1,WM2,...];App2[WM1,WM2,...];...在App和WM中可指定的字符为ASCII字符。(不包括Shift_JIS 编码0x005C 和0x00A1~0x00DF )若应用程序中包含存档的版本,请在App中指定"应用程序名#版本"。若应用程序名中包含"["或"]",请在其前面添加"¥¥"。(例如)应用程序名为app[2]时,则为app¥¥[2¥¥]
默认值 : 无
请求数 (1~65535)
在监视对象WebLogic Server的Work Manager中,设置待机请求数的界限值。
默认值 : 65535
平均值 (1~65535)
在监视对象WebLogic Server的Work Manager中,设置待机请求数平均值的界限值。
默认值 : 65535
相比上一次测量值的增加率 (1~1024)
在监视对象WebLogic Server的Work Manager中,设置上一次测量后待机请求数增量的界限值。
默认值 : 80[%]
监视线程Pool的请求
在监视对象WebLogic Server的线程Pool中,对待机请求数(WebLogic Server内部待处理的HTTP请求数)进行监视设置。
选中复选框(默认值)监视。 不选中复选框不监视。
待机请求 请求数 (1~65535)
设置待机请求数的界限值。
默认值 : 65535
待机请求 平均值 (1~65535)
设置待机请求数平均值的界限值。
默认值 : 65535
待机请求 相比上一次测量值的增加率 (1~1024)
设置上一次测量后,待机请求数增量的界限值。
默认值 : 80[%]
执行请求 请求数 (1~65535)
设置单位时间内执行请求数的界限值。
默认值 : 65535
执行请求 平均值 (1~65535)
设置单位时间内执行的请求数平均值之界限值。
默认值 : 65535
执行请求 相比上一次测量值的增加率 (1~1024)
设置上一次测量后,单位时间内执行的请求数增量之界限值。
默认值 : 80[%]
命令 (255字节以内)
查出监视对象的Java VM异常时,设置要执行的命令。可指定根据不同异常原因执行的命令和参数。请指定绝对路径。另外,请用双引号("")将执行文件名括起来。例) "\Program Files\bin\command.bat" arg1 arg2在此设置查出WebLogic Server的WorkManage的请求,线程Pool的请求的异常时要执行的命令。请同时参考"5.27.13. 检测出异常时想按照故障原因执行命令时"。默认值 :无
默认值
点击[默认值]按钮后,所有项目将设置为默认值。
5.27.28. LB联动标签页¶
在LB联动类别中选择[BIG-IPLTM]以外时,显示此界面。
监视内存Pool
对通知LB动态负载信息时,是否监视内存Pool进行设置。
选中复选框监视。 不选中复选框(默认值)不监视。
默认值
按[默认值]按钮,所有项目内容均被设为默认值。
5.27.29. LB联动标签(BIG-IPLTM的情况)¶
在LB联动类别中选择[BIG-IPLTM]时,显示此界面。
监视内存Pool
对通知LB动态负载信息时,是否监视内存Pool进行设置。
选中复选框监视。 不选中复选框(默认值)不监视。
故障节点动态分离
检测出监视目标的故障状态(例:超出采集信息设定的阈值)时,BIG-IP LTM的均衡节点状态从enable更改为disable的设定。
选中复选框从enable更改为disable。 不选中复选框(默认值)不更改。
重启命令
等待均衡节点的连接数变0后,指定要执行的命令。检测出常驻监视和监视目标的故障时,重启监视目标的情况下生效。请将重启命令设置成在所有的JVM监视资源中共通的值。
超时
设定均衡节点状态从enable更改为disable后,均衡节点的连接数变0为止等待的超时时间。超时后,不能执行[重启命令]。
默认值:3600[秒]
默认值
点击[默认值]按钮,使[监视内存Pool],[故障节点动态分离],[超时]项目设定为默认值。
注解
使用BIG-IP Local Traffic Manager联动,需要OpenSSL库。不支持OpenSSL 1.1.0或更高版本。
5.28. 设置系统监视资源¶
系统监视资源是对系统资源进行监视的监视资源。系统监视资源可持续收集系统资源统计信息,并根据一定的知识信息进行解析处理。通过解析结果,可尽早发现资源枯竭。
5.28.1. 系统监视资源的注意事项¶
在系统全体资源监视下,反复在阈值上下增减时
系统为高负荷等状态下,统计信息收集时间过长,可执行导致无法在收集统计信息的间隔内收集信息。
正在运行时若更改OS的日期或时间,会导致每10分钟进行一次的解析处理时刻在日期或时间更改后的第一次有偏差。由于可执行会发生以下问题,请进行挂起集群和恢复集群操作。
已经到了异常查出时间,却没有查出异常。
还没到异常查出时间,却查出异常。
进行集群的挂起/复原时,从其启动的瞬间即开始收集信息。
系统资源使用量的解析每10分钟进行一次。因此,持续监视时间最多可执行经过10分钟后才会查出异常。
磁盘资源使用量的解析每60分钟进行一次。因此,持续监视时间最多可执行经过60分钟后才会查出异常。
磁盘资源的剩余容量监视中指定的磁盘容量,请指定为比实际磁盘容量小的数值。如果指定为较大值,将被认为剩余容量不足,查出异常。
交换正在监视中的磁盘时,如果交换前和交换后的磁盘在以下项目有差异,需要清除之前的解析信息。
磁盘的总容量
文件系统
请在没有获得Swap领域的机器中,不要选中系统的总虚拟内存使用量的监视。
磁盘资源监视功能不能对固定磁盘以外的磁盘进行监视。
磁盘资源监视功能中,同时能监视的最大磁盘数是26个。
如果监视资源的定义画面的类型栏中,没有显示「系统监视」时,请选择[获取License信息]来获取License信息。
Monitor sraw is in the warning status. (191 : 正常)
5.28.2. 系统监视资源的监视方法¶
- 总内存使用量与经过时间同时持续处在总内存使用量的阈值以上的状态,并经过了一定时间以上时
- 总内存使用量与经过时间同时在总内存使用量的阈值前后增减,持续低于总内存使用量的阈值时
下图中,总内存使用量暂时超过总内存使用量的阈值(90%)。 但是,由于超过该阈值的状态不会持续监视持续时间(60分),因此不会查出总内存使用量异常。
监视级别的磁盘容量监视
磁盘使用率在警告级别上限值所指定的一定的阈值以上 磁盘使用率在一定范围内增减,不会超过警告级别上限值所指定的一定的阈值以上由于磁盘使用率在不超过警告级别上限的范围内增加或减少,因此不会被判断为磁盘容量监视异常。
通知级别的磁盘容量监视
磁盘使用率与经过时间同时持续处在通知级别上限值所指定的一定阈值以上的状态,并经过了一定时间以上时由于磁盘使用率持续超过通知级别上限值,因此判断为磁盘容量监视异常。
磁盘使用率在一定范围内增减,不会超过通知级别上限值所指定的一定的阈值以上由于磁盘使用率在通知级别上限值前后有增加或减少,因此不判断为磁盘容量监视异常。
5.28.3. 监视(固有)标签页¶
CPU使用率的监视
设置是否进行CPU使用率的监视。
选中复选框进行CPU使用率的监视。 不选中复选框不进行CPU使用率的监视。
使用率 (1~100)
设置查出CPU使用率异常的阈值。
持续时间 (1~1440)
设置查出CPU使用率异常的时间。若持续高于阈值的时间超过指定时间,将会查出异常。
总内存使用量的监视
设置是否进行总内存使用量的监视。
选中复选框进行总内存使用量的监视。 不选中复选框不进行总内存使用量的监视。
使用量 (1~100)
设置查出内存使用量异常的阈值(占系统内存量百分比)。
持续时间 (1~1440)
设置查出总内存使用量异常的时间。若持续高于阈值的时间超过指定时间,将会查出异常。
总虚拟内存使用量的监视
设置是否进行总虚拟内存使用量的监视。
选中复选框进行总虚拟内存使用量的监视。 不选中复选框不进行总虚拟内存使用量的监视。
使用量 (1~100)
设置查出虚拟内存使用量异常的阈值。
持续时间 (1~1440)
设置查出总虚拟内存使用量异常的时间。超过阈值的持续时间在所指定的时间以上时,查出异常。
添加
添加要监视的磁盘。会显示出[输入监视条件]对话框。按照[输入监视条件]对话框的说明,进行判定为异常的监视条件的详细设置。
删除
从监视对象中删除在[磁盘列表]上选择的磁盘。
编辑
会显示出[监视条件的输入]对话框。由于会显示出在[磁盘列表]上选择的磁盘的监视条件,因此可进行编辑,然后选择[OK]。
逻辑驱动器
设置进行监视的逻辑盘。
使用率
设置是否进行磁盘使用率的监视。
选中复选框进行磁盘使用率的监视。 不选中复选框不进行磁盘使用率的监视。
警告级别 (1~100)
设置检测磁盘使用率警報级别异常的阈值。
通知级别 (1~100)
设置检测磁盘使用率通知级别异常的阈值。
持续时间 (1~43200)
设置检测磁盘使用率通知级别异常的时间。在指定时间以上持续超过阈值时,检测为异常。
剩余容量
设置是否进行磁盘空余容量的监视。
选中复选框进行磁盘空余容量的监视。 不选中复选框不进行磁盘空余容量的监视。
警告级别 (1~4294967295)
设置检测磁盘空余容量警報级别异常的容量(MB)。
通知级别 (1~4294967295)
设置检测磁盘空余容量通知级别异常的容量(MB)。
持续时间 (1~43200)
设置检测磁盘空余容量通知级别异常的时间。在指定时间以上持续超过阈值时,检测为异常。
5.29. 设置进程资源监视资源¶
进程资源监视资源,是用来监视使用进程的资源的监视资源。它不断收集使用进程的资源的统计信息,并根据一定的知识信息进行分析。从分析结果中可以较早的发现发生资源耗尽的情况。
5.29.1. 进程资源监视资源的注意事项¶
关于进程资源监视资源的设定值,推荐使用默认值。
系统为高负荷等状态下,统计信息收集时间过长,可执行导致无法在收集统计信息的间隔内收集信息。
正在运行时若更改OS的日期或时间,会导致每10分钟进行一次的解析处理时刻在日期或时间更改后的第一次有偏差。由于可执行会发生以下问题,请进行挂起集群和恢复集群操作。
已经到了异常查出时间,却没有查出异常。
还没到异常查出时间,却查出异常。
监视psrw为警告状态。 (191 : 正常)
要使进程资源监视资源的状态从异常回到正常状态,请执行以下任意一种处理。
集群的挂起·复原
集群的停止·开始
5.29.2. 进程资源监视资源的监视方法¶
- 内存使用量与经过时间同时增减,并且更新了规定次数以上的最大值,增加率变为初始值的10%以上时
由于最大更新次数超过24小时(默认),并且增加率高于初始值的10%,因此判断为内存泄漏。
- 在一定的范围内,内存使用量与经过时间同时增减
由于内存使用量在一定值以下的范围内有增加或减少,因此不判断为内存泄漏。
5.29.3. 监视(固有)标签页¶
CPU使用率的监视
设置是否进行CPU使用率的监视。
选中复选框进行CPU使用率的监视。 不选中复选框不进行CPU使用率的监视。
使用率 (1~100)
设置查出CPU使用率异常的阈值。
持续时间 (1~4320)
设置查出CPU使用率异常的时间。若持续高于阈值的时间超过指定时间,将会查出异常。
总内存使用量的监视
设置是否进行内存使用量的监视。
选中复选框进行内存使用量的监视。 不选中复选框不进行内存使用量的监视。
相比初次监视的增加率(1~1000)
设置查出内存使用量异常的阈值。
持续时间(1~4320)
设置查出内存使用量异常的时间。若持续高于阈值的时间超过指定时间,将会查出异常。
打开文件数的监视(最大值)
设置是否进行将打开文件数的监视。
选中复选框进行打开文件数的监视。 不选中复选框不进行打开文件数的监视。
刷新次数(1~4320)
设置查出打开文件数异常的刷新次数。打开文件数的最大值超过指定次数更新时,查出异常。
线程数的监视
设置是否进行线程数的监视。
选中复选框进行线程数的监视。 不选中复选框不进行线程数的监视。
持续时间(1~4320)
设置查出线程数异常的时间。如果有线程数增加,且超过指定时间以上的进程,则查出异常。
监视同一名称的进程
设置是否进行监视同一名称的进程。
选中复选框进行监视同一名称的进程。 不选中复选框不进行监视同一名称的进程。
个数(1~10000)
设置查出同一名称进程异常的个数。同一名称进程超过指定个数时,查出异常。
5.30. 设置用户空间监视资源¶
5.30.1. 用户空间监视资源的监视方法¶
用户空间监视资源的操作逻辑如下所示。
- 处理概要反复执行如下2~3操作。
设置keepalive计时器
创建虚拟线程
更新keepalive计时器
操作2. 为监视操作的扩展设置操作。若不进行各设置,则将不执行操作。
- 未超时(可顺利实施上述2~3步骤)时的操作不执行重置等恢复操作。
- 超时时(上述2~3中的某项操作停止或延迟了)的操作根据操作设置,通过EXPRESSCLUSTER的内核模块,进行HW重置或生成主动停止错误。
5.30.2. 监视(固有)标签页¶
监视方法
指定用户空间的监视方法。
keepalive
使用clphb驱动程序。
超时发生时的动作
指定超时发生时的动作。
无操作不进行任何操作。 HW重置硬件reset 停止错误生成停止错误。
注解
指定超时发生时动作时,无法生成模拟故障。
扩展监视设置
进行监视时,设置是否创建临时文件。
选中复选框(默认值)创建临时文件 不选中复选框不创建临时文件。
6. 其他设置的详细信息¶
本章中说明的项目如下。
6.1. 集群属性¶
可以在[集群的属性]中显示EXPRESSCLUSTER X SingleServerSafe的详细信息或更改其设置。
6.1.1. 信息标签页¶
对集群名进行显示,登录注释,更改。
集群名
显示集群名。无法在此更改名称。
注释 (127字节以内)
设置集群的注释。只能输入半角的英文数字。
语言
从下面选择集群语言。在运行Cluster WebUI的OS语言(locale)中设置。
英语
日语
中文
6.1.2. 私网标签页¶
不使用。
6.1.3. NP 解决标签页¶
不使用。
6.1.4. 超时标签页¶
设置超时值等。
网络初始化完成等待时间 (0~99)
服务器启动时,截至到自身服务器的NIC变为有效的完成时间。
同步等待时间 (0~99)
不使用。
心跳线
间隔(1~99)心跳间隔。 超时 (2~9999)心跳超时。如果在此处设置的时间内没有应答,则视为服务器宕机。需要大于间隔的值。
内部通信超时(1~9999)
在执行EXPRESSCLUSTER的命令,Cluster WebUI上的操作,显示画面时等,所执行的EXPRESSCLUSTER服务器的内部通信中使用的超时值。
默认值
返回默认值时使用。点击[默认值]则所有的项目都被设置为默认值。
6.1.5. 端口号标签页¶
设置TCP端口号,UDP端口号。
TCP
TCP的各端口号不能重复。
内部通信端口号(1~65535 3)内部通信使用的端口号。 Information Base 端口号(1~65535 3)管理集群信息时使用的端口号。 数据传送端口号(1~65535 3)事务(反映/备份集群配置信息,收发License信息,执行命令)使用的端口号。 WebManager HTTP端口号(1~65535 3)浏览器与EXPRESSCLUSTER X SingleServerSafe服务器通信时使用的端口号。 API HTTP 端口号(1~65535 3)Restful API客户端与ExpressCluster Server通信时使用的端口号。 API 内部通信端口号(1~65535 3)用于Restful API内部通信的端口号。 磁盘Agent端口号(1~65535 3)不使用。 镜像驱动端口号(1~65535 3)不使用。
UDP
TCP/UDP
客户端服务端口号(1~65535 3)客户端服务使用的端口号。
默认值
返回默认值时使用。点击[默认值]则所有的项目被设为默认值。
6.1.6. 监视标签页¶
进行监视相关设置。
系统资源
设置收集/不收集系统资源信息。为了活用性的提高,定期收集系统资源信息。系统资源信息有益于调查EXPRESSCLUSTER的运行状况,可以比较容易找出因系统资源不足而产生的故障。
选中复选框定期收集集群运行时的CPU,内存,进程等系统信息。收集系统信息可以用clplogcc命令和Cluster WebUI上的日志收集进行收集。用clplogcc命令收集日志时请指定type2,用Cluster WebUI收集日志时请指定模式2。关于日志收集的详细信息请参考《操作指南》的"收集日志 (clplogcc命令)"或者在线手册。进程的启动数等依赖于系统的工作状态的资源信息的保存,需要450MB以上的磁盘空间。 不选中复选框不收集系统资源信息。
6.1.7. 复归标签页¶
进行恢复相关设置。
集群服务的进程异常时动作
指定集群服务的进程发生异常时动作。
紧急关机关闭服务器。 生成主动停止错误生成主动停止错误(Panic)后再重新启动服务器。 HW重置HW重设导致服务器重新启动。
HA进程异常时工作
最大再启动次数 (0~99)指定HA进程异常时的重新启动次数。 重试结束时动作指定HA进程异常时的动作。
停止集群服务停止集群服务。 停止集群服务和关闭操作系统停止集群服务和关闭操作系统。 停止集群服务和重启操作系统停止集群服务和重启操作系统。
注解
HA进程是系统监视资源或进程资源监视资源,JVM监视资源,系统资源信息收集功能中使用的进程。
发生/失控指定组资源的启动/停止发生宕机时的动作
紧急关机关闭发生宕机的服务器。 生成主动停止错误使发生宕机的服务器产生故意停止错误(Panic)。 无任何动作作(作为启动/停止异常来处理)进行检测出组资源的启动/停止异常时的复归动作。有
注解
指定为「不进行任何操作(作为启动/停止异常来处理)」,在发生宕机时,对组资源的影响变为不确定,因此不建议将设定更改为「不进行任何操作(作为启动/停止异常来处理)」。
指定为「不进行任何操作(作为启动/停止异常来处理)」时,检测出组资源的启动/停止异常时的复归动作的设定如下所示。
启动/停止重试次数: 0次
失效切换阈值: 0次
最终动作:产生故意停止错误
在最终动作指定为[集群服务停止并关闭OS]或者[集群服务停止并重启OS]时,停止集群服务需花费较多时间。
抑制异常检测时操作系统停止执行的最终动作
点击[详细设置],设置随查出异常而OS停止时的最终动作控制。
检测到组资源的启动异常时:查出组资源启动异常时的最终动作设置为随OS停止而发生的情况下,查出启动异常时控制最终动作。 检测到组资源的停止异常时:查出组资源停止异常时的最终动作设置为随OS停止而发生的情况下,查出停止异常时控制最终动作。 监视资源查出异常时:检测出监视资源异常时的最终动作设置为随OS停止而发生的情况下,查出异常时控制最终动作。
注解
消息接收监视资源不属于查出异常时控制操作的对象。
检测出组资源的启动/停止异常时的最终动作和检测出监视资源异常时的最终动作,伴随OS停止情况如下。
Cluster服务停止和OS关机
Cluster服务停止和OS重启
发生主动停止错误
抑制检测到双重启动时的关机
不使用。
6.1.8. Alert服务标签页¶
设置警报通报,机箱ID指示灯联动,网络警告灯。
注解
要使用邮件通告功能,网络警告灯,请购买EXPRESSCLUSTER X SingleServerSafe Alert Service 4.3 for Windows,注册License。
使Alert通报设置生效
邮件地址 (255字节以内)
输入通报目标的邮件地址。如果要设置多个邮件地址,请用分号分隔邮件地址。
主题 (127字节以内)
输入邮件的主题。
邮件发送方法
设置邮件发送方法。当前只能选择SMTP。
SMTP直接与SMTP服务器通信并发送邮件。
发送地址设置
设置SNMP Trap发送功能。如果要设置SNMP Trap的发送地址时,点击[设置]进行发送地址的设置。
使用机箱ID 指示灯
不使用。
重复执行。
不使用。
不重复执行。
不使用。
使用网络警告灯
不使用。
更改警报发送目标
点击[编辑],显示[Alert发送地址的变更]对话框。
添加
追加要定制通报接收方的警报ID。点击[添加]按钮后,显示输入消息对话框。
分类
选择模块类型的大分类。
模块类型 (31字节以内)
选择要更改发送方的模块类型名。
事件ID
发送地址
选择要作为消息发送执行的处理。
Alert Logs在警报日志中显示消息。 Alert Extension执行指定的命令(警报扩展功能)。设置,更改通过[添加]按钮,[编辑]按钮执行的命令。(最多可指定4个命令行)。 Mail Report通过邮件通报功能发送。 SNMP Trap使用SNMP Trap发送功能来送信。 Message Topic发送到Amazon SNS。 Event Log(DisableOnly)取消复选后不记录到OS的EventLog。(不能更改成输出不输出到EventLog的消息)。
添加
追加警报扩展功能的命令。点击[添加]按钮后,显示命令输入对话框。
命令 (511字节以内)
输入任意一个命令。
关于关键词指定%%MSG%%后,将插入相应ID的消息正文。对于1个命令,不能够使用多个%%MSG%%。设置时,包括%%MSG%%的内容在内,长度需要控制在511个字节内。此外,%%MSG%%中有时会含有半角空格,指定为命令的参数时,请指定\"%%MSG%%\"。
删除
删除警报扩展功能的命令时使用。选择命令后,请点击[删除]按钮。
编辑
编辑警报扩展功能的命令时使用。请选择命令,点击[编辑]按钮。
SMTP设置
点击[SMTP设置],显示邮件通报使用的[SMTP设置]对话框。
邮件发送文书的字符编码(127字节以内)
设置邮件通报时发送邮件的字符编码。
通信应答的等待时间(1~999)
设置与SMTP服务器之间的通信超时时间。
主题的编码
设置是否对邮件主题进行编码。
SMTP服务器列表
显示当前设置的SMTP服务器。本版本能够设置1台SMTP服务器。
添加
添加SMTP 服务器。点击[添加]按钮后,显示SMTP的输入对话框。
删除
删除SMTP 服务器的设置时使用。
编辑
更改SMTP 服务器的设置时使用。
SMTP服务器 (255字节以内)
设置SMTP服务器的IP地址或主机名。
SMTP端口号 (1~65535)
设置SMTP服务器的端口号。
发信人邮件地址 (255字节以内)
设置邮件通报时发送邮件的发件人地址。
SMTP认证有效
设置是否进行SMTP认证。
认证方式
选择SMTP认证方式。
用户名 (255字节以内)
设置SMTP认证时使用的用户名。
密码 (255字节以内)
设置SMTP认证使用的密码。
SNMP设置
点击SNMP Trap的[设置] 按钮,在SNMP Trap中使用的 [发送地址设置]对话框会表示出来。
发送地址一览
显示设定的SNMP Trap发送地址。本版本中可设定的SNMP Trap发送地址最多为32件。
添加
添加SNMP Trap发送地址。点击[添加],显示发送地址的输入对话框。
删除
删除SNMP Trap发送地址的设置时使用。
编辑
更改SNMP Trap发送地址的设置时使用。
发送地址服务器 (255 字节以内)
设置SNMP Trap发送目的地的服务器名。
SNMP 端口号 (1-65535)
设置SNMP Trap发送目的地的端口号。
SNMP版本
设置SNMP Trap发送目的地的SNMP版本。
SNMP团体名 (255字节以内)
设置SNMP Trap发送目的地的SNMP Community名。
6.1.9. WebManager标签页¶
设置WebManager服务器。
使WebManager服务有效
将WebManager服务器设为有效。
选中复选框WebManager服务器生效。 未选中复选框WebManager服务器失效。
通信方式
HTTP与客户端的通信不使用加密。 HTTPS与客户端的通信使用加密。
可连接的客户端台数 (1~999)
设置可以连接的客户端台数。
由密码来控制连接
点击[设置],则显示[密码]对话框。
集群密码方式/OS认证方式
从下面选择登录到Cluster WebUI的方法。
集群密码方式用设置的操作密码,参考密码进行认证的方式。 OS认证方式用OS的用户,密码进行认证的方式。
集群密码方式
操作用密码
在Cluster WebUI中设置以操作模式连接所需的密码。点击[更改],则显示[输入密码]对话框。参照用密码
在Cluster WebUI中设置以只读模式连接所需的密码。点击[更改],则显示[输入密码]对话框。旧密码(255字节以内)
输入更改前的密码。没有设置旧密码时不输入任何内容。新密码(255字节以内)
输入新密码。删除密码时不输入任何内容。密码输入的确认(255字节以内)
重新输入新密码。
OS认证方式
登录Cluster WebUI的用户必须预先在服务器中注册。此外,由于为每个组设置了集群的操作权限,因此需要在服务器上注册该组并使用户属于该组。
服务器属于工作组时在服务器上注册用户和组。 服务器属于域时在域上注册用户和组。
添加
在将组添加到[授权的组列表]中时使用。点击[添加],显示[组名]对话框。选中[操作权限]复选框的状态下添加新组。
组名 (255 字节以内)输入授权的组名。向属于指定组的用户授权。组必须预先在服务器上注册。
删除
从[授权的组列表]中删除组时使用。从[授权的组列表]中选择要删除的组,点击[删除]。
编辑
编辑组时使用。从[授权的组列表]中选择要编辑的组,点击[编辑]。显示输入被选中组的[组名]的对话框。编辑后的组的操作权限不变。
操作权限
设置[授权的组列表]中注册的组的操作权限。
选中复选框属于该组的用户可以进行集群操作和状态显示。 未选中复选框属于该组的用户只可以进行集群状态显示。
登录会话的有效时间(0~525600)
登录会话的有效时间。如果设置为0则不会过期。
自动注销时间(0~99999)
Cluster WebUI和WebManager服务器之间没有通信时,自动注销的时间。设置为0时不会自动注销。
锁定阈值(0~999)
用于锁定连续登陆失败的客户端IP地址的阈值。被锁定的客户端IP地址,在锁定期结束之前都无法登陆。设置为0时客户端IP地址不会被锁定。
锁定时间(1~99999)
锁定的客户端IP地址自动解锁之前的时间。
默认值
返回默认值时使用。点击[默认值] ,则 登录会话的有效时间,自动注销时间,锁定阈值,锁定时间 都被设置为默认值。
通过客户端IP地址控制连接
通过客户端IP地址控制连接。
选中复选框显示[添加],[删除],[编辑]按钮。 取消选中复选框不显示[添加],[删除],[编辑]按钮。
添加
在[客户端IP地址限制连接列表]中添加IP地址时使用。点击[添加]按钮则显示IP地址的输入对话框。新添加有操作权的IP地址。
IP地址 (80字节以内)输入允许连接的客户端IP地址。 IP地址时 : 10.0.0.21 网络地址时 : 10.0.1.0/24
删除
从[客户端IP地址限制连接列表]中删除IP地址时使用。从[客户端IP地址限制连接列表] 选择想要删除的IP地址,点击[删除]按钮。
编辑
编辑IP地址时使用。从[客户端IP地址限制连接列表]中选择想要编辑的IP地址,点击[编辑]按钮。显示输入选择的IP地址的IP地址输入对话框。编辑的IP地址的操作权不变。
操作权
给[客户端IP地址限制连接列表]中登录的IP地址设置操作权。
选中复选框客户端执行EXPRESSCLUSTER X SingleServerSafe的操作和状态显示。 取消选中复选框客户端只执行EXPRESSCLUSTER X SingleServerSafe的状态显示。
导出Cluster WebUI的操作日志
输出Cluster WebUI的操作日志。
选中复选框输出Cluster WebUI的操作日志。 不选中复选框不输出Cluster WebUI的操作日志。
日志输出路径 (255 字节内)
指定Cluster WebUI操作日志的输出目录。请指定绝对路径和ASCII字符。
文件大小 (1~10)
指定Cluster WebUI操作日志的大小。当达到指定的文件大小时,将进行轮询。最多可以保存5代日志文件。
连接用IP地址
选择[设置]按钮,出现[集成WebManager用的IP地址]画面。
添加添加集成WebManager用IP地址。点击各服务器列选择或者输入相关的IP地址。部分不能连接的服务器,服务器列不需要输入任何信息。 删除删除通信线路。选择想要削除的通信线路列,点击[删除],删除所选择的IP地址。 优先级当设置了多个集成WebManager用得IP地址时,优先选择[优先级]序号小的线路作为内部通信使用。点击箭头,可以更改选择行的优先等级。
调整
调整WebManager服务器时使用。点击[调整]按钮,则显示[Web管理器调整属性]对话框。
客户端超时 (1~999)WebManager服务器无法与Cluster WebUI通信的超时时间。 画面数据的更新间隔 (0~999)Cluster WebUI的画面数据更新的间隔。 镜像Agent超时 (1~999)不使用。 日志文件的有效期限 (60~43200)服务器上临时保存的日志收集信息的删除有效期限。从显示保存日志收集信息对话框开始,如果在不执行保存的状态下超过该处设置的有效期限,服务器上保存的日志收集信息将被删除。 使用时刻信息显示功能设置时刻信息显示功能的有效/无效。
复选框选中时刻信息显示功能有效。 复选框未选中时刻信息显示功能无效。 默认值返回默认值时使用。点击[默认值]则所有的项目被设为默认值。
6.1.10. API标签页¶
设置API服务。
启用API服务
启用API服务。
选中复选框启用API服务。 不选中复选框禁用API服务。
通信方式
HTTP与客户端通信时不使用加密。 HTTPS与客户端通信时使用加密。
以组为单位设置权限
为每个组设置和控制集群的搜查权限。
选中复选框显示[添加],[删除],[编辑]。 不选中复选框不显示[添加],[删除],[编辑]。登录到发出请求的服务器的用户必须事先在服务器中注册。此外,由于为每个组设置了集群的操作权限,因此有必要在服务器中注册组,并且用户要属于该组。
用户属于工作组时在发出请求的所有服务器上以相同名称注册用户和组。 服务器属于域时在域中注册用户和组。
添加
在[授权组列表]中添加组时使用。点击[添加]显示[组名]对话框。在[操作权限]为ON的状态下添加新的组。
组名 (255 字节以内)输入授权的组名。向属于指定组的用户授权。组必须预先在服务器上注册。
删除
从[授权组列表]中删除组时使用。请从[授权组列表]中选择要删除的组,点击[删除]。
编辑
编辑组时使用。从[授权组列表]中选择要编辑的组,点击[编辑]。显示已输入选择组的[组名]对话框。已编辑的组的操作权限不会改变。
操作权限
设置[授权组列表]中注册的组的操作权限。
选中复选框属于该组的用户可以进行集群操作和获取各种状态。 不选中复选框属于该组的用户仅可以获取各种状态。
通过客户端IP地址控制连接
通过客户端IP地址控制连接。
选中复选框显示[添加],[删除],[编辑]。 不选中复选框不显示[添加],[删除],[编辑]。
添加
在[允许连接的客户端IP地址列表]中添加IP地址时使用。点击[添加]则显示输入IP地址的对话框。新添加的IP地址具有操作权限。
IP地址 (80 字节以内)
输入允许连接的客户端IP地址。
IP地址示例: 10.0.0.21
网络地址示例: 10.0.1.0/24
删除
在[允许连接的客户端IP地址列表]中删除IP地址时使用。请在[允许连接的客户端IP地址列表]中选择要删除的IP地址,点击[删除]。
编辑
编辑IP地址时使用。在[允许连接的客户端IP地址列表]中选择要编辑的IP地址,点击[编辑]。选择IP地址后,会在[IP地址]对话框中表示。
操作权
对[通过客户端IP地址控制连接]中登录的IP地址设置操作权。
选中复选框客户端可进行集群的操作和状态显示。 不选中复选框客户端仅能显示集群状态。
调整
调整API服务时使用。点击[调整],则显示[API调整属性]对话框。
认证锁定的阈值设置确定对HTTP服务器的认证连续失败时锁定的次数。 启动HTTP服务器的重试次数设置API服务启动HTTP服务器失败时的启动重试次数。 HTTP服务器启动间隔设置从API服务启动HTTP服务器失败到重试下一次启动之间的时间间隔。 默认值返回默认值时使用。点击[默认值],所有项目都被设置为默认值。
6.1.11. 加密标签页¶
设置集群相关服务加密时使用的文件及库。
证书文件
设置与客户端通信时使用的服务器证书文件。服务器证书文件需要单独准备。
私钥文件
设置与客户端通信时使用的私钥文件。私钥文件需要单独准备。
SSL链接库
设置加密用的SSL链接库。请指定OpenSSL所提供的SSL链接库。请根据安装目录等环境不同而设定。
Crypto链接库
设置加密用的Crypto链接库。请指定OpenSSL所提同的Crypto链接库。请根据安装目录等环境不同而设定。
6.1.12. Alert日志标签页¶
设置警报日志。
使Alert服务有效
设置是否启动服务器的EXPRESSCLUSTER X SingleServerSafe Web Alert服务。
选中复选框EXPRESSCLUSTER X SingleServerSafe Web Alert服务生效。 取消选中复选框EXPRESSCLUSTER X SingleServerSafe Web Alert服务失效。
保存最大Alert记录数 (1~99999)
服务器的EXPRESSCLUSTER X SingleServerSafe Web Alert服务可以保存的最大警报消息数。
Alert同步:方式
不使用。
Alert同步:通信超时(1~300)
不使用。
默认值
返回默认值时使用。点击[默认值]则所有的项目被设为默认值。
6.1.13. 延迟警告标签页¶
设置延迟警告。关于延迟警告的详细内容,请参考"7. 监视动作的详细信息"的"监视资源延迟警告"。
心跳延迟警告 (1~99)
设置心跳延迟警告的比例。如果在此处指定的心跳超时时间的百分比内没有心跳应答,则在警报日志中显示警告。
监视延迟警告 (1~99)
设置监视延迟警告的比例。如果在此处指定的监视超时时间的百分比内没有监视器应答,则在警报日志中显示警告。
COM延迟警告 (1~99)
不使用。
默认值
返回默认值时使用。点击[默认值]按钮则所有的项目被设为默认值。
6.1.14. 磁盘标签页¶
不使用。
6.1.15. 镜像磁盘标签页¶
不使用。
6.1.16. 账户标签页¶
使用兼容命令[ARMLOAD]命令的/U选项,或者集群系统执行的脚本等,登录/删除使用的用户账号。最大可以设置16个用户账号。
添加
在[账户列表]中添加用户账号时使用。点击[添加]则显示[输入账户]的对话框。
用户名输入登录的用户账号名。指定域的账号时,输入格式如"域名/账号名"。 密码输入登录的用户账号的密码。
删除
从[账户列表]中删除用户账号时使用。从[账户列表]中选择想要删除的用户账号,点击[删除]按钮。
编辑
编辑用户账号时使用。从[账户列表]选择想要编辑的用户账号,点击[编辑]按钮。显示输入了选择的用户账号的[账户输入]对话框。
6.1.17. RIP (互换) 标签页¶
不使用。
6.1.18. 迁移标签页¶
不使用。
6.1.19. JVM监视标签页¶
设置JVM监视中使用的详细参数。
注解
使用Cluster WebUI的编辑模式时为了显示JVM监视标签页,在Java Resource Agent的License被登入的情况下,需要执行[更新服务器信息]。
Java安装路径 (255字节以内)
设置JVM监视中使用的Java VM的安装路径。请一定指定为绝对路径和ASCII文字。末尾不要添加"/"。设置例:C:\Program Files\Java\jdk1.8.0_102
最大Java堆大小 (7~4096)
JVM监视中使用的Java VM的最大堆大小使用兆字节来设定(相当于Java VM启动时的选项-Xmx)。
Java VM追加选项 (1024字节以内)
设置JVM监视中使用的Java VM的启动时选项。但是,-Xmx请在 [最大Java VM大小]中指定。指定例:-XX:+UseSerialGC。
日志输出设定
点击[设置]按钮时,会显示输入日志输出设置的对话框。
资源测量设定
点击[设置]按钮时,会显示输入资源测试设置的对话框。
连接设定
点击[设置]按钮时,会显示输入连接设置的对话框。
负载均衡器联动设定
点击[设置]按钮时,会显示输入负载均衡联动设置的对话框。
日志输出设定
点击[设置]按钮时,会显示输入日志输出设置的对话框。
日志等级
选择JVM监视输出的日志的日志等级。
保有的世代数 (2~100)
对JVM监视输出的日志,进行保持版本数的设置。[轮循方式]中指定[时间]时,因为执行了集群挂起就重置轮循次数,所以请注意每次挂起< EXPRESSCLUSTER安装路径>\log\ha\jra 下的日志文件都会增加。
轮循方式
选择JVM监视输出的日志的Rotation方式。根据文件大小进行Rotation时,将JVM运用日志等每一个日志文件的最大容量设置为千字节(范围为200~2097151)。根据时间进行Rotation时,则将日志Rotation的开始时刻设置为"hh:mm"形式(hh:指定为0~23小时,mm:指定为0~59分),将Rotation间隔设置为小时(范围为1~8784)。
默认值
将日志等级,保持版本数和Rotataion方式设置为返回默认值。
资源测量设定[共通]
重试次数 (1~1440)
设置JVM中的资源监测失败时资源监测的重试次数。
异常判定次数 (1~10)
当JVM中通过资源监测获得的Java VM,应用程序服务器的资源使用量连续超出客户定义的限度值时,判断为异常的设置次数。
间隔 内存使用量・动作线程数 (15~600)
设置JVM中的监测储存器使用量和工作线程数之间的间隔。
间隔 Full GC发生次数・执行时间 (15~600)
设置JVM中的监测Full GC发生次数和发生时间之间的间隔。
默认值
将重试次数,异常判断限度值和间隔的设置返回默认值。
资源测量设定[WebLogic]
重试次数 (1~5)
设置JVM中的资源监测失败时资源监测的重试次数。
异常判定次数 (1~10)
当JVM中通过资源监测获得的Java VM,应用程序服务器的资源使用量连续超出客户定义的限度值时,判断为异常的设置次数。
间隔 请求数 (15~600)
设置JVM中的WebLogic监视中监测工作管理器和线程Poor的要求数之间的间隔。
间隔 平均值 (15~600)
设置JVM中的WebLogic监视中监测工作管理器和线程Poor的要求数平均值之间的间隔。请将此数值设置为间隔 要求数中设定数值的整数倍数。
默认值
将重试次数,异常判断限度值和间隔的设置返回默认值。
连接设定
点击[设置]按钮,显示连接监视目标的Java VM的设置输入对话框。
管理端口号 (1~65535)
设置JVM监视资源内部使用的端口号。请不要覆盖其他端口号。不推荐使用42424~61000号。
重试次数 (1~5)
设置连接监视对象的Java VM失败时的重试次数。
到再次连接为止的等待时间 (15~60)
设置连接监视对象的Java VM失败时,到下一次连接前的间隔时间。
默认值
将管理端口号,重试次数,下一次连接前的等待时间的设置返回默认值。
负载均衡器联动设定
点击[设置]按钮,显示输入负载均衡器联动设置的对话框。
负载均衡器联动的管理端口号 (1~65535)
设置负载均衡器联动功能中使用的端口号。不推荐使用42424~61000号。
存活侦测(Help Check)功能联合
设置监视对象的Java VM检测出障碍时,是否使用负载均衡器的Help Check功能。
HTML文件保存目录(255字节以内)
设置使用负载均衡器的Help Check功能的HTML文件的保存目录。请一定指定使用绝对路径和ASCII文字。末尾不要添加"/"。
HTML文件名 (255字节以内)
设置使用负载均衡器的Help Check功能的HTML文件名。请指定使用ASCII文字。
HTML重命名文件名 (255字节以内)
设置使用负载均衡器的Help Check功能的HTML重命名文件名。请指定使用ASCII文字。请指定与[HTML文件名]不同的文件名。
重命名重试次数 (0~5)
设置HTML文件的重命名失败时的重试次数。
到重试的等待时间 (1~60)
设置HTML文件的重命名失败时,到下一次重试前之间的间隔。
默认值
将负载均衡器联动管理端口号,与Help Check功能联动,HTML保存目录,HTML文件名,HTML重命名文件名,重命名失败时的下一次重试次数,重试前的等待时间的设置返回默认值。
负载均衡器联动设定
负载均衡器类型选择[BIG-IP LTM]后,按[设置]按钮,则显示负载均衡器联动设定输入的对话框。
负载均衡器联动的管理端口号 (1~65535)
设置负载均衡器联动功能所使用的端口号。不推荐42424~61000端口。
mgmt IP地址
设置BIG-IP LTM的IP地址。
用户名(255字节以内)
设置BIG-IP LTM管理用户名。
密码(255字节以内)
设置BIG-IP LTM管理用户密码。
通信端口号 (1~65535)
设置与BIG-IP LTM通信的端口号。
添加
添加均衡节点的服务器名和IP地址。设置服务器名与EXPRESSCLUSTER的服务器名同值,设置IP地址与BIG-IP Configration Utility的[LocalTrafic]-[Pools:PoolList]-[对应pool]-[Members]的Members同值。更改时,选择要更改的行,进行直接编辑。
删除
删除均衡节点的服务器名和IP地址。选择要删除的行后,点击[删除],则选中的服务器将被删除。
默认值
负载均衡器联动管理端口号,管理用户名,通信端口号返回默认值设定。
6.1.20. 云标签页¶
设置在云环境中使用的功能。
启用Amazon SNS联动功能
设置Amazon SNS联动功能。
选中复选框启用Amazon SNS联动功能。使用Amazon SNS作为EXPRESSCLUSTER消息的发送目标。发送其他消息时请在[集群属性]-[警报服务]标签页-[更改警报发送地址]的[发送地址]中设置[Message Topic]。 不选中复选框禁用Amazon SNS联动功能。
TopicArn
设置要在Amazon SNS联动功能中使用的TopicArn。
启用Amazon CloudWatch联动功能
设置Amazon CloudWatch联动功能。
选中复选框启用Amazon CloudWatch联动功能。将监视资源的监视处理时间发送到Amazon CloudWatch。 不选中复选框禁用Amazon CloudWatch联动功能。
注解
使用Amazon CloudWatch联动功能时,必须选中[将Amazon CloudWatch联动功能设置为有效],并将对象监视资源的[监视(共通)]标签页-[发送监视处理时间度量]设置为有效。
Namespace
设置Amazon CloudWatch联动功能中使用的Namespace。
度量的发送间隔
设置将监视资源的监视处理时间发送到Amazon CloudWatch的频率。
6.1.21. 扩展标签页¶
设置集群的其他机能。
再启动限制
可以分别为组资源和监视器资源设置发现异常时最终运行是[Reboot OS]还是[Shut down OS]。如果进行了该设置,则可执行会一直重复重启。此时,可以通过设置重启次数限制重启重复。
最大再启动次数 (0~99)设置重启的限制次数。此处指定的次数在组资源,监视资源中分别计算。 重置最大再启动次数的时间 (0~999)指定了最大重启次数时,如果从集群启动开始正常运行持续了此处所指定的时间,则重启次数将被重置。此处指定的时间将在组资源和监视资源中分别计算。注解
[最大再启动次数]设置为大于等于1的数字时,[重置最大再启动次数的时间]也需要设置为大于等于1的数字。[重置最大再启动次数的时间]设置为0时,再启动次数限制为无效,不按照最大再启动次数的设置,每次发现异常时就关闭或重启。
使用强制停止功能
不使用。
强制停止操作
不使用。
强制停止超时 (0~99)
不使用。
虚拟机强制停止设定
不使用。
运行强制停止脚本
不使用。
脚本设置
不使用。
使用CPU频率控制功能
使用CPU频率控制功能时,选中复选框。未选中时,则无法使用CPU频率控制功能。
参见
注解
使用CPU频率控制功能时,以下几点是必须的:可以在BIOS设置中变更CPU频率;CPU通过Windows OS电源管理功能支持频率的控制。
注解
自动复归
开自动复原。 关闭不自动复原。
失效切换次数计算单位
不使用。
服务器组间失效切换的宽限时间(0~99999)
不使用。
禁用集群动作
自动启动组
选中复选框禁用组的自动启动。 未选中复选框启用组的自动启动。 检测到组资源的启动异常时的复归动作
选中复选框禁用检测到组资源的启动异常时的复归动作。 不选中复选框不禁用检测到组资源的启动异常时的复归动作。 检测到组资源的停止异常时的复归动作
选中复选框禁用检测到组资源的停止异常时的复归动作。 不选中复选框不禁用检测到组资源的停止异常时的复归动作。 监视资源异常检出时的复归动作
选中复选框禁用监视资源查出异常时的复归动作。 不选中复选框不禁用监视资源查出异常时的复归动作。注解
以下操作不作为禁用监视资源查出异常时的复归动作的对象。・在磁盘RW监视资源中检测到停止异常时的动作・用户空间监视资源中发生超时时的动作・消息接收监视资源的复归动作
集群统计信息
默认值
返回默认值时使用。点击[默认值]则所有项目均被设置为默认值。
6.2. 服务器属性¶
在服务器的属性中添加,删除,编辑构成集群的各服务器中使用的接口(IP地址或设备)。在各服务器中设置相同数量的接口(以下称I/F)。I/F编号表示在Builder中登录的顺序的编号。与OS中设置的编号无关。
1台服务器内不能存在属于同一网络地址的IP地址。此外,也不能是如下所示的包含关系。
IP地址:10.1.1.10,子网掩码:255.255.0.0
IP地址:10.1.2.10,子网掩码:255.255.255.0
6.2.1. 信息标签页¶
进行服务器名的显示,登录注释,更改。
名称
显示服务器名。无法在此更改名称。
注释(127字节以内)
设置服务器的注释。只能输入半角英文数字。
虚拟机
指定该服务器是否为虚拟机 (客户机OS)。
选中复选框显示虚拟机 (客户机OS)。可进行虚拟机的设置。 不选中复选框显示物理机。不能进行虚拟机的设置。
种类
指定虚拟化基础架构的种类。
vSphereVmware公司的虚拟化基础架构。 KVMLinux内核虚拟化基础架构。 XenServerCitrix公司的虚拟化基础架构。 ContainerOracle公司的虚拟化基础架构。 Hyper-VMicrosoft公司的虚拟化基础架构。 other使用其他虚拟化基础架构时设定。
强制停止设定
不使用。
6.2.2. 警告灯标签页¶
不使用。
6.2.3. BMC标签页¶
不使用。
6.2.4. HBA标签页¶
不使用。
6.3. 最大登录数量一览表¶
Version |
最大登录数量 |
|
---|---|---|
服务器 |
4.0.0-1以上 |
1 |
组 |
4.0.0-1以上 |
128 |
组资源
(每组)
|
4.0.0-1以上 |
512 |
监视资源 |
4.0.0-1以上 |
384 |
系统监视资源 |
4.0.0-1以上 |
1 |
进程资源监视资源 |
4.1.0-1以上 |
1 |
7. 监视动作的详细信息¶
7.1. 关于不间断监视和启动时监视¶
7.2. 发生/解除监视资源的模拟故障¶
可使监视资源发生模拟故障。此外,也可解除模拟故障。发生/解除模拟故障的方法有以下 2种。
- 使用Cluster WebUI (验证模式)进行操作Cluster WebUI (验证模式)中,不能控制的监视资源的右点击菜单变为无效。
- 使用[clpmonctrl]命令进行操作[clpmonctrl]命令中,对执行命令的服务器上的监视资源进行控制。如果对不能控制的监视资源执行命令时,虽然命令执行上成功,但是不能使监视资源发生模拟故障。
监视资源中含有可发生/解除模拟故障的资源和不能发生/解除模拟故障的资源。请参照《操作指南》的"EXPRESSCLUSTER X SingleServerSafe 命令参考"的"控制监视资源 (clpmonctrl命令)"。
如果在模拟故障发生状态中进行了下述的操作,则监视资源的模拟故障将被解除。
Cluster WebUI (验证模式)中执行监视资源的[解除模拟故障]时
在Cluster WebUI的模式从[验证模式]变更为其他模式时输出的对话框中,选择 [确定]时
Clpmonctrl命令中指定了-n选项时
停止了集群时
挂起了集群时
7.3. 监视资源监视间隔机制¶
所有监视资源每隔固定的监视间隔时间执行监视。
下面通过时序来说明根据设置的监视间隔时间进行正常监视以及异常时对监视资源进行监视的流程。
发现监视正常执行时
设置值如下所示时的运行示例:
<监视>监视间隔 30秒监视超时 60秒监视重试次数 0次
发现监视出现异常时(未进行监视重试设置)
发现监视异常后,在下次监视时会查出监视异常,然后对恢复对象进行重新启动。
设置值如下所示时的运行示例:
<监视>监视间隔 30秒监视超时 60秒监视重试次数 0次<发现异常>恢复动作 重启以下的目标复归对象 组复归脚本执行次数 0次最大重启动次数 0次最终动作 无操作
查出监视异常时(对监视重试进行设置)
发生监视异常后,会在每次监视时发现监视异常,若在重试监视次数内无法恢复,则对恢复对象重新启动。
设置值如下所示时的运行示例:
<监视>监视间隔 30秒监视超时 60秒监视重试次数 2次<发现异常>恢复动作 重启以下的目标复归对象 组复归脚本执行次数 0次最大重启动次数 0次最终动作 无操作
查出监视超时时(未进行监视重试设置)
发生监视超时后,会立即对针对恢复对象执行的恢复操作进行重新启动。
设置值如下所示时的运行示例:
<监视>监视间隔 30秒监视超时 60秒监视重试次数 0次<发现异常>恢复动作 重启以下的目标复归对象 组复归脚本执行次数 0次最大重启动次数 0次最终动作 无操作
查出监视超时时(对监视重试进行了设置)
监视超时发生后,进行监视重试,对恢复对象进行重新启动。
设置值如下所示时的运行示例:
<监视>监视间隔 30秒监视超时 60秒监视重试次数 1次<发现异常>恢复动作 重启以下的目标复归对象 组复归脚本执行次数 0次最大重启动次数 0次最终动作 无操作
7.4. 监视资源发现异常时的操作¶
发现异常时对恢复对象执行的恢复操作如下所示。
发现监视对象的异常后,执行复归脚本。
按次数执行复归脚本后,重新启动复归对象。若设置有重新启动前执行脚本,则执行脚本后再重新启动。
若发现监视对象出现异常,则重新启动恢复对象(恢复操作为[只执行最终动作]时,及[自定义设置]中重新启动界限值设置为0时不执行重新启动)。
重新启动失败时,或者即使执行重新启动也发现异常时,进行最终操作。([自定义设置]中设置的重新启动次数的最大值大于2时,连指定次数都要再次进行重新启动。)
复归操作针对的复归对象必须处于以下状态。
恢复对象 |
状态 |
重新启动 4 |
最终运行 5 |
---|---|---|---|
组/ |
已停止 |
No |
No |
组资源 |
正在启动/停止 |
No |
No |
已启动 |
Yes |
Yes |
|
异常 |
Yes |
Yes |
|
LocalServer |
- |
- |
Yes |
Yes:执行恢复运行 No:不执行恢复运行
注解
在设置查出监视资源异常的情况下将恢复对象指定为组资源(例:磁盘资源,应用程序资源),而监视资源发现异常时,处于恢复操作过渡(重新启动 -> 失效切换 -> 最终运行)的状态下,请不要执行以下命令或在Cluster WebUI中执行以下操作。
停止/暂停集群
开始/停止/移动组
7.5. 监视状态由异常恢复(正常)¶
7.6. 恢复操作时启动/停止恢复对象出现异常¶
当监视资源的监视目标与恢复对象的组资源为同一设备,发现监视异常时,可执行会在执行恢复操作过程中发生启动/停止组资源异常。
7.7. 关于复归脚本,复归操作前的脚本¶
复归脚本,复归操作前脚本使用的环境变量
EXPRESSCLUSTER X SingleServerSafe在执行脚本时,需要在环境变量中设置脚本执行时的状态(复归操作类型)等信息。在脚本内可以以下图中的环境变量为分支条件说明与系统操作相符的处理内容。
环境变量 |
环境变量的值 |
含义 |
---|---|---|
CLP_MONITORNAME
...监视资源名
|
监视资源名
|
显示查出异常(该异常导致需要执行复归脚本,复归操作前脚本)的监视资源名称。
|
CLP_VERSION_FULL
...EXPRESSCLUSTER X SingleServerSafe完整版
|
EXPRESSCLUSTER X SingleServerSafe完整版
|
显示EXPRESSCLUSTER X SingleServerSafe完整版。
(例)) 12.30
|
CLP_VERSION_MAJOR
...EXPRESSCLUSTER X SingleServerSafe主版本
|
EXPRESSCLUSTER X SingleServerSafe主版本
|
显示EXPRESSCLUSTER X SingleServerSafe主版本。
(例)12
|
CLP_PATH
...EXPRESSCLUSTER X SingleServerSafe安装路径
|
EXPRESSCLUSTER X SingleServerSafe安装路径
|
显示EXPRESSCLUSTER X SingleServerSafe的安装路径。
(例)
C:\Program Files\EXPRESSCLUSTER X SINGLESERVERSAFE SSS |
CLP_OSNAME
...服务器OS名称
|
服务器OS名称 |
显示执行脚本的服务器OS名称。
(例)Windows Server 2012 Standard
|
CLP_OSVER
...服务器OS版本
|
服务器OS版本 |
显示执行脚本的服务器OS版本。
(例)6.2.0.0.274.3
|
CLP_ACTION
复归操作类型
|
RECOVERY |
作为复归脚本执行时。 |
RESTART |
重新启动前执行时。 |
|
FAILOVER |
不使用。 |
|
FINALACTION |
最终动作前执行时。 |
|
CLP_RECOVERYCOUNT
复归脚本的执行次数
|
复归脚本执行次数 |
显示第几次执行复归脚本。 |
CLP_RESTARTCOUNT
...重新启动次数
|
重新启动次数 |
显示第几次重新启动。 |
CLP_FAILOVERCOUNT
...失效切换次数
|
失效切换次数 |
不使用。 |
注解
Windows Server 2016 之后的版本,CLP_OSVER的信息设置与Windows Server 2012 R2相同。
复归脚本,复归操作前脚本的描述流程
本节讲解了上节中说明的环境变量与实际脚本描述之间的关系。
复归脚本,复归操作前脚本的例子
rem ****************************************************** rem * preaction.bat * rem ****************************************************** echo START IF "%CLP_ACTION%"=="" GOTO NO_CLP IF "%CLP_ACTION%"=="RECOVERY" GOTO RECOVERY IF "%CLP_ACTION%"=="RESTART" GOTO RESTART IF "%CLP_ACTION%"=="FINALACTION" GOTO FINALACTION GOTO NO_CLP :RECOVERY echo RECOVERY COUNT: %CLP_RECOVERYCOUNT% rem 在这里记述了复归处理。 rem 该处理在以下时机执行。 rem rem 复归动作: 复归脚本 GOTO EXIT :RESTART echo RESTART COUNT: %CLP_RESTARTCOUNT% rem 在这里记述了重启动前处理。 rem 该处理在以下时机执行。 rem rem 复归动作: 重启动 GOTO EXIT :FINALACTION echo FINALACTION rem 在这里记述了复归处理。 rem 该处理在以下时机执行。 rem rem 复归动作:最终动作 GOTO EXIT :NO_CLP :EXIT echo EXIT exit
创建复归脚本,复归操作前脚本时的注意事项
创建脚本时请注意以下内容。
如果要执行一些需要时间的命令,请在脚本中保留用于表示命令执行完成的跟踪信息。发生故障时,可以使用这些信息来区分故障。可使用clplogcmd保留跟踪信息。
复归脚本,复归操作前脚本的注意事项
没有。
7.8. 监视资源延迟警告¶
该图显示了监视超时设置为60秒且延迟警告率设置为默认值的80%(48秒)的情况。 箭头表示监视轮询时间。
- 监视处理时间为10秒,监视资源处于正常状态。此时不发出警告。
- 监视处理时间为50秒,发现监视延迟,监视资源处于正常状态。此时,由于延迟时间超过默认监视超时时间的80%,所以发出警告通知。
- 监视处理时间超过监视超时时间,即60秒,发生监视超时,监视资源处于异常状态。此时不发出警告。
参见
监视资源的延迟警告是在[Cluster属性]->[延迟警告]标签页中的[监视延迟警告]中进行设置。
7.9. 等待开始监视监视资源¶
[监视资源配置]
<监视>间隔 30秒超时 60秒重试次数 0次开始监视的等待时间 0秒
[监视资源配置]
<监视>间隔 30秒超时 60秒重试次数 0次开始监视的等待时间 30秒
注解
使用监视控制命令,临时停止/重新启动监视资源时也是在指定的等待监视开始时间后进行。
[应用程序监视资源配置]
<监视>间隔 5秒超时 60秒重试次数 0次开始监视的等待时间 0秒(默认值)<发现异常>恢复动作 重启以下的目标复归对象 appli1最终动作 停止组
[应用程序监视资源配置]
<监视>间隔 5秒超时 60秒重试次数 0次开始监视的等待时间 60秒<发现异常>恢复动作 重启以下的目标复归对象 appli1最终动作 停止组
7.10. 监视资源发现异常时的重启次数的限制¶
注解
启动,停止组出现异常时的最终运行引起的重启次数以及监视资源出现异常时的最终运行引起的重启次数也是分别记录的。
若将重置最大重启次数的时间设置为0,则不会重置重启次数。
8. 注意限制事项¶
在本章中对注意事项,现有问题及其避免方法进行说明。
本章中说明的项目如下。
8.1. 研究系统配置时¶
对HW的准备,系统配置需要留意的事项进行说明。
8.1.1. 关于EXPRESSCLUSTER X SingleServerSafe X Alert Service¶
EXPRESSCLUSTER X SingleServerSafe X Alert Service 的License可以使用邮件通报功能,但不能使用警报灯通报功能。
8.1.2. 关于JVM监视资源¶
可同时进行监视的Java VM最多是25个。可同时监视的Java VM指,通过Cluster WebUI ([监视(固有)]标签-[识别名])可进行唯一识别的Java VM的数量。
Java VM和JVM监视资源之间的连接不支持SSL。
对Java VM进行监视时,如果存在与监视对象的名称一样的其他进程时,可执行对不同的监视对象进行C堆监视。
有时可执行不能检测出线程死锁。这是已经确认的来自JavaVM的缺陷。详细内容请参考Oracle的Bug Database的"Bug ID: 6380127 "。
JVM监视资源可监视的Java VM需与JVM监视器资源工作时的服务器在同一服务器内。
x86_64版OS上运行IA32版的监视对象的应用程序时,不能进行监视。
如果将通过Cluster WebUI ([集群的属性]-[JVM监视]标签-[最大Java堆大小])设置的最大Java堆大小值设置为3000等大数值,则JVM监视资源会启动失败。由于依赖于系统环境,请根据系统的内存搭载容量来决定。
使用负载均衡联动的监视对象Java VM的负载算出功能时,建议在SingleServerSafe中使用。
- 在监视对象Java VM的启动选项中附加「-XX:+UseG1GC」时,Java 7以前版本不能监视JVM监视资源的[属性]-[监视(固有)]标签页-[调整]属性-[内存]标签页内的设置项目。Java 8以上版本可以通过在JVM监视资源的[属性]-[监视(固有)] 标签页-[JVM类型]中选择[Oracle Java(usage monitoring)],可以进行监视。
8.2. 创建EXPRESSCLUSTER X SingleServerSafe的配置信息时¶
在设计和创建EXPRESSCLUSTER X SingleServerSafe的配置信息前,需要根据系统的配置确认并留意以下事项。
8.2.1. 有关安装路径下的文件夹和文件¶
8.2.2. 组资源停止异常时的最终运行¶
8.2.3. 延迟警告比例¶
将延迟警告比例设置为0或者100,可进行以下操作。
- 延迟警告比例设置为0时对每一监视以Alert通告延迟警告。使用该功能可计算出服务器在高负荷状态下对监视资源的轮询时间,确定监视资源的监视超时时间。
- 延迟警告比例设置为100时不通告延迟警告。
除了测试外,请不要设置0%等低数值。
8.2.4. 关于能用于脚本注释等的两字节系字符编码¶
在EXPRESSCLUSTER X SingleServerSafe中,Windows环境下编辑的脚本作为Shift-JIS使用,而Linux环境下编辑的脚本则作为EUC使用。如使用其他字符编码,可执行因环境不同而出现乱码的情况。
8.2.5. 关于JVM监视器的设定¶
监视目标为WebLogic时,对于JVM监视器资源的设定值,由于系统环境(内存搭载量等)的原因,设定范围的上限值可执行会受到限制。
[监视Work Manager的要求]-[要求数]
[监视Work Manager的要求]-[平均值]
[监视线程Pool的要求]-[待机要求 要求数]
[监视线程Pool的要求]-[待机要求 平均值]
[监视线程Pool的要求]-[执行要求 要求数]
[监视线程Pool的要求]-[执行要求 平均值]
要使用Java Resource Agent,请安装在《安装指南》- "关于EXPRESSCLUSTER X SingleServerSafe" - "确认EXPRESSCLUSTER X SingleServerSafe的运行环境" - "JVM监视器的运行环境"中记载的JRE(Java Runtime Environment),或者请安装JDK(Java Development Kit)。可与使用监视对象(WebLogic Server或WebOTX)的JRE或JDK在相同的项目中使用,也可使用在其他项目。如果一个服务器中同时安装了JRE和JDK,则使用其中任何一个即可。
监视资源名中不要含空白字符。
异常检出时根据故障原因分别执行的命令与均衡节点联动功能不能并用。
8.2.6. 关于系统监视的设置¶
- 资源监视的查出模式System Resource Agent中结合「阀值」和「监视持续时间」两个参数进行资源监视的查出。继续收集各系统资源(内存使用量,CPU 使用率,虚拟内存使用量),如果在一定时间(指定为持续时间的时间)内超过阀值时就会进行异常的查出。
8.2.7. 关于基于Windows Server 2012系统的服务失败时的恢复操作¶
在基于Windows Server 2012的系统下,将服务失败(异常结束了)时所进行的恢复操作设置为[重新启动计算机]时,实际上服务失败时的操作从原来的(Windows Server 2008以前)的OS重启,更改为伴随STOP错误的OS重启。
作为恢复操作,按照默认值[重新启动计算机]所设置的EXPRESSCLUSTER的服务如下所示。
EXPRESSCLUSTER Disk Agent服务
EXPRESSCLUSTER Server服务
EXPRESSCLUSTER Transaction服务
8.3. 更改ExpressCluster X SingleServerSafe的配置时¶
开始集群运行后如果对配置进行变更时,需要对发生的事项留意。
8.3.1. 关于资源属性的依存关系¶
8.3.2. 关于组资源的追加,删除¶
例) 将脚本资源script1从组failover1移到其他组failover2 时
从组failover1中删除script1。
执行应用配置文件。
将script1追加到组failover2中。
执行应用配置文件。
8.3.3. 关于消息接收监视资源的集群统计信息的设置¶
在更改监视资源的集群统计信息设置时,即使执行了挂起·复原,也无法在消息接收监视资源中反映集群统计信息的设置。如果要在消息接收资源中也反映集群统计信息,请重启操作系统。