1. 前言

1.1. 读者对象及用途

《EXPRESSCLUSTER X 兼容功能指南》对EXPRESSCLUSTER X 4.0 WebManager以及Builder信息等进行了说明。

1.2. 本手册的构成

1.3. EXPRESSCLUSTER X手册体系

EXPRESSCLUSTER X 的手册分为以下 6 类。各指南的标题和用途如下所示。

EXPRESSCLUSTER X 开始指南》(Getting Started Guide)

本手册的读者对象为使用EXPRESSCLUSTER的用户,对产品概要、运行环境、升级信息、现有的问题等进行了说明。

EXPRESSCLUSTER X 安装&设置指南》(Install and Configuration Guide)

本手册的读者对象为导入使用EXPRESSCLUSTER的集群系统的系统工程师以及导入集群系统后进行维护和操作的系统管理员,对导入使用EXPRESSCLUSTER的集群系统后到开始操作前的必备事项进行说明。手册按照实际导入集群系统时的顺序,对使用EXPRESSCLUSTER 的集群系统的设计方法、EXPRESSCLUSTER 的安装设置步骤、设置后的确认以及开始操作前的测试方法进行了说明。

EXPRESSCLUSTER X 参考指南》(Reference Guide)

本手册的读者对象为管理员以及使用EXPRESSCLUSTER导入集群系统的系统工程师。手册对EXPRESSCLUSTER的操作步骤、各模块的功能、维护的相关信息以及疑难解答信息等进行了说明,是对《安装&设置指南》的补充。

EXPRESSCLUSTER X 维护指南》(Maintenance Guide)

本手册的读者对象为管理员以及导入使用EXPRESSCLUSTER的集群系统后进行维护和操作的系统管理员,对EXPRESSCLUSTER的维护的相关信息进行了说明。

EXPRESSCLUSTER X 硬件整合指南》 (Hardware Feature Guide)

本手册的读者对象为管理员以及导入使用EXPRESSCLUSTER的集群系统的系统工程师,对特定的硬件以及与其整合的功能进行说明。是对《安装&设置指南》的补充。

《EXPRESSCLUSTER X 兼容功能指南》(Legacy Feature Guide)

本手册的读者对象为管理员以及导入使用EXPRESSCLUSTER的集群系统的系统工程师,对EXPRESSCLUSTER X 4.0 WebManager以及Builder的相关信息等进行了说明。

1.4. 本手册的标记规则

在本手册中,需要注意的事项、重要的事项以及相关信息等用如下方法标记。

注解

表示虽然比较重要,但是并不会引起数据损失或系统以及机器损伤的信息。

重要

表示为避免数据损失和系统、机器损坏所必需的信息。

参见

表示参考信息的位置。

另外,在手册中使用以下标记法。

标记

使用方法

[ ]方括号
在命令名的前后,
显示在画面中的字句 (对话框、菜单等) 的前后。
点击[开始]。
[属性]对话框

命令行中的[ ]方括号

表示括号内的值可以不予指定(可省)。

clpstat -s[-h host_name]

#

表示Linux用户正以root身份登录的提示符。

#clpcl -s -a

等宽字体
(courier)
路径名、命令行、系统输出(消息、提示等)、目录、文件名、函数、参数。
/Linux/4.2/cn/server/
等宽字体
粗体
(courier)
表示用户在命令提示符后实际输入的值。
输入以下内容。
clpcl -s -a
等宽字体
斜体
(courier)
用户将其替换为有效值后输入的项目。
rpm -i expresscls-<版本编号>-<发行编号>.x86_64.rpm

1.5. 最新信息来源

关于最新的产品信息,请参考以下Web站点

https://www.nec.com/global/prod/expresscluster/

2. WebManager的功能

本章就WebManager的功能进行说明。

本章中说明的项目如下。

2.1. 启动WebManager

创建集群配置信息需要访问WebManager。在此首先说明WebManager的概要,之后说明访问WebManager,创建集群配置信息的方法。

注解

在ExpressCluster X 4.0之后的版本中添加或更改的功能在WebManager中无法设置和显示。

参见

关于WebManager的运行环境,请参考Web网站。

2.1.1. 何谓WebManager

所谓WebManager ,就是通过Web 浏览器进行集群的设置及状态监视、启动/停止 服务器/组,以及收集集群运行日志等的功能。下图显示WebManager的概要。

EXPRESSCLUSTER Server端的WebManager 服务在启动OS的同时启动。

2.1.2. 设置管理PC的Java执行环境

连接Applet版的WebManager需要在管理PC的Web浏览器中安装Java插件(Java™ Runtime Environment Version 8.0 Update 162 (1.8.0_162)以上)。
如管理用PC上安装的Java插件低于上述版本,浏览器可能要求安装Java。此时,请安装经EXPRESSCLUSTER的WebManager进行运行确认的版本的Java插件。
关于在Web浏览器中嵌入Java插件的方法,请参考Web浏览器的帮助文件及JavaVM的安装指南。
在用于连接WebManager的机器上需要添加Java的例外站点。从[控制面板]打开[Java],向"例外站点"列表中,添加[用于WebManager连接的URL]。

2.1.3. 启动WebManager

WebManager的启动步骤如下所示。

  1. 启动Web浏览器。

  2. 在浏览器的地址栏中输入安装了EXPRESSCLUSTER Server的服务器的实际IP地址和端口号。

    注解

    Java Runtime Enviroment Version 9.0或更高版本时,可以从Java Web Start启动WebManager。通过该方式启动WebManager时,请将上述URL的main.htm改为main.jnlp。
    例) http://10.0.0.11:29003/main.jnlp
  3. WebManager启动。

    参见

    WebManager支持加密通信(HTTPS)。关于加密通信的详细信息请参考本指南的"3. Builder的功能"-"3.11. 集群属性"-"3.11.11. Web管理器标签页"。使用加密通信时,请输入如下的地址。
    https://10.0.0.1:29003/main.html

2.2. WebManager的画面

本章就WebManager的画面进行说明。

注解

关于WebManager画面中显示的语言请参考本指南的"3. Builder的功能"-"3.11. 集群属性"-"3.11.1. 信息标签页"。

2.2.1. WebManager的主画面

WebManager的画面由2个工具条和3个视图构成。

菜单条

可选择5个菜单。

  • 文件

  • 表示

  • 服务

  • 工具

  • 帮助

工具条

点击工具条中的组合框和图标,可以执行上部的下拉菜单中部分功能相同的操作。

图标

功能

参考

操作模式

切换到WebManager的操作模式。与选择[表示]菜单中的[操作模式]的操作相同。

2.2.2. 切换WebManager的动作模式

设定模式

切换到WebManager的设定模式(在线版Builder)。与选择[表示]菜单中的[设定模式]的操作相同。

2.2.2. 切换WebManager的动作模式

参考模式

切换到WebManager的参照模式。与选择[表示]菜单中的[参照模式]的操作相同。

2.2.2. 切换WebManager的动作模式

验证模式

切换到WebManager的验证模式。与选择[表示]菜单中的[验证模式]的操作相同。

2.2.2. 切换WebManager的动作模式

执行警报查找。与选择[工具]菜单中的[查找警报]的操作相同。

2.2.3. 在WebManager中查找警报

收集日志。与选择[工具]菜单中的[集群日志]的操作相同。

2.2.4. 使用WebManager收集日志

执行刷新。与选择[工具]菜单中的[刷新]的操作相同。

2.2.5. 将WebManager的信息更新为最新

表示选项。与选择[工具]菜单中的[选项]的操作相同。

2.2.6. 更改WebManager的画面布局

显示时刻信息。跟选择了[工具]菜单的[时刻信息]是一样的。
时刻信息被更新时,图标会变化。时刻信息对话框显示时,图标变回原来的样子。

2.2.7. 通过WebManager确认时刻信息

显示统合WebManager。与[工具]菜单上[统合管理]操作相同

2.2.8. 从WebManager启动统合WebManager

图标右侧显示当前模式。

树形图

可以确认服务器、组资源等各集群资源的状态。详细内容请参考"2.3. 在WebManager的树形图中确认各对象的状态"。

列表视图

上半部分显示树形图中选择的各集群资源的信息。下半部分以列表的形式显示各服务器、各组资源、各监视资源的启动·停止情况及注释。另外,如果点击右上方的[详细信息],则会在对话框中显示更加详细的信息。详细内容请参考"2.4. 在WebManager的列表视图中确认集群的状态"。

警报视图

作为消息显示EXPRESSCLUSTER 的运行状况。详细内容请参考"2.5. 在WebManager中确认警报"。

2.2.2. 切换WebManager的动作模式

WebManager有以下4种动作模式。

  • 操作模式
    可浏览和操作集群状态的模式。
    选择[表示]菜单中的[操作模式],或点击工具条中的组合框中的[操作模式](),则切换到操作模式。但,WebManager启动时使用浏览参照模式专用密码登录,以及从以操作受到限制的方式登录的客户端连接到WebManager时,不能切换到操作模式。
  • 设定模式
    可构建集群、更改设定的模式。设定模式中的WebManager称为在线版Builder。关于设置模式的动作,请参照下一章。
    选择[表示]菜单中的[设置模式],或点击工具条中的组合框中的[设置模式](),则切换到设置模式。但,从以操作受到限制的方式登录的客户端连接到WebManager时,不能切换到设置模式。
  • 参照模式
    只能浏览参照集群状态,不能进行操作的模式。
    选择[表示]菜单中的[参照模式],或点击工具条中的组合框中的[参照模式](),则切换到参照模式。
  • 验证模式
    使监视器资源的发生/解除模拟障碍的模式。
    选择[表示]菜单中的[验证模式],或点击工具条中的组合框中的[验证模式] (),则切换到验证模式。但是,从以操作受到限制的方式登录的客户端连接到WebManager时,不能切换到模拟模式。
    此外,从验证模式切换到其他模式时,会显示「要解除所有的模拟异常状态吗?」的对话框。选择「是」时,所有发生模拟故障状态的监视器资源会返回通常的监视状态中。选择「否」时,发生模拟异常状态的监视器资源就会在维持模拟异常的状态下切换到其他模式。

    注解

    在WebManager 的 [操作模式] [参照模式] [验证模式]下显示弹出画面的状态中,切换至 [设置模式] 时,就会结束打开的弹出画面。
    弹出画面中执行的操作会继续被执行。

2.2.3. 在WebManager中查找警报

可以使用WebManager查找警报。便于只想参考特定类型的警报等。

注解

关于警报日志,请参考"2.5. 在WebManager中确认警报"。

执行查找警报时,点击[工具]菜单中的[查找警报],或工具条中的查找警报图标()。显示设置警报日志的查找条件的画面。

只想将指定数量的过去某些警报作为查找对象时:

  1. 选择[请输入查找对象的警报数]。

  2. 输入想要查找的警报数,点击[确定],则显示指定数量的历史警报。

    注解

    可输入的警报件数最大值可通过Builder 的[集群属性]-[Alert 日志]-[保存Alert 最大记录数]进行设置。

想要指定查找条件查找时:

  1. 选择[检索条件选择]。

  2. 在各域中设置查找条件,执行查找。

    • 在[Alert类型]中选择想要显示的警报类别。

    • 在[模块名]中输入想要显示警报的模块类型。可以输入的值如下。

      模块类型

      项目

      pm

      EXPRESSCLUSTER 整体

      monp

      EXPRESSCLUSTER 整体

      rc

      组资源相关

      rm

      监视资源相关

      nm

      心跳资源相关

      apisv

      API相关

      lanhb

      LAN心跳资源

      lankhb

      内核模式LAN心跳资源

      diskhb

      磁盘心跳资源

      comhb

      COM心跳资源

      bmchb

      BMC心跳资源

      disk

      磁盘资源

      ddnsw

      动态域名解析监视资源

      fip

      浮动IP资源

      vip

      虚拟IP资源

      vipw

      VIP监视资源

      vmw

      虚拟机监视资源

      userw

      用户空间监视资源

      trnsv

      外部监视联动相关

      mm

      外部监视联动相关

      md

      镜像磁盘资源

      hd

      共享型镜像磁盘资源

      mdagent

      镜像Agent相关

      mdadmn

      镜像磁盘相关

      mdctrl

      镜像磁盘控制命令

      mdinit

      镜像磁盘初始化命令

      hdctrl

      共享型镜像磁盘控制命令

      hdinit

      共享型镜像磁盘初始化命令

      mdw

      镜像磁盘监视资源

      hdw

      共享型镜像磁盘监视资源

      cl

      集群控制命令

      cfmgr

      集群配置信息操作library

      logcmd

      消息输出命令

      mail

      邮件通报相关

      lamp

      网络警告灯通报相关

      diskperf

      磁盘的性能信息管理模块

      jra

      JVM监视器资源

      sra

      系统监视器资源

    • 在[服务器名]中输入想要显示警报的服务器。

    • 在[事件ID]中输入想要显示的事件ID。

    • 通过事件的发生时刻筛选查找条件时,在[开始时间]和[结束时间]中输入值。

  3. 在[请输入每页显示的Alert日志条数:]中指定每页显示查找结果的警报数,点击[确定]。按发生时刻降序显示查找结果。

  4. 多页显示查找结果时,点击[后退]、[下一步]、[跳过]启动。

2.2.4. 使用WebManager收集日志

点击[工具]菜单中的[收集集群日志],或工具条中的集群日志收集图标(),则显示日志收集对话框。

复选框

选择收集日志的服务器。选中收集日志的服务器的复选框。

类型

选择收集的信息。通过指定模式1~4来设置日志收集模式。

模式1

模式2

模式3

模式4

  1. 默认收集信息

  1. syslog

×

  1. core

×

  1. OS 信息

  1. script

×

×

  1. ESMPRO/AC

×

×

  1. HA日志

×

×

×

关于(1)~(7)收集类型和收集内容,请参考《参考指南》的"EXPRESSCLUSTER command reference"的"收集日志(clplogcc命令)"。

[确定]按钮

开始集群收集日志,显示集群日志收集进度对话框。

[取消]按钮

关闭对话框。

[信息]按钮

显示各类型的信息。

[默认值]按钮

服务器选择和类型选择返回默认值。

[集群日志收集进度]对话框

[更新]按钮

将集群日志收集进度对话框更新为最新状态。

[中止]按钮

中断收集集群日志。

[关闭]按钮

关闭日志收集进度对话框。继续收集集群日志。
此时,[集群日志收集]变为[进度状况]。再次显示集群日志收集进度对话框需要点击[进度状况]

日志收集结果

结果

说明

正常

成功。

中止

根据用户中断了集群日志收集。

无效参数

可能发生了内部错误。

通信错误

发生了连接错误。

超时

发生了处理超时。

收集忙

服务器状态忙。

压缩错误

压缩文件时发生了错误。

文件 I/O 错误

不存在文件。

剩余容量不足

磁盘无剩余容量。

其他异常

因为其他错误失败。

集群日志收集结束后,显示[保存]对话框,请在适当的位置下载日志。

注解

如保持此状态10分钟以上,则可能会无法正常下载。

执行日志收集,则可能在服务器端的控制台显示如下消息。

hda: bad special flag: 0x03
ip_tables: (C) 2000-2002 Netfilter core team

日志收集没有问题,请忽略本消息。

注解

集群日志收集过程中,如果显示其他模态对话框,则不显示集群日志收集的文件保存对话框。显示集群日志收集的文件保存对话框时,请关闭其他的模态对话框。

2.2.5. 将WebManager的信息更新为最新

将WebManager 中显示的信息更新为最新信息时,点击[工具]菜单中的[刷新]或工具条中的刷新图标[]。

注解

作为客户端数据更新方式,设置[RealTime]时,WebManager中显示的信息会自动更新。
作为客户端数据更新方式,设置[Polling]时,WebManager中显示的信息虽然会自动更新,但是由于是根据设定的更新间隔进行更新的,所以不一定显示的是通常最新的状态。若要显示最新内容,请在执行操作后点击[刷新]图标或[工具]菜单中的[刷新]。
WebManager的客户端数据更新方式可以通过Builder的[属性]-[ WebManager]-[调整]-[客户数据更新方法]进行设置。
WebManager的自动更新间隔可以通过Builder的[属性] - [WebManager] - [调整] - [画面数据更新间隔]进行调整。
无法与连接目标通信及连接目标中EXPRESSCLUSTER 本体没有运行时,部分对象变灰。

2.2.6. 更改WebManager的画面布局

可以通过点击区分各视图的拆分条按钮或拖动拆分条更改WebManager 的画面布局。便于只想显示特定视图等的情况下使用。
所谓拆分条,是指分隔WebManager各视图的工具条,
选择,则全部显示其视图,选择,则隐藏其视图。
更改树形图的显示项目,请点击[工具]菜单的[选项]、或者是工具条中的选项图标[]。
下面的对话框就会被显示,选中想要显示的项目。

2.2.7. 通过WebManager确认时刻信息

通过WebManager 进行时刻的确认,请点击[工具] 菜单的 [时刻信息]、或者工具栏的时刻信息图标 []。

服务器标签页中显示的时刻信息

  • 集群参加
    显示各服务器最近参加集群的时刻。

组标签页中显示的时刻信息

  • 最终活性
    显示失效切换组在各服务器上最后激活的时刻。
  • 最终活性异常
    显示组资源在各服务器上最后查出激活异常的时刻。
  • 最终非活性
    显示失效切换组在各服务器上最后非激活的时刻。
  • 最终非活性异常
    显示组资源在各服务器上最后查出非激活异常的时刻。。

监视标签页中显示的时刻信息

  • 最终异常查出
    显示各监视资源在各服务器上最后从正常状态迁移到异常状态的时刻。

[清空] 按钮

删除显示的标签页的时刻信息。

[更新] 按钮

重新取得所有的标签页的时刻信息。

[关闭] 按钮

关闭时刻信息对话框。

注解

在WebManager的 [客户端数据更新方法]中设置了[Polling]的环境下,点击本画面的[清除]按钮时,工具栏的时刻信息图标出现了点亮的情况,集群运行正常。

2.2.8. 从WebManager启动统合WebManager

为了从WebManager启动统合WebManager,点击[工具]菜单的[统合管理]、或者是工具条中的统合管理的图标[]。

2.2.9. 在WebManager中进行集群、集群服务操作

在WebManager 中进行集群服务操作时,通过[服务] 菜单选择以下各个项目。菜单上会显示[暂停集群]、[恢复集群]、[启动集群]、[停止集群]、[重启管理器]、[启动镜像代理]、[停止镜像代理]。选择菜单中的各项就可以进行如下操作。

  • 暂停集群
    暂停集群。只有集群内所有服务器都为启动状态时才可以选择。
  • 恢复集群
    重启已暂停的集群。只有集群内所有服务器都为挂起状态时才可以选择。暂停的集群保持了暂停时的组及组资源的状态。
  • 启动集群
    启动集群。只有集群为停止状态才可以选择。
  • 停止集群
    停止集群。只有集群为启动状态才可以选择。
  • 重启管理器
    重新启动管理器。
  • 启动镜像代理
    启动镜像代理。在集群停止时,不论镜像代理状态如何都可以选择。
  • 停止镜像代理
    停止镜像代理。在集群停止时,不论镜像代理状态如何都可以选择。

2.2.10. 在WebManager上确认权限

在WebManager中确认权限时,点击[帮助]菜单中的[License信息]。

注册License一览

显示登录在连接目标服务器上的权限信息。
点击列标题,可以对各种项目进行排序。
在默认状态下,[产品名]按照降序排列。

注解

某个license中包含多个license时,会分别显示每一个。

[确定]按钮。

关闭权限信息对话框。

2.3. 在WebManager的树形图中确认各对象的状态

可以通过WebManager画面从视觉上确认构成集群的各对象的状态。以下显示步骤。

  1. 启动WebManager。

  2. 在画面左侧显示树形图。根据各对象的图标形状及颜色确认状态。

    注解

    树的结构根据EXPRESSCLUSTER 的版本及同时选用的选项产品不同有所差异。

2.3.1. 关于WebManager树形图中显示的各对象的颜色

各对象的颜色含义如下。

No.

图标

状态

说明

1

Cluster

[正常]

所有的服务器、组资源和监视资源都正常

[警告]

集群内存在异常或者警告状态的服务器、组资源或者监视资源

[异常]

所有的服务器为异常状态,或者所有的服务器为宕机状态

2

All servers

[正常]

所有的服务器已启动

[警告]

集群中存在宕机的服务器

-

-

[不明]

无法获取信息

3

Individual server

[已启动]

服务器运行正常

[警告]

存在无法进行通信的服务器

[已停止] /[不明]

服务器宕机/无法获取信息

4

特定服务器
(虚拟机)

[已启动]

服务器运行正常

[警告]

存在无法进行通信的服务器

[已停止]/[不明]

服务器宕机/无法获取信息

5

LAN heartbeat resource

[正常]

可以与所有的服务器通信

[警告]

存在无法进行通信的服务器

[异常]

运行不正常

[不明]

无法获取状态

[未使用]

没有登录心跳资源

6

Kernel-mode LAN heartbeat resource

[正常]

可以与所有的服务器通信

[警告]

存在无法进行通信的服务器

[异常]

运行不正常

[不明]

无法获取状态

[未使用]

没有登录心跳资源

7

Disk heartbeat resource

[正常]

可以与所有的服务器通信

[警告]

存在无法进行通信的服务器

[异常]

运行不正常

[不明]

无法获取状态

[未使用]

没有登录心跳资源

8

COM heartbeat resource

[正常]

可以与所有的服务器通信

[警告]

存在无法进行通信的服务器

[异常]

运行不正常

[不明]

无法获取状态

[未使用]

没有登录心跳资源

9

BMC心跳资源

[正常]

可以与所有的服务器通信

[警告]

存在无法进行通信的服务器

[异常]

运行不正常

[不明]

无法获取状态

[未使用]

没有登录心跳资源

10

PING network partition resolution resource

[正常]

对于ping对象发出的ping命令有应答

[警告]

-

[异常]

对于ping对象发出的ping命令无应答

[不明]

无法取得状态

[未使用]

没有登录PING网络分区解决资源

11

All groups

[正常]

所有的组都没有发生异常

[警告]

有发生异常的组

[异常]

所有的组异常

[不明]

无法获取信息

12

Individual group

[已启动]

组已启动

[异常]

组的状态异常

[已停止] /[不明]

组已停止/无法获取信息

13

Disk resource

[已启动]

磁盘资源已启动

[异常]

磁盘资源的状态异常

[已停止] /[不明]

磁盘资源已停止/无法获取信息

14

EXEC resource

[已启动]

EXEC资源已启动

[异常]

EXEC资源的状态异常

[已停止] /[不明]

EXEC资源已停止/无法获取信息

15

Floating IP resource

[已启动]

浮动IP资源已启动

[异常]

浮动IP资源的状态异常

[已停止] /[不明]

浮动IP资源已停止/无法获取信息

16

Mirror disk resource

[已启动]

镜像磁盘资源已启动

[异常]

镜像磁盘资源的状态异常

[已停止] /[不明]

镜像磁盘资源已停止/无法获取信息

17

Hybrid disk resource

[已启动]

共享型镜像磁盘资源已启动

[异常]

共享型镜像磁盘资源状态异常

[已停止] /[不明]

共享型镜像磁盘资源已停止/无法获取信息

18

NAS resource

[已启动]

NAS资源已启动

[异常]

NAS资源状态异常

[已停止]/ [不明]

NAS资源已启动/无法获取信息

19

Volume manager resource

[已启动]

卷管理资源正在启动

[异常]

卷管理资源处于异常状态

[已停止] /[不明]

卷管理资源处于停止状态/不能获取信息

20

Virtual IP resource

[已启动]

虚拟IP资源正在启动

[异常]

虚拟IP资源处于异常状态

[已停止] /[不明]

虚拟IP资源处于停止状态/不能获取信息

21

Virtual Machine resource

[已启动]

虚拟机资源正在启动

[异常]

虚拟机资源处于异常状态

[已停止] /[不明]

虚拟机资源处于停止状态/不能获取信息

22

Dynamic DNS resource

[已启动]

动态域名解析资源正在启动

[异常]

动态域名解析资源处于异常状态

[已停止] /[不明]

动态域名解析资源处于停止状态/不能获取信息

23

AWS Elastic IP资源

[已启动]

AWS Elastic IP资源启动中

[异常]

AWS Elastic IP资源状态异常

[已停止]/[不明]

AWS Elastic IP资源停止中/无法获取信息

24

AWS 虚拟IP资源

[已启动]

AWS 虚拟IP资源启动中

[异常]

AWS 虚拟IP资源状态异常

[已停止]/[不明]

AWS 虚拟IP资源停止中/无法获取信息

25

AWS DNS资源

[已启动]

AWS DNS资源启动中

[异常]

AWS DNS资源状态异常

[已停止]/[不明]

AWS DNS资源停止中/无法获取信息

26

Azure 探头端口资源

[已启动]

Azure 探头端口资源启动中

[异常]

Azure 探头端口资源状态异常

[已停止]/[不明]

Azure 探头端口资源停止中/无法获取信息

27

Azure DNS资源

[已启动]

Azure DNS资源启动中

[异常]

Azure DNS资源状态异常

[已停止]/[不明]

Azure DNS资源停止中/无法获取信息

28

All monitor resources 1

[正常]

所有的监视资源都没有异常

[警告]

有发生异常的监视资源或监视暂时停止的服务器

[异常]

所有的监视资源异常

[正常(模拟故障中)]

除[正常]状态外,还设定了模拟异常。

[警告(模拟故障中)]

除[警告]状态外,还设定了模拟异常。

[异常(模拟故障中)]

除[异常]状态外,还设定了模拟异常。

[正常(恢复运行控制下]

恢复运行控制下的[正常]状态。

[警告(恢复运行控制下]

恢复运行控制下的[警告]状态。

[异常(恢复运行控制下]

恢复运行控制下的[异常]状态。

[正常(模拟故障中+恢复运行控制下]

除恢复运行控制下的[正常]状态外,还设定了模拟异常。

[警告(模拟故障中+恢复运行控制下]

除恢复运行控制下的[警告]状态外,还设定了模拟异常。

[异常(模拟故障中+恢复运行控制下]

除恢复运行控制下的[异常]状态外,还设定了模拟异常。

[不明]

无法获取信息

29

Disk monitor resource 2

[正常]

磁盘没有异常

[警告]

有磁盘发生异常的服务器或监视暂时停止的服务器

[异常]

所有的服务器发生磁盘异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

30

IP monitor resource 2

[正常]

监视目标IP地址无异常

[警告]

有无法与监视目标IP地址通信的服务器或监视暂时停止的服务器

[异常]

所有的服务器无法与监视目标IP地址通信

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

31

NIC Link Up/Down monitor resource 2

[正常]

监视目标的NIC无异常

[警告]

有监视目标NIC发生异常的服务器或监视暂时停止的服务器

[异常]

所有的服务器的监视目标NIC发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

32

Mirror disk connect monitor resource

[正常]

镜像磁盘连接运行正常

[警告]

有发生镜像磁盘连接异常的服务器或监视暂时停止的服务器

[异常]

在两台服务器上发生镜像磁盘连接异常

[不明]

无法获取信息

33

Mirror disk monitor resource

[正常]

镜像磁盘运行正常

[警告]

有正在进行镜像复归或监视暂时停止的服务器

[异常]

镜像磁盘发生异常,需要进行镜像复归

[不明]

无法获取信息

34

Hybrid disk connect monitor resource

[正常]

共享型镜像连接正常运行

[警告]

有共享型镜像连接异常或监视暂时停止的服务器

[异常]

两服务器间发生共享型镜像连接异常

[不明]

无法获取信息

35

Hybrid disk monitor resource

[正常]

共享型镜像磁盘正常运行

[警告]

有正在进行共享型镜像磁盘镜像复归或监视暂时停止的服务器

[异常]

共享型镜像磁盘发生异常,需要进行镜像复归

[不明]

无法获取信息

36

PID monitor resource

[正常]

AP运行正常

[警告]

有监视暂时停止的服务器

[异常]

AP发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

37

User mode monitor resource

[正常]

用户空间监视资源运行正常

[警告]

有用户空间监视资源发生异常的服务器或监视暂时停止的服务器

[异常]

所有的服务器的用户空间监视资源发生异常

[不明]

无法获取信息

38

Multi target monitor resource

[正常]

Multi-Target监视资源运行正常

[警告]

有监视暂时停止的服务器或登录到Multi-Target监视资源中的若干监视资源发生异常

[异常]

Multi-Target发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

39

Virtual IP monitor resource

[正常]

虚拟IP监视资源正常运行

[警告]

-

[异常]

虚拟IP监视资源发生异常

[不明]

无法获取信息

40

ARP monitor resource

[正常]

ARP监视资源正常运行

[警告]

-

[异常]

ARP监视资源发生异常

[不明]

无法获取信息

41

Custome monitor resource

[正常]

自定义监视资源正常运行

[警告]

-

[异常]

自定义监视资源发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

42

Virtual Machine monitor resource

[正常]

虚拟机监视资源正常运行

[警告]

有虚拟机上发生异常的服务器或监视暂时停止的服务器

[异常]

虚拟机监视资源发生异常

[不明]

无法获取信息

43

Message receive monitor resource

[正常]

没有接收到异常发生通知。

[警告]

有收到异常发生通知的服务器或处于监视暂停状态的服务器。

[异常]

接收到异常发生通知。

[不明]

无法获取信息

44

Dynamic DNS monitor resource

[正常]

动态域名解析监视资源运行正常

[警告]

-

[异常]

动态域名解析监视资源发生异常

[不明]

无法获取信息

45

Process Monitor Resource 2

[正常]

对象进程名正常运行

[警告]

有处于监视暂停状态的服务器

[异常]

对象进程名发生异常。

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

46

Oracle monitor resource 2

[正常]

Oracle正常运行

[警告]

Oracle监视资源为暂停状态

[异常]

Oracle发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

47

DB2 monitor resource 2

[正常]

DB2正常运行

[警告]

DB2监视资源为暂停状态

[异常]

DB2发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

48

PostgresSQL monitor resource 2

[正常]

PostgreSQL正常运行

[警告]

PostgreSQL监视资源为暂停状态

[异常]

PostgreSQL发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

49

MySQL monitor resource

[正常]

MySQL正常运行

[警告]

MySQL监视资源为暂停状态

[异常]

MySQL发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

50

Sybase monitor resource 2

[正常]

Sybase正常运行

[警告]

Sybase监视资源为暂停状态

[异常]

Sybase发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

51

Samba monitor resource 2

[正常]

Samba正常运行

[警告]

Samba中有发生异常的服务器,或者状态为监视暂停的服务器

[异常]

Samba发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

52

NFS monitor resource 2

[正常]

NFS正常运行

[警告]

NFS中有发生异常的服务器,或者状态为监视暂停的服务器

[异常]

NFS发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

53

HTTP monitor resource 2

[正常]

HTTP正常运行

[警告]

HTTP中有发生异常的服务器,或者状态为监视暂停的服务器

[异常]

HTTP发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

54

FTP monitor resource 2

[正常]

FTP正常运行

[警告]

FTP中有发生异常的服务器,或者状态为监视暂停的服务器

[异常]

FTP发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

55

SMTP monitor resource 2

[正常]

SMTP正常运行

[警告]

SMTP中有发生异常的服务器,或者状态为监视暂停的服务器

[异常]

SMTP发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

56

POP3 monitor resource 2

[正常]

POP3正常运行

[警告]

POP3中有发生异常的服务器,或者状态为监视暂停的服务器

[异常]

POP3发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

57

IMAP4 monitor resource 2

[正常]

IMAP4正常运行

[警告]

IMAP4中有发生异常的服务器,或者状态为监视暂停的服务器

[异常]

IMAP4发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

58

Tuxedo monitor resource 2

[正常]

Tuxedo正常运行

[警告]

Tuxedo监视资源为监视暂停状态

[异常]

Tuxedo发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

59

WebSphere monitor resource 2

[正常]

WebSphere正常运行

[警告]

WebSphere监视资源为监视暂停状态

[异常]

WebSphere发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

60

WebLogic monitor resource 2

[正常]

WebLogic正常运行

[警告]

WebLogic监视资源为监视暂停状态

[异常]

WebLogic发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

61

WebOTX monitor resource 2

[正常]

WebOTX正常运行

[警告]

WebOTX监视资源为监视暂停状态

[异常]

WebOTX发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

62

JVM Monitor Resource 2

[正常]

Java VM正常运行

[警告]

JVM监视资源为监视暂停状态。

[异常]

Java VM发生异常。

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

63

System Monitor Resource 2

[正常]

System Resource Agent正常运行

[警告]

有状态为监视暂停的服务器

[异常]

System Resource Agent发生异常

[模拟故障中]

使模拟异常发生。

[不明]

无法获取信息

64

Floating IP Monitor Resource 2

[正常]

Floating IP正常运行

[警告]

存在监视暂停的服务器

[异常]

Floating IP发生异常

[模拟故障中]

使模拟异常发生

[不明]

无法获取信息

65

BMC Monitor Resource 2

[正常]

BMC正常运行

[警告]

存在监视暂停的服务器

[异常]

BMC发生异常

[模拟故障中]

使模拟异常发生

[不明]

无法获取信息

66

Oracle Clusterware Synchronization Management Monitor Resource 2

[正常]

Oracle Clusterware 同步管理进程正常运行

[警告]

存在监视暂停的服务器

[异常]

Oracle Clusterware同步管理进程发生异常

[模拟故障中]

使模拟异常发生

[不明]

无法获取信息

67

AWS Elastic IP监视资源

[正常]

AWS Elastic IP监视资源运行正常

[警告]

有获取AWS CLI命令的响应时失败的服务器、或有处于监视暂停状态的服务器

[异常]

AWS Elastic IP监视资源发生异常

[模拟故障中]

使模拟异常发生

[不明]

无法获取信息

68

AWS 虚拟IP监视资源

[正常]

AWS 虚拟IP监视资源运行正常

[警告]

有获取AWS CLI命令的响应时失败的服务器、或有处于监视暂停状态的服务器

[异常]

AWS 虚拟IP监视资源发生异常

[模拟故障中]

使模拟异常发生

[不明]

无法获取信息

69

AWS AZ监视资源

[正常]

AWS AZ监视资源运行正常

[警告]

有获取AWS CLI命令的响应时失败的服务器、或有处于监视暂停状态的服务器

[异常]

AWS AZ监视资源发生异常

[模拟故障中]

使模拟异常发生

[不明]

无法获取信息

70

AWS DNS监视资源 2

[正常]

AWS DNS监视资源运行正常

[警告]

有获取AWS CLI命令的响应时失败的服务器、或有处于监视暂停状态的服务器

[异常]

AWS DNS监视资源发生异常

[模拟故障中]

使模拟异常发生

[不明]

无法获取信息

71

Azure 探头端口监视资源 2

[正常]

Azure 探头端口监视资源运行正常

[警告]

有处于监视暂停状态的服务器

[异常]

Azure 探头端口监视资源发生异常

[模拟故障中]

使模拟异常发生

[不明]

无法获取信息

72

Azure 负载均衡监视资源 2

[正常]

Azure 负载均衡监视资源运行正常

[警告]

有处于监视暂停状态的服务器

[异常]

Azure 负载均衡监视资源发生异常

[模拟故障中]

使模拟异常发生

[不明]

无法获取信息

73

Azure DNS监视资源 2

[正常]

Azure DNS监视资源运行正常

[警告]

有处于监视暂停状态的服务器

[异常]

Azure DNS监视资源发生异常

[模拟故障中]

使模拟异常发生

[不明]

无法获取信息

1

抑制监视资源异常时的复归动作时,在monitor的旁边显示"Recovery Action Disabled"。并且,如果存在发生了模拟故障的监视资源时,则显示为"Failure Verification"。

2(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28)

发生模拟故障时,显示为"Dummy Failure"。

2.3.2. 可以通过WebManager执行的操作

可以通过右键点击[(1) Cluster][(3) Individual server] [(12) Individual group][(21) Virtual Machine resource]对集群进行操作。

集群全体对象

右键点击显示以下菜单。
  • 关机
    关闭正在运行的所有服务器。点击显示如下确认对话框。
    但不关闭当前无法与WebManager连接的服务器进行通信的服务器(所有的LAN心跳资源都已停止的服务器)。
  • 重启
    重启正在运行的所有服务器。点击显示以下的确认对话框。
  • 服务
    点击后在快捷菜单中显示[暂停集群]、[恢复集群]、[启动集群]、[停止集群]、[重新启动管理器]、[启动镜像代理]和[停止镜像代理]。

服务器对象

右键点击显示以下菜单。
  • 镜像磁盘列表
    点击显示以下的镜像磁盘列表对话框,显示所有的镜像磁盘资源和共享型镜像磁盘资源的列表。
    详细信息 (启动Mirror Disk Helper)
    启动所选的镜像磁盘资源和共享型镜像磁盘资源的Mirror Disk Helper。点击显示以下的Mirror Disk Helper对话框。
    关于Mirror Disk Helper的使用方法,请参考"2.6. Mirror Disk Helper"。
  • 异常镜像磁盘列表
    显示有异常的镜像磁盘资源和共享型镜像磁盘资源的列表。点击显示以下的镜像磁盘列表对话框。
    集群中如果存在下述种类异常的镜像磁盘和共享型镜像磁盘资源,则自动显示上述对话框。
    说明中列出了所选的异常镜像磁盘和异常共享型镜像磁盘资源的处理方法。

    异常种类

    说明

    镜像异常状态

    需要进行镜像复归或强行镜像复归。启动镜像Helper执行镜像复归。
    如果在镜像磁盘连接时发生通信异常状态时,请确认通信状态。

    镜像异常状态(只启动单个服务器)

    在仅启动了一侧服务器时,镜像磁盘和共享型镜像磁盘资源的最新数据处于不稳定状态。继续操作时请启动镜像Helper执行镜像复归。请注意,执行镜像复归后,当前启动的服务器的数据处于最新状态。

    选择[详细信息]则启动Mirror Disk Helper。

特定服务器的对象

点击右键显示以下菜单。
  • 关机
    关闭所选的服务器。点击显示以下的确认对话框。
  • 重启
    重启所选的服务器。点击显示以下的确认对话框。
  • 服务
    点击服务的[开始],启动所选的服务器。点击显示以下确认对话框。
    点击服务的[停止],停止所选服务器。点击显示以下确认对话框。
  • CPU频率设定
    设置所选服务器的CPU时钟频率控制功能。
    • 最高频率
      CPU时钟频率数最高。

    • 最低频率
      降低CPU时钟频率数转为节能模块。

    • 自动设定
      把CPU时钟频率控制返回到由EXPRESSCLUSTER 控制。

    集群属性的[扩展标签页]设置中没有选中[使用CPU频率控制功能]时,不能使用这个功能。

特定失效切换组的对象

右键点击显示以下菜单。
  • 启动 (只有在停止状态下才能选择)
    启动所选的组。显示在哪台服务器上启动所选的组的选择对话框。
  • 停止 (在启动或异常状态下可以选择)
    停止所选的组。点击显示以下的确认对话框。
  • 移动 (只有在启动状态下才能选择)
    移动所选的组。显示所选的组向哪个服务器移动的选择对话框。保持了移动的组的组资源状态。

特定虚拟机组的对象

点击右键,弹出以下菜单。
  • 启动 (仅限在停止状态下选择)
    启动选择组。弹出可用于启动选择组的服务器选择对话框。
  • 停止 (仅限在启动状态下选择)
    停止选择组。选择后弹出以下确认对话框。
  • 移动 (仅限在启动状态下选择)
    移动选择组。弹出可用于选择组移入的服务器选择对话框。
  • 迁移 (仅限在启动状态下选择)
    迁移选择组。弹出可用于选择组迁移的服务器选择对话框。
    在服务器选择画面中,可选择移入的目标服务器设置为可启动Group服务器(但,Current Server 和 Offline 的服务器除外)。

特定组资源的对象(镜像磁盘资源、共享型镜像磁盘资源、虚拟机资源除外)

点击右键显示以下菜单。
  • 启动 (只有在停止状态中才能选择)
    启动所选的组资源。显示在哪台服务器上启动所选的组的选择对话框。
  • 停止 (在启动或异常状态下可以选择)
    停止所选的组。点击显示以下的确认对话框。

镜像磁盘资源和共享型镜像磁盘资源的对象

点击右键显示以下菜单。
有关启动及停止的方法,请参阅前述的"特定组资源的对象(镜像磁盘资源、共享型镜像磁盘资源、虚拟机资源除外)"。
  • 详细信息
    启动所选的镜像磁盘资源和共享型镜像磁盘资源的Mirror Disk Helper。点击显示以下的Mirror Disk Helper对话框。
    关于Mirror Disk Helper的使用方法,请参考"2.6. Mirror Disk Helper"。

监视器整体的对象

点击右键显示以下菜单。

选择操作模式时

选择验证模式时

  • 恢复(只有在暂停状态中才可以选择)
    重开所有已经设定好的监视资源。但是,对于不能进行监视暂停/重开的监视资源则无法执行。显示在哪台服务器中重开监视资源的选择对话框。
  • 暂停(只有在监视中的状态下才可以选择)
    暂停所有已经设定好的监视资源。但是,对于不能进行监视暂停/重开的监视资源则无法执行。显示在哪台服务器中暂停监视资源的选择对话框。
  • 解除模拟故障(仅在发生模拟故障时可选择)
    解除所有监视资源的模拟异常。显示解除监视资源的模拟异常的选择对话框。

特定监视资源的对象

点击右键显示以下菜单。

选择操作模式时

选择模拟模式时

  • 恢复 (只有在暂停状态中才可以选择)
    重开所选监视资源。但是,对于不能进行监视暂停/重开的监视资源则无法执行。显示在哪台服务器中重开所选监视资源的选择对话框。
  • 暂停 (只有在监视中的状态下才可以选择)
    暂停所选监视资源。但是,对于不能进行监视暂停/重开的监视资源则无法执行。显示在哪台服务器中暂停所选监视资源的选择对话框。
  • 发生模拟障碍 (只有在验证模式中可以选择)
    使选择的监视资源发生模拟障碍。要发生模拟障碍,要在该当的监视资源中,只有在[各服务器中的资源状态]处于异常或者模拟故障开始状态以外的服务器中可以选择。
    但是,以下的监视资源不能选择。
    • 镜像磁盘连接监视资源

    • 镜像磁盘监视资源

    • 共享型磁盘连接监视资源

    • 共享型磁盘监视资源

    • 用户空間监视资源

    • 虚拟IP监视资源

    • ARP监视资源

    • 外部連携监视资源

    • 动态DNS监视资源

    • 虚拟机监视资源

    显示使哪台服务器中发生所选监视资源的模拟异常的选择对话框。

    注解

    使模拟异常发生时,存在一台以上无法连接的服务器时将显示错误信息。在无法连接的服务器上不能发生模拟异常。

  • 解除模拟障碍 (只有在验证模式时可选择)
    解除选择的监视资源中发生的模拟障碍。显示在哪台服务器中解除所选监视资源的模拟障碍的选择对话框。

2.4. 在WebManager的列表视图中确认集群的状态

可以通过列表视图确认WebManager树形图中选择的对象的详细信息。

2.4.1. 在WebManager列表视图中列表显示集群整体的详细信息

  1. 启动WebManager。

  2. 在树形图中选择集群全体的对象[]。在右侧的列表视图中显示各个服务器的[组状态]和[监视资源状态]。

  3. 点击[详细]。在对话框中显示以下内容。

    名称

    集群名

    注释

    集群的注释

    状态

    集群的状态

    关机通知

    服务器宕机通知

    NP发生时动作

    网络分区发生时动作

    同步等待时间(秒)

    启动服务器时等待其他服务器启动的时间(秒)

    心跳超时(毫秒)

    心跳超时时间(毫秒)

    心跳间隔(毫秒)

    心跳发送间隔(毫秒)

    内部通信超时(秒)

    内部通信超时时间(秒)

    超时倍率

    当前的超时倍率

    服务器内部端口号

    内部通信使用的端口号

    数据传送端口号

    数据传送使用的端口号

    心跳端口号

    心跳使用的端口号

    内核模式心跳端口号

    内核模式心跳使用的端口号

    WebManager HTTP端口号

    WebManager中使用的端口号

    Alert同步端口号

    警报同步使用的端口号

    内部日志通信方法

    在日志中使用的通信方式

    端口号

    在日志中使用的端口号

    关闭监视器

    是否关闭监视

    关闭监视方法

    关闭监视的方法

    动作

    发生超时时的动作

    SIGTERM有效

    SIGTERM的有效/无效

    使用HB超时

    是否使用HB超时

    超时(秒)

    超时(秒)

    收集系统资源信息

    是否收集系统资源信息

    集群服务的进程异常时动作

    集群服务的进程异常时的动作

    HA进程异常时动作:最大再启动次数

    HA进程异常时进程的再启动执行次数

    HA进程异常时动作:重试结束后动作

    HA进程异常时执行了指定次数的进程再启动后不能复归时的动作

    抑制监视资源异常时的复归动作

    是否使用监视资源异常时的复归动作抑制功能

    发生组资源的激活/非激活失控时的动作

    组资源激活或非激活失控时的动作

    最后一台的时候抑制关闭(激活异常时)

    最后一台服务器激活异常时,抑制关机功能是否有效

    最后一台的时候抑制关闭(非激活异常时)

    最后一台服务器非激活异常时,抑制关机功能是否有效

    最后一台的时候抑制关闭(监视异常时)

    最后一台服务器监视异常时,抑制关机功能是否有效

    邮件地址

    通告目标邮件地址

    使用网络警告灯

    是否使用网络警告灯

    使用联合机箱ID指示灯

    是否使用机箱ID指示灯联动功能

    使用Alert通知设定

    是否使用警报通过设置

    心跳延迟警告

    心跳延迟警告(%)

    监视延迟警告

    监视器延迟警告(%)

    Java安装路径

    Java安装路径

    最大Java堆内存大小(MB)

    最大Java堆大小(MB)

    负载均衡器器连接设置

    负载均衡器器是否联动

    日志等级

    日志等级

    保有日志文件的时代数

    保持的日志文件的版本数

    日志轮询方式

    日志轮询方式

    日志文件的最大大小(KB)

    日志文件的最大容量(KB)

    进行最初的日志轮询的时间

    最初进行日志轮询的时刻

    日志轮询的间隔 (时间)

    日志轮询的间隔时间(小时)

    资源测量:重试次数

    测量重试次数

    资源测量:异常判定次数

    异常判断阀值

    资源测量:默认间隔

    储存器、线程的测量间隔时间(秒)

    资源测量:Full GC测量间隔

    资源测量:Full GC的测量间隔(秒)

    WebLogic监视:重试次数

    测量重试次数

    WebLogic监视:异常判定次数

    异常判断阀值

    WebLogic监视:要求数测量间隔

    要求数量的测量间隔(秒)

    WebLogic监视:平均值测量间隔

    平均值的测量间隔(秒)

    管理端口

    管理端口号

    连接的重试次数

    连接重试次数

    到再次连接为止的等待时间

    等待重新连接的待机时间(秒)

    负载均衡器联动的管理端口号

    连接负载均衡器的管理端口号

    存活侦测(Health Check)功能联合

    与HelpCheck功能联动

    HTML文件保存目

    HTML保存目录

    HTML文件名

    HTML文件名

    HTML重命名文件名

    HTML重命名目标文件名

    重命名重试次数

    重命名失败时的重试次数

    到重试的待机时间

    等待重命名的重试待机时间(秒)

    管理 IP地址

    BIG-IP LTM管理IP地址

    通信端口号

    与BIG-IP LTM通信的端口号

    最大重新启动次数

    最大的重启次数

    最大重新启动次数重置时间(分)

    复位最大重启次数的时间(分)

    使用强制停止功能

    是否使用强行停止功能

    强制停止动作

    强行停止功能的操作

    强制停止超时(秒)

    执行强行停止后到开始激活失效切换组之前的等待时间(秒)

    运行强制停止脚本

    是否运行强制停止脚本

    使用CPU频率控制功能

    是否使用CPU时钟频率控制功能

    宕机后自动启动

    是否有禁止非正规停止后的集群服务的自动启动

    Mount, Umount命令互斥

    Mount和Umount命令是否互斥

使用Replicator,Replicator DR时

省略与仅使用本体时内容相同的部分。

镜像代理端口号

镜像Agent使用的端口号

自动镜像复归

有无自动镜像复归

收集统计信息

是否有采集镜像统计信息

接收超时(秒)

接收超时(秒)

发送超时(秒)

发送超时(秒)

复归数据大小(千字节)

复原数据大小(kbyte)

复归重试次数

复原重试次数

同步启动等待时间(秒)

服务器组内的服务器启动等待时间(秒)

集群分区设备I/O超时(秒)

集群分区的I/O超时(秒)

请求队列最大值

镜像驱动程序的请求队列最大数(个)

差分Bitmap大小(MB)

分配给差分位图的区域大小

差分Bitmap更新间隔(秒)

差分位图更新间隔(秒)

集群分区

集群分区上I/O错误发生时的动作

数据分区

数据分区上I/O错误发生时的动作

2.4.2. 通过WebManager的列表视图确认服务器整体的状态

  1. 启动WebManager。

  2. 在树形图中点击服务器整体的[对象],则在右侧列表视图的上半部分显示各个服务器上的心跳状态、网络分区解决状态列表。
    再点击 [服务器组一览],就会显示服务器组的信息的对话框。

2.4.3. 通过WebManager的列表视图确定特定服务器的状态

  1. 启动WebManager。

  2. 在树形图中点击特定服务器的[对象],则显示服务器的[注释]、[产品]、[版本号]、[平台]、 [状态]。

    注释

    服务器的注释

    虚拟化基础架构

    虚拟化基础架构名

    产品

    产品名

    内部版本

    版本(与RPM版本的值相同)

    平台

    平台

    状态

    服务器状态

点击[详细信息],在弹出对话框中显示以下内容。

服务器名

服务器名

版本

版本

镜像磁盘连接IP地址mdc[1] 3

镜像磁盘连接的IP地址

网络警告灯IP地址(种类)

网络警告灯的IP地址

磁盘 I/O阻塞设备

磁盘I/O锁定设备

BMC IP地址

BMC的IP地址

CPU频率状态

CPU时钟频率控制的当前设置状态

抑制检测出双活性时的关闭

检测出双活性时是否抑制系统关闭

3

括号中的数字是镜像磁盘连接的I/F号。

2.4.4. 在WebManager的列表视图中确认监视器整体的状态

  1. 启动WebManager。

  2. 在树形图中点击监视器整体的[对象],则在列表视图中显示[监视器名]和各服务器中的状态列表。

2.5. 在WebManager中确认警报

可以在WebManager的下方确认警报。
警报视图的各域结构如下。

关于各警报消息的含义,请参考《参考指南》"错误消息一览表"。另外,关于警报消息的查找,请参考本章的"2.2.3. 在WebManager中查找警报"。

2.5.1. 关于警报视图的各区域

WebManager警报视图的各字段含义如下。

  1. 警报类别图标

    警报类别

    含义

    信息消息。

    警告消息。

    异常消息。

  2. 警报接收时刻

    接收警报的时刻。应用WebManager连接目标的服务器的时刻。

  3. 警报发送时刻

    各服务器发送警报的时刻。应用警报发送方服务器的时刻。

  4. 警报发送方服务器

    发送警报的服务器的名称。

  5. 警报发送方模块

    发送警报的模块的类型。
    关于模块名的类型列表,请参考"2.2.3. 在WebManager中查找警报"。
  6. 事件ID

    根据各警报设置的事件ID号。

  7. 警报消息

    警报消息本体。

2.5.2. 警报视图的操作

可以选择表示警报视图各区域的栏,

排列警报。

每次选择各字段时,显示[]或[]的标记。

标记

含义

按该字段升序排列警报。

按该字段降序排列警报。

默认状态下按[发生时间]降序排列。
通过左右拖拽字段名的部分,可以变更项目的显示顺序。
另外,右击状态条,显示以下弹出画面,可以选择显示的项目。默认状态是所有的项目被选择。
双击被显示的警报,显示以下画面,可以确认警报的详细信息。
另外,右击警报,显示以下弹出画面,可以选择显示的警报类型。默认状态为所有的项目被选择。

2.6. Mirror Disk Helper

2.6.1. Mirror Disk Helper概要

Mirror Disk Helper是通过EXPRESSCLUSTER 管理器进行镜像磁盘和共享型镜像磁盘的复原操作所需的工具。
Mirror Disk Helper的区域结构如下。

可以通过镜像磁盘列表或各组的镜像磁盘资源、共享型镜像磁盘资源启动Mirror Disk Helper。
Mirror Disk Helper的各域含义如下
  1. 资源名

    显示镜像磁盘资源和共享型镜像磁盘资源名。

  2. 执行

    点击镜像磁盘状态的图标,可以进行各种各样的操作。当选择操作时,[执行]按钮有效。关于可选操作,请参考"2.6.2. Mirror Disk Helper的操作步骤"。

  3. 详细信息

    点击 [详细] 则显示详细信息。
    服务器名

    服务器名

    差分拷贝

    镜像磁盘设备的差异可否状态

    活性状态

    各服务器中镜像磁盘资源的激活状态

    媒体错误

    镜像磁盘设备的媒体错误

    镜像中断时间

    发生镜像中断的时刻

    最终数据更新时间

    镜像中断后最后的数据更新时刻

    设备名

    镜像磁盘设备的设备名

    拷贝量(%)

    重开镜像连接时需重新复制的数据量

    分区使用率(%)

    各服务器中文件系统的NMP使用率

    分区大小(MB)

    各服务器的NMP大小

只在单个服务器更新时显示[最终数据更新时间]。
镜像磁盘连接中断等镜像没有同步时显示[镜像中断时间]。
服务器间DP的分区大小不同时,较小的分区大小为[分区大小]。
  1. 镜像磁盘状态

    显示各服务器的镜像磁盘状态。

    图标

    镜像磁盘状态

    Mirror Color 4

    正常。镜像磁盘资源没有激活。

    GREEN

    正常,拥有最新数据。可能没有与对方服务器同步。

    GREEN

    正在进行镜像复归或强行镜像复归。此服务器处于非激活状态。

    YELLOW

    正在进行镜像复归或强行镜像复归。此服务器处于激活状态。

    YELLOW

    异常。需要进行镜像复归。

    RED

    异常。对镜像磁盘的访问限制被解除。
    (镜像磁盘资源已被激活,由于不能自动地判断因对方服务器的启动等而是否持有最新数据,因此,即使是需要进行强制镜像复归的状态下也会显示出。)

    RED

    保留状态。保留持有最新数据的服务器的判断

    ORANGE

    不明或已停止服务器。无法获取状态。

    GRAY

    两系统激活。

    BLUE

    集群分区异常。

    BLACK

    4

    执行clpmdstat命令和clphdstat命令则显示Mirror Color。

  2. 进度条

    镜像复归或强行镜像复归时,从拥有最新数据的复制源服务器指向复制目标服务器。
    执行镜像复归或强行镜像复归的过程中,显示进度状况和预测所需的时间。
  3. 服务器组名

    显示服务器组名。

  4. 当前服务器名

    显示当前服务器名。关于变更当前服务器名的步骤,请参考"2.6.7. 变更当前服务器的步骤(仅限共享型镜像磁盘资源)"。

2.6.2. Mirror Disk Helper的操作步骤

在Mirror Disk Helper画面中,各服务器的镜像状态不同,进行的操作也不同。请参考本手册确认具体要做哪一种操作后再执行。可以在选定要进行的操作的状态下,点击[执行]执行。以下说明中使用的对话框示例为镜像磁盘资源的场合。

注解

以下是简略的说明图。非实际的Mirror Disk Helper画面。
以下说明的是在操作server1的镜像磁盘状态图标时的动作。对server2的镜像磁盘状态图标进行操作时,请替换为server2。
  1. server1正常时可以进行的操作

    注解

    下述操作,server1正常且镜像磁盘资源和共享型镜像磁盘资源没有激活时才可以进行。正常激活镜像磁盘资源和共享型镜像磁盘资源的服务器中无法执行下述操作。

    1. server2正常,镜像磁盘资源和共享型镜像磁盘资源没有激活时
      对在任意服务器磁盘镜像资源和共享型镜像磁盘资源没有激活时可以进行的操作进行说明。图的左上角的状态为初始画面。图中的箭头表示点击server1的镜像磁盘状态图标时的变化。
      1. 镜像复归
        进行server1到server2的镜像复归操作。可以进行全面复原。
      2. 断开镜像磁盘
        断开server1的镜像磁盘。在server2中激活镜像磁盘资源和共享型镜像磁盘资源时,不能进行镜像同步。
      3. 回到初始状态
        回到初始状态。显示出现在的状态。
    2. server2为正常状态,镜像磁盘资源和共享型镜像磁盘资源为激活中时
      对在server2中镜像磁盘资源和共享型镜像磁盘资源为激活状态时可以进行的操作进行说明。图的左上方的状态为初始画面。图中的箭头表示点击server1的镜像磁盘状态图标时的变化。
      1. 镜像复归
        进行server2到server1的镜像复归操作。可以进行全面复原。
      2. 断开镜像磁盘
        断开server1的镜像磁盘和共享型镜像磁盘资源。中断镜像同步。
      3. 回到初始状态
        回到初始状态。显示出现在的状态。
    3. server2非正常状态时
      对在server1中没有激活镜像磁盘资源和共享型镜像磁盘资源时可以进行的操作进行说明。图的左上方的状态为初始画面。图中的箭头表示点击镜像磁盘状态图标时的变化。

      注解

      上图为server2异常状态。server2状态非正常时与上图的变化是相同的。

      1. 断开镜像磁盘
        断开server1的镜像磁盘和共享型镜像磁盘。从server1持有最新数据的状态更改为server1不持有最新数据的状态。
      2. 回到初始状态。
        回到初始状态。显示出现在的状态。
  2. server1异常时

    1. server2为异常状态时
      对两台服务器都为异常状态时可以进行的操作进行说明。图的左上方状态为初始画面。图中的箭头表示点击server1的镜像磁盘状态图标时的变化。
      1. 只对server1进行的强行镜像复归
        强行对server1的镜像磁盘和共享型镜像磁盘状态正常化。(更改为server1持有最新数据的状态。)
        镜像磁盘和共享型镜像磁盘的状态正常就可以在server1中激活镜像磁盘资源和共享型镜像磁盘资源。
      2. 镜像复归
        进行server1到server2的镜像复归操作。
        可以进行差异复制时,可以进行差异镜像复归或者全面镜像复归。
        不可以进行差异复制时,可以进行全面镜像复归。
        若开始镜像复归,在镜像复归中可以激活镜像磁盘资源和共享型镜像磁盘资源。
      3. 解除访问限制
        通常不能访问变为异常状态的镜像磁盘和共享型镜像磁盘。
        强行解除server1的镜像磁盘和共享型镜像磁盘,可对文件系统进行mount,并可暂时访问。
        (并非使其变为通常的激活状态。)
        即使被写入也不可以进行镜像数据的同步。
      4. 回到初始状态
        回到初始状态。显示出现在的状态。
    2. server2为正常状态时
      对在server2中没有激活镜像磁盘资源和共享型镜像磁盘资源时可以进行的操作进行说明。图的左上方状态为初始画面。图中的箭头表示点击server1的镜像磁盘状态的图标时的变化。

      注解

      上图为没有激活镜像磁盘资源和共享型镜像磁盘资源的状态。激活镜像磁盘资源和共享型镜像磁盘资源状态时的变化与上图所示相同。

      1. 镜像复归
        进行server2到server1的镜像复归。
        可以进行差异复制时,可以进行差异镜像复归或者全面镜像复归。
        不可以进行差异复制时,可以进行全面镜像复归。
        若开始镜像复归,在镜像复归中不可以激活镜像磁盘资源和共享型镜像磁盘资源。
      2. 解除访问限制
        通常不能访问变为异常状态的镜像磁盘和共享型镜像磁盘。
        强行解除server1的镜像磁盘和共享型镜像磁盘,可对文件系统进行mount,并可暂时访问。
        (并非使其变为通常的激活状态。)
        即使被写入也不可以进行镜像数据的同步。
      3. 回到初始状态
        回到初始状态。显示出现在的状态。
    3. server2为不明状态时
      对无法确认server2状态是可以进行的操作进行说明。图的左上方状态为初始画面。图中的箭头表示点击server1的镜像磁盘状态图标时的变化。
      1. 只对server1进行的强行镜像复归
        强行将server1的镜像磁盘和共享型镜像磁盘状态正常化。
        镜像磁盘和共享型镜像磁盘的状态正常就可以在server1中激活镜像磁盘资源和共享型镜像磁盘资源。
      2. 解除访问限制
        通常不能访问变为异常状态的镜像磁盘和共享型镜像磁盘。
        强行解除server1的镜像磁盘和共享型镜像磁盘,可对文件系统进行mount,并可暂时访问。
        (并非使其变为通常的激活状态。)
        即使被写入也不可以进行镜像数据的同步。
      3. 回到初始状态
        回到初始状态。显示出现在的状态。
  3. 镜像复归中时

    注解

    下图所示操作只在server1中激活镜像磁盘资源和共享型镜像磁盘资源时可以进行。

    对镜像复归时可以进行的操作进行说明。图的左上方状态为初始画面。图中的箭头表示点击server1的镜像磁盘状态图标时的变化。

    注解

    上图为server2中激活镜像磁盘资源和共享型镜像磁盘资源时的状态。
    Server2中没有激活镜像磁盘资源和共享型镜像磁盘资源时的变化也与之相同。
    1. 中断镜像复归
      中断镜像复归。镜像复归一经中断,复制源就会变成正常状态,复制目标变为异常状态。
    2. 回到初始状态
      回到初始状态。显示出现在的状态。
  4. 访问限制解除中时

    对镜像磁盘和共享型镜像磁盘的访问限制进行解除时可以进行的操作进行说明。图的左上方状态为初始画面。图中的箭头表示点击server1的镜像磁盘状态图标时的变化。

    注解

    上图为server2中镜像磁盘资源和共享型镜像磁盘资源正常状态时。不管server2的镜像磁盘资源为何种状态,变化都与之相同。

    注解

    尚未执行访问限制解除操作时,也有可能变为以上的图示状态。
    这是因为,在server1的镜像磁盘资源处于通常的激活状态下单方运行时,持有最新数据的server2 已启动。
    此时,由于两方的服务器的镜像磁盘资源持有最新数据,server1方从正常的激活状态变为异常的激活状态,server2方从不明状态变为异常的非激活状态,其状态如上图所示。
    在这种情况下,server1的镜像磁盘资源处于通常的激活中的状态,并非处于可通过暂时的强行操作而变为访问限制解除中的状态,请不要进行此处所记载的操作,而执行强行镜像复归。有关强行镜像复归的步骤,请参阅《参考指南》的"疑难解答"的"使用Cluster WebUI进行强行镜像复归"、"通过命令强行执行镜像复归"。
    1. 访问限制
      将server1的镜像磁盘和共享型镜像磁盘的访问限制解除状态恢复为原有的状态,来限制访问。对暂时mount后的文件系统进行unmount。
    2. 回到初始状态
      回到初始状态。显示出现在的状态。
  5. server1处于保留状态时

    1. 如果server2为保留状态
      以下说明两台服务器的共享型镜像磁盘资源为保留状态时可以执行的操作。图的左上方的状态为初始画面。图中箭头表示点击server1的镜像磁盘的状态图标时的移动方向。
      1. 镜像复归
        从server1向server2执行镜像恢复。实施全面镜像恢复。
        在镜像恢复过程中,不能激活共享型镜像磁盘资源。
      2. 回到初始状态
        回到初始状态。显示出现在的状态。
    2. server2状态不明时
      以下说明server2状态无法确认时可以执行的操作。图的左上方的状态为初始画面。图中箭头表示点击server1的镜像磁盘的状态图标时的移动方向。
      1. 仅server1强行镜像复归
        强制将server1的共享型镜像磁盘状态设置为正常。
        通过将共享型镜像磁盘的状态设置为正常,可以在server1中激活共享型镜像磁盘资源。
      2. 回到初始状态
        回到初始状态。显示出现在的状态。

2.6.3. 镜像复归、强行镜像复归的步骤

  1. 镜像复归

    两台服务器的镜像磁盘存在差异时

    两台服务器的镜像磁盘存在差异,且单方服务器状态异常时,进度条的方向固定。组处于激活中的情况下,组已激活的服务器作为复制源的服务器。
    点击[执行],则启动镜像复归。

    两台服务器的镜像磁盘不存在差异时

    没有差异时,进行全面复制复原。
    两台服务器的镜像磁盘没有差异,且两台服务器的状态都正常时,如果在上述对话框中点击复制源图标,则显示进度条。组处于激活中的情况下,组已激活的服务器作为复制源的服务器。
    点击[执行],则启动强行镜像复归。但在组激活过程中,组激活的服务器是复制源服务器。
  2. 强行镜像复归

    两台服务器的状态都异常时,如果决定复制源服务器,需要点击[详细]。显示以下的详细信息。
    确认最终数据更新时刻,拥有最新数据的服务器是复制源。但最终数据更新时刻依存于OS中设置的时刻。
    点击复制源镜像磁盘状态的图标,会显示进度条,点击[执行]启动强行镜像复归。

    注解

    镜像磁盘处于激活状态的情况下,想通过WebManager进行强行镜像复归时,须先将组改为非激活,然后再进行上述操作。

    有关强行镜像复归的详细步骤,请参考《参考指南》的"疑难解答"的"使用Cluster WebUI进行强行镜像复归"、"通过命令强行执行镜像复归"。
  3. 针对1台服务器的强行镜像复归

    单方服务器的状态异常,单方服务器不明或状态停止时,在Mirror Disk Helper中显示如下内容。
    点击异常状态服务器的图标,显示如下内容。
    点击[执行],显示以下的对话框。选择[确定],对单方服务器进行强行镜像复归。

2.6.4. 停止镜像复归的步骤

镜像复归执行中时显示以下内容。
在这里点击复制目标或者复制源的图标,则显示以下内容。
点击[执行],显示以下对话框。点击[确定]则镜像复归被停止,复制源变为正常状态,复制目标变为异常状态。

2.6.5. 访问限制的解除步骤

访问限制的解除只有在异常状态时才可以进行。
一方服务器为正常状态,另一方服务器为异常状态时,显示以下内容。
多次点击异常状态的服务器图标则显示以下内容。
点击[执行]则异常状态的服务器方的访问限制被强行解除,对已暂时mount的文件系统可以进行访问。即使被写入也无法进行镜像数据的同步。
进行镜像复归时,点击解除了访问限制的服务器的图标,返回访问限制的状态后,根据"镜像复归、强行镜像复归的步骤"进行镜像复归。

2.6.6. 断开镜像磁盘的步骤

断开镜像磁盘可以在镜像磁盘为正常状态,并且没有激活镜像磁盘的服务器中进行。如果断开镜像磁盘,镜像就不同步。
一方的服务器为正常状态,另一方服务器为异常状态时,显示如下内容。
数次点击正常状态的服务器图标,则显示以下内容。
点击[执行],则断开所选服务器方的镜像磁盘。
即使两方服务器处于正常状态且非激活状态时,也可通过同样的操作断开镜像磁盘。

2.6.7. 变更当前服务器的步骤(仅限共享型镜像磁盘资源)

在以下状态下可以变更当前服务器。

共享型镜像磁盘的状态

是否可变更当前服务器

可以执行的操作

服务器组1

服务器组2

服务器组1

服务器组2

服务器组1

服务器组2

正常/非激活

正常/非激活

可以

可以

1

1

正常/非激活

异常/非激活

可以

可以

1

1,3

正常/激活

异常/非激活

不可以

可以

-

1,3

异常/非激活

异常/非激活

可以

可以

1,3

1,3

异常/非激活

异常/强制激活

可以

不可以

3

-

异常/非激活

不明

可以

不可以

3

-

保留/非激活

保留/非激活

可以

可以

1

1

1

镜像恢复 (差异、全面)

2

仅单侧服务器强制镜像恢复

3

解除访问限制(强制激活)

4

镜像磁盘分离

两台服务器都处于正常状态和非激活状态时如下显示。

选择执行的操作后,从要执行当前服务器变更的服务器组内的列表框选择服务器名,选择[执行],当前服务器切换。

2.7. 手动停止/启动WebManager

安装EXPRESSCLUSTER 后,服务器端的WebManager随OS的启动/停止而启动/停止。
手动停止/启动时,可以通过服务器端的控制台执行以下命令。

停止时

init.d环境时:

[root@server1 root]# /etc/init.d/clusterpro_alertsync stop
Shutting down clusterpro webalert: OK
[root@server1 root]# /etc/init.d/clusterpro_webmgr stop
Shutting down clusterpro webmanager server: OK

systemd环境时:

[root@server1 root]# systemctl stop clusterpro_alertsync
[root@server1 root]# systemctl stop clusterpro_webmgr

启动时

init.d环境时:

[root@server1 root]# /etc/init.d/clusterpro_webmgr start
Starting clusterpro webmanager server: OK
[root@server1 root]# /etc/init.d/clusterpro_alertsync start
Starting clusterpro webalert: OK

systemd环境时:

[root@server1 root]# systemctl start clusterpro_webmgr
[root@server1 root]# systemctl start clusterpro_alertsync

实际输入的命令是粗体部分。

2.8. 不想使用WebManager时

出于安全考虑,不想使用WebManager时,请在OS的设置或Builder设置中设置不启动WebManager。
设置OS时,可以使用chkconfig命令控制WebManager相关Daemon的启动/停止。

不启动WebManager时

init.d环境时:

[root@server1 root]# chkconfig --del clusterpro_alertsync
[root@server1 root]# chkconfig --del clusterpro_webmgr

Ubuntu时,执行以下命令:

[root@server1 root]# update-rc.d -f clusterpro_alertsync remove
[root@server1 root]# update-rc.d -f clusterpro_webmgr remove

systemd环境时:

[root@server1 root]# systemctl disable clusterpro_alertsync
[root@server1 root]# systemctl disable clusterpro_awebmgr

启动WebManager时

init.d环境时:

[root@server1 root]# chkconfig --add clusterpro _webmgr
[root@server1 root]# chkconfig --add clusterpro _alertsync

Ubuntu时,执行以下命令:

[root@server1 root]# update-rc.d clusterpro_webmgr defaults 91 4
[root@server1 root]# update-rc.d clusterpro_alertsync defaults 92 3

systemd环境时:

[root@server1 root]# systemctl enable clusterpro_webmgr
[root@server1 root]# systemctl enable clusterpro_alertsync

实际输入的命令是粗体部分。

可以在Builder的[集群的属性]的[WebManager]标签页中设置使用WebManager。关于设置和反映方法,请参考本指南的"3. Builder的功能"-"3.11. 集群属性"-"3.11.11. Web管理器标签页"。

2.9. 设置WebManager的连接限制、操作限制

可以在Builder的[集群属性]中进行WebManager的连接限制、操作限制。详细内容请参考本指南的"3. Builder的功能"-"3.11. 集群属性"-"3.11.11. Web管理器标签页"。

2.9.1. 使用限制的种类

使用限制的方法有以下2种。

  • 根据客户端IP地址限制连接

  • 根据密码进行限制

根据客户端IP地址限制连接

根据客户端IP地址,对能与WebManager连接的客户端在WebManager上的操作进行限制的功能。

在Builder中点击[集群属性]的[WebManager]标签页,在[可连接的客户端台数]中添加IP地址。

在WebManager的连接限制的设置中,如果用没有添加在[可连接的客户端台数]中的IP 地址连接WebManager,则显示以下的错误消息。

Firefox 1.5.0.9

从受到操作限制的客户端登录而连接的WebManager中,显示下面的"参照模式"。

在WebManager 上执行的操作限制包括以下操作。

  • 集群关机、关机重启

  • 各服务器关机、关机重启

  • 启动、停止、移动各组

  • Mirror Disk Helper的操作(仅在使用Replicator和Replicator DR时)

  • 切换到操作模式

  • 切换到设置模式

  • 切换到验证模式

根据密码进行限制

通过密码限制在WebManager上的浏览和操作的功能。
在Builder中点击[集群属性]的[WebManager]标签页,设置[由密码来控制连接]。

在WebManager的密码限制设置中,设置密码连接WebManager时显示如下的认证对话框。

在[权限]中选择[可操作模式]及[参考模式],输入正确的密码,则可登录到WebManager中。

  • 没有进行密码限制的设置时,不显示认证对话框(没有认证也可以登录)

  • 如果输错3次密码,则无法登录WebManager

以只参照模式的权限登录时,显示如下的"参照模式"。

在WebManager 上执行的操作限制包括以下操作。

  • 集群关机、关机重启

  • 各服务器关机、关机重启

  • 启动、停止、移动各组

  • Mirror Disk Helper的操作(仅在使用Replicator或Replicator DR时)

关于登录、登录后的权限切换,请同时参考"2.9.2. WebManager的权限切换"。

使用限制的组合

同时使用IP地址和密码的限制功能时,操作限制如下。

密码限制

客户端IP地址限制

操作模式

仅供参考

无法操作/参考(认证失败)

操作模式

操作模式

仅供参考

无法使用

仅供参考

仅供参考 5

仅供参考

无法使用

无法连接

无法连接

无法连接

无法连接

5

无法通过权限的选择进行选择。

注解

只有在WebManager为可以操作的情况下,才可以变更使用Builder(在线版)的配置信息。

2.9.2. WebManager的权限切换

连接WebManager与切换权限时显示以下的流程图。

  1. 登录WebManager
    设置操作模式或仅供参考的密码时,显示登录认证对话框。选择[可操作模式]及[参考模式]的权限,输入正确密码后即可以登录WebManager。
  2. 从仅供参考画面向操作模式画面的权限切换
    显示密码认证对话框。输入正确密码即可登录。没有设置密码限制时,以空的密码登录。
  3. 从操作模式画面向仅供参考画面的权限切换
    可以在没有认证的情况下切换权限。设置了密码限制时,可以在没有认证的情况下切换权限。
  4. 没有设置操作模式和仅供参考的密码时的登录
    根据客户端IP限制登录。没有设置客户端IP限制时,在可操作的WebManager中登录权限。另外,此时无法切换到仅供参考权限。

2.10. WebManager的集群操作

2.10.1. 集群关机/集群的关机重启

关于通过WebManager进行的集群关机、集群关机重启的操作方法,请参考"2.3.2. 可以通过WebManager执行的操作"-"集群全体对象"。

2.10.2. 镜像磁盘资源、共享型镜像磁盘资源和Mirror Disk Helper

关于WebManager的镜像磁盘、共享型镜像磁盘资源和Mirror Disk Helper的操作方法,请参考"2.3.2. 可以通过WebManager执行的操作"-"服务器对象"。

2.10.3. 特定服务器的关机、重启

关于WebManager特定服务器的关机、重启的操作方法,请参考"2.3.2. 可以通过WebManager执行的操作"-"特定服务器的对象"。

2.10.4. 特定组的启动、停止、移动

关于启动、停止、移动WebManager的特定组的操作方法,请参考"2.3.2. 可以通过WebManager执行的操作"-"特定失效切换组的对象"。

2.10.5. 特定资源的启动、停止

关于WebManager特定资源的启动、停止的操作方法,请参考"2.3.2. 可以通过WebManager执行的操作"-"特定组资源的对象(镜像磁盘资源、共享型镜像磁盘资源、虚拟机资源除外)"、"2.3.2. 可以通过WebManager执行的操作"-"镜像磁盘资源和共享型镜像磁盘资源的对象"。

2.10.6. 监视资源的暂停、重开

关于WebManager监视资源的暂停、重新启动的操作方法,请参考"2.3.2. 可以通过WebManager执行的操作"-"监视器整体的对象"。

2.10.7. 特定监视资源的暂停、重开

关于WebManager特定监视资源的暂停、重新启动的操作方法,请参考"2.3.2. 可以通过WebManager执行的操作"-"特定监视资源的对象"。

2.11. WebManager的注意限制事项

  • WebManager中显示的内容不一定是最新。想要获取最新信息时,请点击工具条中的[刷新]图标或[工具]菜单中的[刷新]。

  • 如果在WebManager获取信息的过程中发生服务器宕机,则可能会出现获取信息失败,部分对象无法正确显示的情况。
    请等待下次自动更新或点击工具条中的[刷新]图标或[工具]菜单中的[刷新],从而再次获取最新内容。
  • 使用Linux的浏览器时,根据窗口管理器的组合不同,对话框可能会显示在其他窗口的后面。请通过Alt + Tab 键切换窗口。

  • 无法从多个WebManager同时收集EXPRESSCLUSTER 的日志。

  • 在无法与连接目标通信的状态下操作,则控制返回可能会花费一些时间。

  • 在鼠标指针处于表示正在处理的手表或沙漏形状态下,如果在浏览器外启动光标,则即便正在处理,光标也可能返回箭头状态。

  • 执行日志收集,则可能在服务器端的控制台中显示以下消息。

    hda: bad special flag: 0x03
    ip_tables: (C) 2000-2002 Netfilter core team
    
    日志收集没有问题,请忽略本消息。
  • 要经过Proxy服务器时,请设置Proxy服务器转接WebManager的端口号。

  • 经由Reverse Proxy服务器时,WebManager不能正常运行。

  • 已经执行EXPRESSCLUSTER升级后,请关掉所有启动的浏览器。
    清除Java和浏览器侧的缓存,启动浏览器。
  • 已经执行Java升级后,请关掉所有启动的浏览器。
    清除Java和浏览器侧的缓存,启动浏览器。
  • 连接到WebManager上的客户机PC利用Java(TM) Runtime Environment Version 8.0Update 162 以上版本,并且无法连接互联网时,WebManager的启动有可能比较费时。通过在Java控制面板的详细设置将[对以下 项执行证书撤销检查]设置为[不检查],可以回避发生这种现象。有关设置方法的详细内容,请确认Java的Web网站。

  • 在[WebManager]标签页的"画面数据更新间隔"中,一般请不要设置比30秒小的值。如果设置比30秒小的值,可能会影响EXPRESSCLUSTER的性能。

2.12. WebManager中显示的错误消息

操作WebManager时显示的错误消息一览。

级别

消息

原因

对策

错误

等待中组不能启动

EXPRESSCLUSTER 正在启动,无法获取状态。

请稍后重载。

错误

无法连接服务器。

WebManager与EXPRESSCLUSTER 服务器的连接失败。

请确认连接目标服务器已启动。

错误

连接超时

发生了内部超时。

进行较花费时间的操作/处理时可能发生。
确认其后的状态,没有问题的话可以直接操作。

错误

连接丢失。

WebManager与EXPRESSCLUSTER 服务器的连接中断。

请确认连接目标服务器没有宕机。

错误

部分资源不能启动。

组下的部分资源启动失败。

请解决资源发生异常的原因。
详细的错误内容请参考警报日志。

错误

部分资源不能停止。

组下的部分资源停止失败。

请解决资源发生异常的原因。
详细的错误内容请参考警报日志。

错误

从服务器收集集群日志失败。

集群日志收集失败。
集群日志收集过程中部分服务器可能已经关机。
可能发生故障无法与部分服务器通信。
请再次执行集群日志收集。
无法收集特定服务器的日志时,请在服务器上使用[clplogcc]命令采集日志。

错误

连接服务器失败({0}:{1})。

与WebManager的通信失败。

请在服务器端确认WebManager正在运行。

错误

查找组的在线服务器失败。

无法找到组在线的服务器。

操作过程中可能更改了服务器状态。请重载。

错误

从服务器获得集群树失败。

获取集群配置失败。

请在服务器端通过命令等确认EXPRESSCLUSTER 正在运行。

错误

获取最新Alert日志失败。

1)[alertlog.alt]文件不存在或已经被破坏。
2)集群配置信息中的警报查看器最大记录数的数值超过了界限值(最大为999)。
1)将服务器上的/安装路径/alert/log下的所有文件临时备份到别的地方,重启警报同步服务。
2)请确认Builder中警报查看器最大记录数的值。

错误

从服务器获取属性失败。

获取集群属性的值失败。

请在服务器端通过命令等确认EXPRESSCLUSTER 是否在运行。

错误

查找Alert日志失败。

打开服务器端的警报日志文件失败。

将服务器上的/安装路径/alert/log临时备份到别的地方,重启EXPRESSCLUSTER 警报同步服务。

错误

应答内容无效。

与服务器的连接中断。

请确认服务器的运行状态及网络。

错误

移动组"{0}"到服务器"{1}"失败。

组的移动失败。
[Group Name] 组名
[Server Name] 服务器名
请解决组移动发生异常的原因。
详细的错误内容请参考警报日志。

错误

组已经启动。

操作对象的组的状态为已启动。
可能已经通过其他WebManager或服务器上的命令对相同组执行了操作。

请稍后重载,将组的状态更新为最新后对组执行操作。

错误

组已经停止。

操作对象的组的状态为已停止。
可能已经通过其他WebManager或服务器上的命令对相同组执行了操作。

请稍后重载,将组的状态更新为最新后对组执行操作。

错误

组正在进行状态更新。

操作对象的组的状态为正在变化。
可能正在通过其他WebManager或服务器上的命令对相同的组进行操作。

请稍后重载,将组的状态更新为最新后对组执行操作。

错误

镜像代理服务内部发生错误

WebManager发生内部错误。

请进行重载。
重载后仍发生错误时,请重启WebManager Daemon。

错误

无效的配置文件。

获取集群配置信息失败。

请确认集群配置信息。

错误

无效的组名。

WebManager发生内部错误。

请进行重载。
重载后仍发生错误时,请重启WebManager Daemon。

错误

无效的组名或服务器名。

WebManager发生内部错误。

请进行重载。
重载后仍发生错误时,请重启WebManager Daemon。

错误

无效参数。

WebManager发生内部错误。

请进行重载。
重载后仍发生错误时,请重启WebManager Daemon。

错误

无效的服务器名。

WebManager发生内部错误。

请进行重载。
重载后仍发生错误时,请重启WebManager Daemon。

错误

服务器或组的操作失败。

部分操作失败。

请通过命令等确认服务器端的状态。确认状态,没有问题的话可以直接运行。

错误

可操作组不存在。

对组执行的操作失败。

请解决对组的操作异常的原因。
详细的错误内容请参考警报日志。

错误

请输入每页显示的Alert日志条数。

没有设置显示警报日志查找结果的件数(每个画面的日志)。

请设置显示警报日志查找结果的件数。

错误

请输入事件ID。

请设置作为警报日志查找的查找对象的ID。

请设置警报日志查找的查找对象的ID。

错误

请输入模块名。

没有设置警报日志查找的查找对象的模块名。

请设置警报日志查找的查找对象的模块名。

错误

请输入要检索的记录条数。

没有设置警报日志查找的件数。

请设置警报日志查找的件数。

错误

请输入页数。

没有指定警报日志查找结果的显示页。

请设置警报日志查找结果的显示页。

错误

请输入服务器名。

没有设置警报日志查找的查找对象的服务器名称。

请设置警报日志查找的查找对象的服务器名称。

错误

选中的服务器无效。

作为组的移动方,指定的服务器不正确。

稍候请进行重载,刷新组状态后进行操作。

错误

指定服务器未启动。

开始操作的服务器已宕机。

稍候请进行重载,刷新服务器的状态后进行操作。

警告

从服务器得到的集群树可能不完整。

获取服务器状态时发生了错误。

稍候请进行重载。

错误

每页显示的Alert日志条数已超过了取值范围(1~{0})。

每页中显示的警报查找结果的显示件数的设置值超出了范围。

请指定1~300的值。

错误

结束时间不正确,请输入正确的结束时间。

指定了不正确的警报日志查找的查找对象的结束时间。

请设置正确的时间。

错误

输入的事件ID小于1。

警报日志查找的查找对象中设置了小于1的ID值。

请指定1以上的值。

错误

不存在能被启动的组。

启动组失败。

请解决对组进行操作出现异常的原因。
关于详细错误请参考警报日志。

错误

不存在能被停止的组。

停止组失败。

请解决对组进行操作出现异常的原因。
关于详细错误请参考警报日志。

错误

存在启动失败的组。

部分操作失败。

请通过命令等确认服务器端的状态。
确认状态后,若无问题则可继续运行。

错误

存在停止失败的组。

部分操作失败。

请通过命令等确认服务器端的状态。
确认状态后,若无问题则可继续运行。

警告

输入的检索记录条数小于1。

警报日志查找的查找对象ID中设置了小于1的值。

请指定1以上的值。

错误

输入的页数小于1。

警报日志查找的页数指定中设置了小于1的值。

请指定1以上的值。

错误

输入的页数已超过了全部页数。.

警报日志查找的页数指定中设置了大于总页数的值。

请设置小于总页数的值。

警告

从服务器获取的属性数据可能不完整。

获取部分信息失败。

稍候请重载。

错误

存在停止失败的组。

可能存在集群关机失败的服务器。

请确认服务器是否已宕机。若未宕机,请确认EXPRESSCLUSTER 是否正在运行。

错误

开始时间不正确,请输入正确的开始时间。

指定了不正确的警报日志查找的查找对象的开始时间。

请设置正确的时间。

错误

开始时间晚于结束时间。

警报日志查找的查找对象的开始时间比结束时间晚。

请设置正确的时间。

信息

总页数已发生变化,服务器上的Alert日志可能已更新。.

更新了警报日志查找的查找结果的总页数。
显示查找结果的过程中可能发生了新的警报。

为将添加的警报反映到查找结果中,请暂时关闭查找结果画面然后重新执行查找。

错误

从服务器获取镜像磁盘列表失败。.

发生了镜像Agent的内部错误。
从WebManager服务器向镜像Agent通信失败。
服务器上的处理超时。

请确认镜像Agent是否正在运行。若镜像Agent未启动,则请重启服务器。

错误

获取镜像状态失败。

镜像Agent获取镜像磁盘的状态失败。
发生了镜像Agent的内部错误。
从WebManager服务器向镜像Agent通信失败。
服务器上的处理超时。

请确认镜像Agent是否正在运行。若镜像Agent未启动,则请重启服务器。

错误

镜像状态发生改变,复归失败。

镜像复归过程中发生了错误。

请确认镜像Agent是否正在运行。若镜像Agent未启动,则请重启服务器。

确认

两块磁盘的数据相同。确实要继续进行镜像复归吗?

两台服务器的镜像磁盘无差异。

-

确认

{0}镜像复归中,确实要停止吗?

镜像重新构筑过程中请求停止。

-

错误

本地applet的版本与服务器的版本不相符。请关掉浏览器,清空applet缓存,再重试一次。.

因为残留有Java的缓存,导致发生了Java Applet和服务器之间版本的不一致。

请结束浏览器。请清除Java的缓存后重启浏览器。

错误

服务器列表取得失败

获取服务器列表失败。

请稍后执行更新。

错误

服务器正在收集集群日志,请等其它的集群日志收集结束后再执行。

服务器正在收集集群日志。

请先结束其它的集群日志收集后再执行此操作。

错误

从服务器收集集群日志失败。.

获取集群日志过程中发生了错误。

请通过集群日志收集进度对话框确认结果。(参考"
使用WebManager收集日志")

错误

登录失败(内部错误)。

登录到WebManager时,发生了内部错误。

请重新连接到WebManager。
若重新连接后仍然发生此错误,则请重启WebManager Daemon。

错误

登录失败。

输入密码时,连续3次输入了错误的密码。

请重新连接到WebManager后,输入正确的密码。

错误

密码不正确。

输入密码时,输入了错误的密码。

请输入正确的密码。

错误

认证失败。.

WebManager连接过程中,更改了密码。

请重新连接到WebManager。

错误

认证失败(内部错误)。

WebManager连接过程中,发生了内部错误。

请重新连接WebManager。
若重新连接后仍然发生此错误,则请重启WebManager Daemon。

错误

连接服务器失败。

和WebManager通信失败。

请确认服务器端WebManager是否正在运行。
请确认可以和服务器正常连接。

错误

取得异常镜像磁盘列表失败。.

镜像Agent获取镜像磁盘的信息失败。
发生了镜像Agent的内部错误。
从WebManager服务器向镜像Agent通信失败。
服务器中的处理超时。

请确认镜像Agent是否正在运行。若镜像Agent未启动,请重启服务器。

确认

无法获取另一台服务器的状态。
确实要执行强制复归吗?

执行了镜像强制复原。

-

确认

确实要关闭集群"{0}"吗?

集群关机的确认消息。

-

确认

确实要暂时停止"{0}"吗?

集群挂起的确认消息。
{0}中是集群名。

-

确认

确实要恢复"{0}"吗?

集群复原的确认消息。
{0}中是集群名。

-

确认

确实要启动"{0}"吗?

集群Daemon启动的消息。
{0}中是集群名。

-

确认

确实要停止"{0}"吗?

集群Daemon停止的消息。
{0}中是集群名。

-

确认

确实要重新启动管理Daemon吗?

WebManager的服务器端重启服务器的确认消息。

-

确认

确实要启动镜像代理Daemon吗?

启动镜像Agent的消息。

-

确认

确实要停止镜像代理Daemon吗?

停止镜像Agent的消息。

-

确认

确实要暂时停止集群吗?

集群挂起的确认消息

-

确认

确实要恢复集群吗?

集群复原的确认消息。

-

确认

确实要启动集群吗?

集群Daemon启动的确认消息。

-

确认

确实要停止集群吗?

集群Daemon停止的确认消息。

-

确认

注意:如果关闭服务器,为了将这台服务器上使用的镜像磁盘恢复到正常状态需要执行镜像复归操作。
这个操作可能要花费很长时间。
确实要继续吗?
集群内部分服务器关机的确认消息。
{0}中是服务器名。

-

确认

注意:如果重新启动服务器,为了将这台服务器上使用的镜像磁盘恢复到正常状态需要执行镜像复归操作。
这个操作可能花费很长时间。
确实要继续吗?
集群内部分服务器重启的确认消息。
{0}中是服务器名。

-

确认

确实要启动"{0}"吗?

集群内部分服务器的集群Daemon启动的确认消息。
{0}中是服务器名。

-

确认

确实要停止"{0}"吗?

集群内部分服务器的集群Daemon停止的确认消息。
{0}中是服务器名。

-

确认

确实要停止"{0}"吗?

停止失效切换组的确认消息。
{0}中是组名。

-

确认

确实要启动"{0}"吗?

失效切换组内部分资源启动的确认消息。
{0}中是资源名。

有依赖关系的资源也会启动,请注意。

确认

确实要停止"{0}"吗?

失效切换组内部分资源停止的确认消息。
{0}中是资源名。

有依赖关系资源也会被停止,请注意。

确认

镜像磁盘{0}上的文件系统可能存在异常。确实要执行强制复归吗?

执行上一次镜像复归时,镜像复归发生中断。该磁盘为复制目标。
进行镜像磁盘的强行复原时,该服务器的镜像磁盘数据有可能有异常。如果强行复原,则该数据作为最新数据处理。
{0}中是镜像资源名。

推荐强行复原对方服务器的镜像磁盘。

确认

镜像磁盘{0}上的文件系统可能存在异常。
无法获取其它服务器的状态。
确实要执行强制复归吗?
执行上一次的镜像复归时,中断镜像复归。该磁盘为复制目标。
为无法取得对方服务器镜像磁盘的状态。进行镜像磁盘的强行复原时,该服务器的镜像磁盘数据有可能有异常。如果强行复原,则该数据作为最新数据处理。
{0}中是镜像资源名。

推荐强行复原对方服务器的镜像磁盘。

确认

镜像磁盘{0}上的文件系统可能存在错误。
确实要连接到镜像磁盘吗?
在手动激活镜像磁盘时显示。
执行上一次的镜像复归时,中断镜像复归。该磁盘为复制目标。
该服务器的镜像磁盘有可能有异常。

由于该磁盘的文件系统有可能异常,所以推荐继续进行激活操作。

确认

是否停止全部监视器的故障模拟?

从「故障验证模式」切换到其他模式时,请确认是否解除了所有监视资源的模拟故障。

-

错误

错误
原因:{0}

对于镜像的操作失败。具体原因请参考{0}部分的字符串。

请参考{0}部分的字符串对策。

错误

与镜像代理的通信发生错误.

WebManager与镜像Agent之间通信失败。

请确认集群内各服务器中镜像Agent是否运行。镜像Agent没有运行时,请重启服务器。

错误

与镜像代理的通信发生超时

WebManager与镜像Agent间的通信时发生超时。

请将集群属性的镜像Agent发送超时、接受超时的值设大。
发生暂时的高负荷状态时,使用[clptoratio]命令更改超时的倍率。

错误

镜像代理内部发生错误

内存确保失败、共享内存Attach失败、镜像驱动的ioctl()失败。

请确认镜像磁盘相关的设定值无误。
请执行集群关机、重启。

错误

指定的镜像磁盘资源名无效

指定的镜像磁盘不存在。

点击[刷新],显示集群的最新状态后重新进行相同操作。

错误

镜像磁盘信息取得失败

取得镜像Agent的镜像磁盘信息失败。

请确认镜像磁盘相关的设定值正确。
请执行集群关机、重启。

错误

指定的服务器名无效.

指定的服务器不存在。

点击[刷新],显示集群的最新状态后,重新进行相同操作。

错误

镜像磁盘差分百分比取得失败

取得镜像Agent的镜像磁盘差异信息失败。

请确认镜像磁盘相关的设定值正确。
请执行集群关机、重启。

错误

许可证无效

注册的license无效或者过期,操作失败。

请确认license。
在使用使用版license时,请确认可以使用的有效期。

错误

镜像磁盘已经被Mount

通过其他的WebManager的镜像激活操作、clpmdctrl命令进行镜像激活操作时的镜像状态没有被反映。

点击[刷新],显示集群的最新状态后,重新进行相同操作。

错误

镜像磁盘状态取得失败

取得镜像Agent的镜像磁盘状态失败。

请确认镜像磁盘相关的设置值正确。
执行集群关机、重启。

错误

镜像磁盘状态不正确

更改镜像状态的操作、发生变化时的镜像状态没有被反映。

点击[刷新]按钮,集群的最新状态显示后,重新进行相同操作。

错误

集群分区读失败

访问集群分区失败。

请确认镜像磁盘的集群分区设定无误。
请确认集群分区中设置的分区磁盘正常。

错误

集群分区写失败.

访问集群分区失败。

请确认镜像磁盘的集群分区设定无误。
请确认集群分区中设置的分区磁盘正常。

错误

镜像磁盘未Mount.

镜像磁盘没有被mount,操作失败。
通过其他的WebManager的镜像非激活操作、[clpmdctrl]命令进行镜像非激活操作时的镜像状态没有被反映。

点击[刷新],显示集群的最新状态。

错误

Mount点创建失败.

在激活镜像资源时的mount点创建处理中发生错误。

请确认镜像资源的mount点的设置值无误。

错误

镜像磁盘大小不一致,活性失败.

在数据分区中设置的分区大小,在两台服务器中不统一,初始镜像构筑没有在指定的方向执行。

请执行以下事项。
1.不激活镜像资源所属的失效切换组。
2.请确认两台服务器的数据分区大小。
3.请确认数据分区容量小的服务器的数据是最新的。
4.执行数据分区容量小的服务器向数据分区容量大的服务器镜像复归。
5.激活镜像资源所属的失效切换组。

错误

镜像磁盘强制复归失败.

强行复原镜像磁盘失败。

请确认镜像磁盘的设置(特别是集群分区、端口号)无误。
请确认集群分区中设置的分区设备正确。

错误

镜像磁盘操作失败.

镜像磁盘相关的操作失败。

请确认镜像磁盘的设置(特别是集群分区、端口号)无误。
请确认集群分区中设置的分区设备正常。
执行集群关机、重启。

错误

服务器列表取得失败.

服务器一览取得失败。

请确认镜像磁盘的设置无误。
请执行集群关机、重启。

错误

镜像磁盘驱动异常

镜像磁盘的驱动异常,操作失败。

请确认各服务器中执行lsmod命令,镜像磁盘的驱动(liscal)被加载。
参考《开始指南》,确认Replicator,ReplicatorDR选项的对应内核版本信息和使用的内核版本。
请执行集群关机、重启。

错误

镜像磁盘驱动状态取得失败.

镜像驱动异常,操作失败。

请确认各服务器中,执行lsmod命令,加载镜像磁盘的驱动(liscal)被加载。
参考《开始指南》,确认Replicator,Replicator DR选项的对应内核版本信息和使用的内核版本。
请执行集群关机、重启。

错误

指定的复归模式无效

指定的重新构筑模式无效,镜像复归操作失败。
更改镜像状态的操作、发生变化时的镜像状态没有被反映。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

复归数据传输失败.

发送复原数据失败,镜像复归失败。

请确认镜像磁盘的设置(特别是镜像连接)的无误。
请确认镜像连接中设置的网络正常。

错误

复归过程中发现了磁盘错误.

查出磁盘错误,镜像复归失败。

交换错误磁盘,请重新复原。

错误

镜像磁盘复归中止失败.

镜像复归中止失败。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

镜像磁盘的扇区数取得失败.

由于镜像磁盘的扇区数取得失败,操作失败。

请确认镜像磁盘的设置(特别是分区)无误。

错误

指定的镜像磁盘正在复归中.

由于镜像复归,所以操作失败。
通过其他WebManager的镜像复归操作或者由[clpmdctrl]命令进行镜像复归操作时,镜像状态没有被反映。

点击[刷新],显示集群的最新状态。

错误

镜像磁盘状态正常,不需要复归.

不是镜像复归需要的状态。
更改镜像状态的操作、发生变化时的镜像状态没有被反映。

点击[刷新],显示集群的最新状态。

错误

进程创建失败.

由于镜像复归需要的进程创建失败,所以镜像复归失败。

请确认镜像复归目标服务器的状态。

错误

复归方向不正确.

由于镜像复归的复原方向不正确,所以镜像复归失败。
更改镜像状态的操作、发生变化时的镜像状态没有被反映。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

未对镜像磁盘进行初期复归.

由于镜像磁盘没有被初始镜像构筑,所以操作失败。
更改镜像状态的操作、发生变化时的镜像状态没有被反映。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

镜像磁盘的复归已被中止.

通过其他的WebManager的镜像复归中断操作、[clpmdctrl]命令进行镜像复归中断操作时的镜像状态没有被反映。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

复归源端不是最新数据,复归失败

由于镜像复归源的磁盘没有最新数据,所以镜像复归失败。
更改镜像状态的操作、发生变化时,镜像状态没有被反映。

点击[刷新],显示集群的最新状态后,更改重新构筑源,重试再构筑。

错误

复归目的端的数据分区大小比复归源端小,复归失败.

镜像复归目标的数据分区容量小于镜像复归源,所以镜像复归失败。

由于初始镜像构筑时进行数据分区容量的自动调整,所以通常不显示该消息。

错误

集群配置信息读取失败

由于集群配置信息文件错误,所以操作失败。

请确认镜像磁盘的设置无误。

错误

系统命令执行失败.

镜像Agent执行的命令的执行结果错误,所以操作失败。
没有通过镜像Agent执行EXPRESSCLUSTER 的执行形式文件。

请确认EXPRESSCLUSTER 的安装目录下存在bin/clprelpath文件。

错误

fsck命令执行超时.

由于执行命令[fsck]发生超时,所以操作失败。

将镜像资源的fsck超时值设大。

错误

mount命令执行超时

由于执行命令[mount]发生超时,所以操作失败。

将镜像资源的mount超时值设大。

错误

umount命令执行超时

由于执行命令[unmount]发生超时,所以操作失败。

将镜像资源的unmount超时值设大。

错误

clprelpath命令执行超时

由于执行命令[clprelpath]发生超时,所以操作失败。

系统为高负荷状态。请排除高负荷的原因。

错误

mount命令执行错误

由于[mount]命令的执行发生错误,所以操作失败。

请确认镜像资源的[mount]选项设置无误。
请确认支持文件系统的mount选项被设置。
请确认镜像资源的mount点目录存在。

错误

umount命令执行错误

由于[unmount]命令的执行发生错误,所以操作失败。

请确认镜像资源的mount点目录存在。

错误

fsck命令执行错误.

由于[fsck]命令的执行发生错误,所以操作失败。

请确认镜像资源的[fsck]选项的设置无误。
请确认支持文件系统的[fsck]选项被设置。

错误

镜像磁盘活性动作中.

由于镜像磁盘正在激活处理中,所以操作失败。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

镜像磁盘差分信息取得失败.

取得镜像Agent的镜像磁盘差异信息失败。

请确认镜像磁盘的相关设置值无误。
请执行集群关机、重启。

错误

镜像磁盘的设备大小取得失败.

由于取得镜像磁盘的设备容量失败,所以操作失败。

请确认镜像磁盘的设置(特别是数据分区的设置)无误。

错误

启动集群"{0}"失败。
点击刷新按钮或稍后再试。
通过其他的WebManager的操作、[clpcl]命令进行操作时的集群状态没有被反映。
{0}中是集群名。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

停止集群"{0}"失败。
点击刷新按钮或稍后再试。
集群的状态可能不是最新的。
通过其他的WebManager的操作、[clpcl]命令进行操作时的集群状态没有被反映。
{0}中是集群名。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

暂时停止集群"{0}"失败。
点击刷新按钮或稍后再试。
集群的状态可能不是最新的。
通过其他的WebManager的操作、[clpcl]命令进行操作时的集群状态没有被反映。
{0}中是集群名。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

恢复集群"{0}"失败。
点击刷新按钮或稍后再试。
集群的状态可能不是最新的。
通过其他的WebManager的操作、[clpcl]命令进行操作时的集群状态没有被反映。
{0}中是集群名。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

管理服务重新启动失败。
点击刷新按钮或稍后再试。.

EXPRESSCLUSTER 的数据传送服务器中发生错误。

请确认EXPRESSCLUSTER 数据传送服务器的启动状态。

错误

启动服务器"{0}"失败。
点击刷新按钮或稍后再试。
集群的状态可能不是最新的。
通过其他的WebManager的操作、服务器状态更改时的集群状态没有被反映。
{0}中是服务器名。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

停止服务器"{0}"失败。
点击刷新按钮或稍后再试。
集群的状态可能不是最新的。
通过其他的WebManager的操作、服务器状态更改时的集群状态没有被反映。
{0}中是服务器名。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

在服务器"{1}"上启动组"{0}"失败。.

组的状态可能不是最新的。
通过其他的WebManager的操作、使用clpgrp命令操作时没有被反映。
{0}中是组名。

点击[刷新],组的最新状态显示后,重新进行相同操作。

错误

停止组"{0}"失败。.

组的状态可能不是最新的。
通过其他的WebManager的操作、使用clpgrp命令操作时没有被反映。
{0}中是组名。

点击[刷新],组的最新状态显示后,重新进行相同操作。

错误

移动组"{0}"到服务器"{1}"失败。

组的状态可能不是最新的。
通过其他的WebManager的操作、使用clpgrp命令操作时没有被反映。
{0}中是组名。

点击[刷新],组的最新状态显示后,重新进行相同操作。

错误

监视资源"{0}"暂时停止失败。
点击刷新按钮或稍后再试。.
集群的状态可能不是最新的。
通过其他的WebManager的操作、使用[clpmonctrl]命令操作时集群状态没有被反映。
{0}中是监视资源名。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

监视资源"{0}"恢复失败。
点击刷新按钮或稍后再试。
集群的状态可能不是最新的。
通过其他的WebManager的操作、使用[clpmonctrl]命令操作时集群状态没有被反映。
{0}中是监视资源名。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

监视资源"{0}"暂时停止失败。
点击刷新按钮或稍后再试。
集群的状态可能不是最新的。
通过其他的WebManager的操作、使用[clpmonctrl]命令操作时集群状态没有被反映。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

监视资源"{0}"暂时停止失败。n点击刷新按钮或稍后再试.

集群的状态可能不是最新的。
通过其他的WebManager的操作、使用[clpmonctrl]命令操作时集群状态没有被反映。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

实时更新数据失败。正在重试连接服务器。

可能已达到最大连接数。

请更改WebManager的[可连接的客户端台数]。
请结束不必要的WebManager。

错误

启动资源"{0}"失败。
点击刷新按钮或稍后再试。
集群的状态可能不是最新的。
通过其他的WebManager的操作时的集群状态没有被反映。
{0}中是资源名。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

停止资源"{0}"失败。
点击刷新按钮或稍后再试。
集群的状态可能不是最新的。
通过其他的WebManager的操作时的集群状态没有被反映。
{0}中是资源名。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

部分监视暂时停止失败。点击刷新按钮或稍后再试。

集群的状态可能不是最新的。
通过其他的WebManager的操作、使用[clpmonctrl]命令操作时集群状态没有被反映。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

部分监视恢复失败。
点击刷新按钮或稍后再试。.
集群的状态可能不是最新的。
通过其他的WebManager的操作、使用[clpmonctrl]命令操作时集群状态没有被反映。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

无法停止监视器的模拟故障。
点击刷新按钮或稍后再试。
集群的状态可能不是最新的。
通过其他的WebManager的操作、[clpmdctrl]命令进行操作时的集群状态没有被反映。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

无法停止部分监视器的模拟故障。
点击刷新按钮或稍后再试。
集群的状态可能不是最新的。
通过其他的WebManager的操作、[clpmdctrl]命令进行操作时的集群状态没有被反映。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

无法开始监视器"{0}"的模拟故障。
点击刷新按钮或稍后再试。
集群的状态可能不是最新的。
通过其他的WebManager的操作、[clpmdctrl]命令进行操作时的集群状态没有被反映。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

无法停止监视器"{0}"的模拟故障。
点击刷新按钮或稍后再试。.
集群的状态可能不是最新的。
通过其他的WebManager的操作、[clpmdctrl]命令进行操作时的集群状态没有被反映。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

启动镜像代理失败。
确认集群和镜像代理的状态。
点击刷新按钮或稍后再试。
EXPRESSCLUSTER Daemon没有启动。
通过其他的WebManager的操作、[clpc]命令进行操作时的集群状态没有被反映。
请确认各服务器的EXPRESSCLUSTER Daemon启动。
点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

停止镜像代理失败。
确认集群的状态。
点击刷新按钮或稍后再试。

通过其他的WebManager的操作、[clpc]命令进行操作时的集群状态没有被反映。

点击[刷新],集群的最新状态显示后,重新进行相同操作。

错误

由于组内镜像磁盘正在进行复归,因此不能启动组。待镜像磁盘复归结束后再重试。

失效切换组中存在处于镜像复归中的镜像磁盘资源,所以中止失效切换组的启动。

请等待镜像复归完成,重新执行相同的操作。

错误

由于组内镜像磁盘正在进行复归,因此不能移动组。待镜像磁盘复归结束后再重试。

失效切换下存在镜像复归中的镜像磁盘资源,所以中止失效切换组的移动。

请等待镜像复归完成,重新执行相同的操作。

错误

由于镜像磁盘正在进行复归,因此不能启动镜像磁盘。
待镜像磁盘复归结束后再重试。

由于镜像磁盘资源为镜像复归中,所以中止资源启动。

请等待镜像复归完成,重新执行相同的操作。

错误

发生内部错误。.

连接了WebManager的服务器内存不足,网络异常,文件系统的空余容量不足,其他的OS资源不足。

请确认服务器中OS资源、网络、文件系统的空余容量。

错误

{0}服务没有运行。

镜像Agent Daemon没有启动。

请在镜像Agent Daemon启动后重新进行操作。

错误

处理超时。

WebManager在取得镜像Agent的数据时发生超时。

系统为高负荷状态。请排除高负荷的原因。
暂时发生高负荷状态时,使用[clptoratio]命令,更改超时倍率。

错误

服务器 "{0}"访问集群分区时存在I/O异常,选择的操作无法执行。
请选择另一台服务器。.

服务器{0}中对集群分区发生了I/O错误。

请选择其他服务器。请确认共享磁盘。

错误

服务器 "{0}"访问集群分区时存在I/O异常,选择的操作无法执行。
请选择另一台服务器。

服务器{0}中对集群分区发生了I/O错误。

请选择其他服务器。请确认共享磁盘。

警告

从服务器获取的镜像磁盘一览数据可能不完整。

获取异常镜像磁盘列表数据时出错。

请确认镜像磁盘Agent的状态,稍后再重新加载。

错误

启动镜像代理失败。
确认集群和镜像代理的状态。点击刷新按钮或稍后再试。
EXPRESSCLUSTER Daemon已经启动或者镜像Agent已经启动。
有可能是执行其他WebManager的操作或者[clpcl]命令操作后集群状态没有被反映。
请确认集群和镜像磁盘Agent的状态。
按下重新加载按钮,在显示集群的最新的状态后,重新执行相同操作。

错误

停止镜像代理失败。
确认集群的状态。
点击刷新按钮或稍后再试。
EXPRESSCLUSTER Daemon已经启动。
有可能是执行其他WebManager的操作或者[clpcl]命令操作后集群状态没有被反映。
请确认集群和镜像磁盘Agent的状态。
按下重新加载按钮,在显示集群的最新的状态后,重新执行相同操作。

错误

操作权限变更失败

变更当前权限失败。

请确认镜像Agent的状态。
按下重新加载按钮,在显示集群的最新的状态后,重新执行相同操作。

错误

可操作服务器的信息获取失败

获取当前服务器的信息时出错。

请确认镜像Agent的状态, 重新执行相同操作。

错误

指定服务器不是可操作服务器。操作不可执行

指定的服务器不是当前服务器。

按下重新加载按钮,在显示集群的最新的状态后,重新执行相同操作。

错误

可操作服务器正在变更中。操作不可执行.

当前服务器变更处理中。

请稍等后重试.

错误

与服务器的连接中断。连接恢复后设定的内容将在画面中表现。请等待。

与WebManager的通信失败,只要连接恢复,更改的设置内容会变为有效。

请在服务器端确认EXPRESSCLUSTER Web Alert 服务正在运行。
请确认与服务器保持着正常连接。

错误

权限信息获取失败。

获取权限信息失败。

请确认权限。并执行集群关闭、重启操作。

错误

从服务器没有获取全部权限信息。

部分权限信息获取失败。

请确认权限。并执行集群关闭、重启操作。

错误

存在集群恢复失败的服务器。

部分服务器恢复集群失败。

请确认恢复失败的服务器状态。

错误

无法从服务器获取时刻信息。

获取时刻信息失败。

请按[刷新],显示集群的最新状态后,再次执行同一操作。

错误

时刻信息清除失败。

清除时刻信息失败。

请按[刷新],显示集群的最新状态后,再次执行同一操作。

3. Builder的功能

本章中对Builder的功能进行说明。

本章中说明的项目如下所示。

3.1. Builder的概要

Builder是用来创建集群配置信息(config、脚本)以及更改设置的工具。

注解

在ExpressCluster X 4.0之后的版本中添加或更改的功能在WebManager中无法设置和显示。

有在线版和脱机版。

  • 在线版
    从WebManager的[显示]菜单中点击[设置模式],或者从工具条上的下拉菜单的[设置模式],启动Builder。
    可以直接连接到服务器进行集群的创建和配置更改,也可以发送配置信息。
  • 脱机版
    可以在无法连接到服务器的机器上进行集群配置信息的创建与信息变更。
    发送配置信息需要使用[clpcfctrl]命令。

参见

有关 Builder的运行环境请参考Web网站。

注解

本指南中出现的Builder,是指在WebManager的设置模式下运行的在线版Builder和在管理PC中运行的脱机版Builder。
本指南中出现的"Linux版"是指在Linux的浏览器上运行的Builder。"Windows版"则是指在Windows的浏览器上运行的Builder。
本指南中出现的"主机名"原则上是指从FQDN格式中去除了域名后的简称。

3.1.1. Builder的注意限制事项

  • 以下产品不具备集群配置信息的兼容性。

    EXPRESSCLUSTER X 4.0 for Linux以外的Builder

  • 使用比本产品更新的版本创建的EXPRESSCLUSTER 的配置信息,不能在本产品中使用。

  • Linux版 X1.0 / 2.0 / 2.1 / 3.0 / 3.1 / 3.2 / 3.3 / 4.0的EXPRESSCLUSTER的配置信息可在本产品中使用。
    使用时,在Builder 的 [文件] 菜单中点击 [导入设置文件] 。
  • (通过[文件]菜单中的[退出]或窗口中的[X]等)结束Web浏览器后,会弹出确认对话框。
    要继续设置时,请点击【取消】按钮。

    注解

    JavaScript无效的场合下,本画面不显示。

  • 刷新Web浏览器后(通过[工具]菜单中的[刷新]及工具条上的[刷新]按钮等),会弹出确认对话框。
    要继续设置时,请点击【取消】按钮。

    注解

    JavaScript无效的场合下,本画面不显示。

  • 在Builder中创建集群配置信息时请注意下述几点。

  • 输入数值的文本框
    请不要输入以0开头的数值。
    比如,超时设定为10秒时,请输入[10],而不是输入[010]。
  • 若在执行Builder时更改画面的清晰度,则有可能会在Java控制台中输出"NullPointerException"等的Java VM堆栈跟踪。Builder仍可继续运行。

  • 若在浏览器的下拉菜单显示时按下Esc键,则有可能会在Java控制台中输出"NullPointerException"等的Java VM堆栈跟踪。Builder仍可继续运行。

  • Builder的键盘焦点失效(键盘焦点移动到Web浏览器),可能无法操作键盘。请使用鼠标点击Builder的画面,找回焦点。

  • 使用多画面显示功能时,请不要在次显示画面中而在主显示画面中执行。否则,可能会出现不显示画面等非正常运行。

  • 使用Linux中的浏览器时,根据窗口管理器的组合,对话框有可能会显示在其它窗口后。请通过Alt + Tab键等切换窗口。

  • 在[Alert日志]标签页的[保存最大Alert记录数](参考"3.11.12. Alert日志标签页") 中,若设置小于当前设置值的值,则会删除所有警报日志的内容。请在开始使用前充分考虑磁盘空间后再进行设置。

  • 在Microsoft Windows VistaTM + Internet Explorer 7的环境中,将Internet Explorer 7安全设定中的[Protected Mode]设为无效。

  • 不支持JIS2004特有字符。因此,不能使用JIS2004在各种设置画面中输入或者显示追加字符。

  • 经由Reverse Proxy服务器时,Builder不能正常运行。

  • 关于脚本编辑器,Linux版中默认"vi"编辑器,Windows 版则是"记事本"。因为Linux 版默认设置中终端使用xterm,因此多字节字符无法正确显示。

  • 请按照下表的组合使用脱机版Builder版本和EXPRESSCLUSTER内部版本。如果使用下述以外的组合方式可能出现运行异常。

脱机版Builder版本

EXPRESSCLUSTER内部版本

4.0.0-1

4.0.0-1

4.0.1-1

3.2. Builder画面的详细信息

本节中对Builder的画面构成进行说明。

3.2.1. Builder的概要

Builder的画面构成如下所示。图中表示的是各部分的名称。

在画面左侧的树形图中按层次结构显示集群的对象。

在画面右侧的表格视图中显示包含在树形图所选对象中的对象。

3.2.2. 树形图

在树形图中显示的对象种类如下所示。

层次

对象

含义

选择对象时的表格视图

1

表示集群。

显示集群名选择表格。

2

Servers

表示集群中包含的服务器的集合。

显示Servers选择表格。

3

表示各个服务器。

显示组名选择表格。

2

Groups

表示集群中包含的组的集合。

显示Groups选择表格。

3

表示各个组。

显示组名选择表格。

2

Monitors

表示集群中包含的监视资源的集合。

显示Monitors选择表格。

3.2.3. 表格视图

3.2.4. 集群名选择表格

显示根层次的对象一览。

3.2.5. 服务器选择表格

显示服务器一览。

列名

概要

名称

显示服务器名。
按服务器名顺序显示。

类型

设置为主服务器时,显示为"Master"。

注释

显示服务器中设置的注释。

3.2.6. 服务器名选择表格

显示已选择的服务器中被允许启动的组列表。

列名

概要

顺序

名称列内所显示的组,显示可以启动的服务器的优先顺序。
优先级最高值为1。
按照优先顺序显示。

名称

显示服务器组名。

注释

显示服务器组中设置的注释。

3.2.7. 组选择表格

组列表

显示各组的失效切换优先级。

列名

概要

名称

显示组名。
按组名顺序显示。

类型

显示组的类型。

服务器名
(依据服务器数可动态增减列数)
在以列名表示的服务器中显示组启动的顺序。
优先级最高的值为1。

注释

显示组中设置的注释。

启动等待

使用列表显示组的启动等待的依赖关系。

列名

概要

深度

表示名称列中的组的启动顺序。
没有任何组等待启动时,显示为"0"。
按照深度顺序来显示。

名称

显示组名。

对象组名

名前列中的组表示启动等待组的名称。
没有任何组等待启动时,显示为"none"。
如果启动等待组为复数个时,使用复数行来表示。

下面用图来表示深度的含义。图中的箭头 (->)表示组的启动等待对象。

使用列表表示此图的依赖关系。

深度

名称

启动等待组名

0

group1

None

1

group2

group1

1

group4

group1

2

group3

group2

2

group5

group4

停止等待

使用列表表示组的停止等待的依赖关系。

列名

概要

深度

表示名称列中的组的停止顺序。
没有任何组等待停止时,显示为"0"。
按照深度顺序来显示。

名称a

显示组名。

对象组名

名前列中的组表示停止等待组的名称。
没有任何组等待停止时,显示为"none"。
如果停止等待组为复数个时,使用复数行来表示。

下面用图来表示深度的含义。图中的箭头 (->)表示组的停止等待对象。

使用列表表示此图的依赖关系。

深度

名称

停止等待组名

0

group1

none

1

group2

group1

1

group4

group1

2

group3

group2

2

group5

group4

3.2.8. 组名选择表格

资源列表

显示选中的组中包含的组资源一览。

列名

概要

名称

显示组资源名。
按组资源名顺序显示。

类型

显示组资源的类型。

资源信息

显示组资源的激活、非激活的对象。

注释

显示组资源中设置的注释。

全部依赖

一览显示选中的组中包含的组资源的依赖关系。

列名

概要

深度

显示名称列中表示的组资源的目标激活顺序。
不依赖任何组资源时,显示为0。
按深度顺序显示。

名称

显示组资源名。

依赖资源

显示名称列中表示的组资源依赖的组资源的名称。
不依赖任何组资源时,显示为"none"。
依照已有的依赖关系时,显示为"--"。
存在多个依赖资源时,使用多行来显示。

类型

显示依赖资源名列中表示的组资源的类型。
依照已有的依赖关系时,显示其依赖的类型。

下面用图来表示深度的含义。图中的箭头(->)表示组资源的激活顺序。

此图中表示的依赖关系一览如下表所示。并非为已有的依赖关系,而是根据资源名设置的依赖关系。

深度

名称

依赖资源名

类型

0

disk1

none

0

disk2

none

1

fip1

disk1

磁盘资源

1

fip2

disk2

磁盘资源

2

exec1

fip1

浮动ip资源

fip2

浮动ip资源

3.2.9. 监视资源选择表格

显示监视资源一览。

列名

概要

名称

显示监视资源名。
按监视资源名顺序显示。

类型

显示监视资源的类型。

监视位置

显示监视资源的监视对象。

注释

显示监视资源中设置的注释。

3.3. 弹出菜单

右键点击树形图对象及表格行后会显示弹出菜单。

选择对象

显示菜单

参考

no_cluster_name

集群生成向导

3.6.1. 新建集群

cluster_name

删除集群

3.8.2. 删除

重命名集群

3.8.3. 重命名

属性

3.8.4. 属性

Servers

添加服务器

3.8.1. 添加

属性

3.8.4. 属性

server_name

删除服务器

3.8.2. 删除

更改服务器名

3.8.3. 重命名

属性

3.8.4. 属性

Monitors

添加监视资源

3.8.1. 添加

Groups

添加组

3.8.1. 添加

添加用于管理的组

3.8.1. 添加

属性

参考指南》的"组资源的详细信息"

group_name

添加资源

3.8.1. 添加

删除组

3.8.2. 删除

重命名组

3.8.3. 重命名

属性

3.8.4. 属性

group_resource_name

删除资源

3.8.2. 删除

重命名资源

3.8.3. 重命名

属性

3.8.4. 属性

monitor_resource_name

删除监视资源

3.8.2. 删除

重命名监视资源

3.8.3. 重命名

属性

3.8.4. 属性

3.4. 使用Builder的工具条

Builder中提供了工具条。

有关与WebManager通用的操作模式切换、设定模式切换、参照模式切换的图标详细情况,请参照本指南的"2. WebManager的功能"-"WebManager的画面"-"WebManager的主画面"-"工具条"。
点击工具条中的组合框或者图标,可以执行与工具条上部的下拉菜单中部分功能相同的操作。

图标

功能

参考

导入配置文件。与选择[文件]菜单中的[导入]的操作相同.

"3.6.2. 打开信息文件"

导出配置文件。与选择[文件]菜单中的[导出配置文件]的操作相同

"3.6.3. 保存信息文件"

获取配置文件。与选择[文件]菜单中[获取配置文件]的操作相同。

"3.6.4. 获取配置文件(在线版)"

应用配置文件。与选择[文件]菜单中[应用配置文件]的操作相同。

"3.6.5. 应用配置文件(在线版)"

3.5. 使用Builder的菜单条

使用Builder的菜单条,可以进行各种操作。本部分对使用菜单条进行操作的详细内容进行说明。

3.6. 文件菜单

选择[文件]菜单后会显示以下下拉菜单。

菜单

功能概要

新建

新建集群。

集群生成向导

启动集群生成向导

导入配置文件

导入集群配置文件。

导出配置文件

导出集群配置文件。

获取配置文件

获取已应用到集群的配置文件。(仅限在线版)

应用配置文件

上传配置文件,应用到集群。(仅限在线版)

更新服务器信息

更新服务器的IP地址和磁盘信息(仅限在线版)

选项

启动[选项]对话框。

保存日志

启动[保存日志]对话框。

退出

结束Builder。

新创建

新创建集群

3.6.1. 新建集群

使用Builder设定新建集群。

重要

若新建集群,则会取消之前编辑的集群配置信息。请务必在操作前先保存重要的数据后再新建集群。

  1. 点击[文件]菜单的[新文件]。

  2. 更改了正在编辑的集群配置信息时,会显示是取消还是保存的确认对话框。如果需要保存则点击[是],在接下来显示的对话框中指定保存集群配置信息的文件夹。关于保存操作请参考"3.6.3. 保存信息文件"。如果不保存则点击[否]。

  3. 右键点击画面左边树形图的集群图标,点击[集群生成向导进],使用集群生成向导进行创建。

3.6.2. 打开信息文件

要打开保存的集群配置信息时,选择[导入配置文件]。按照读入的配置文件显示树形图。
在配置信息编辑中重新打开临时保存文件时使用。

操作说明

文件名请选择"clp.conf"。

3.6.3. 保存信息文件

为了保存当前正在编辑的集群配置信息选择[导出配置文件]。创建集群配置信息后就可以选择此菜单。保存文件名为[clp.conf]。
保存时需要满足下述条件。
  • 存在服务器。

  • 存在LAN心跳资源或内核模式的LAN心跳资源。

操作说明

文件名请指定为[clp.conf]。以[clp.conf]的文件名读入服务器。

注解

在EXPRESSCLUSTER运行的服务器上使用Builder时,请不要直接在/opt/nec/clusterpro/etc/clp.conf 上保存。否则可能导致反映变更时反映方法的消息不能正确显示,或者EXPRESSCLUSTER不能正常运行。请保存到其他目录中。
使用[clpcfctrl]命令上传时,请通过-x参数指定保存目录。

3.6.4. 获取配置文件(在线版)

为了从已连接的服务器中取得设定的集群配置信息,选择[获取配置文件]。根据取得的配置文件显示树形视图。
事先打开其他的配置信息,该配置信息已变更时显示是否保存的确认对话框。
需要保存时请点击[是]。显示指定配置文件保存位置的对话框。关于保存操作,请参考"3.6.3. 保存信息文件"。
不必要保存时点击[否]。放弃编辑中的集群信息,取得配置文件。
想要取消取得时,点击[取消]。

3.6.5. 应用配置文件(在线版)

为了将编辑中的集群配置信息反映到已连接的服务器,选择[应用配置文件]。本菜单在打开了有效的集群配置信息时才可以进行选择。

反映配置时需要满足以下条件。

  • 集群内所有的服务器的EXPRESSCLUSTER数据传输服务程序(clusterpro _trn)正常启动。

  • 已设置LAN心跳资源或者内核模式LAN心跳资源。

注解

没有满足该条件时,与其他的服务器连接失败,反映集群配置信息失败。这时,只对可以连接的服务器能够进行强行反映。详细信息请参考《参考指南》的"EXPRESSCLUSTER命令参考"的"更改集群配置信息、备份集群配置信息、检查集群配置信息(clpcfctrl命令)"的相关说明。

执行反映时显示以下消息。反映失败时请根据说明重新反映。

消息

说明

反映成功。

-

反映成功。
为了反映配置信息,一部分的功能被停止了。
为了重新启动那些被停止的功能,必须执行以下操作。

<必须的操作>

现在马上执行吗?

选择「是」之后将执行显示的操作。

反映被中止了。
反映前,请停止镜像磁盘agent。
由于镜像磁盘agent没有停止,所以中止反映。
请在镜像磁盘agent停止后执行反映。

反映被中止了。存在无法连接的服务器。如果希望强制性反映配置信息,可以在服务器上执行[clpcfctrl]命令。

由于集群内存在无法连接的服务器,所以中止反映。请在确认集群内所有服务器都已经启动后,执行反映。
即使集群内存在无法连接的服务器也要强行反映时,请参考《参考指南》的"EXPRESSCLUSTER命令参考"的"更改集群配置信息、备份集群配置信息、检查集群配置信息(clpcfctrl命令)"。

在数据应用中发生错误

由于在处理中发生错误,所以中止反映。请重新执行反映。

检测集群配置信息文件时失败

集群配置信息里包含的IP地址和各个服务器现在设置的IP地址发生差异。请确认是否正确设置了IP地址。

参见

在集群内存在无法连接的服务器时,无法进行Builder的集群配置信息反映。这时,通过[clpcfctrl]命令,能够对可以连接的服务器的集群配置信息进行强行反映。

强行反映集群配置信息,请按照以下步骤进行。

  1. 使用Builder在本地磁盘合适的目录中保存集群配置信息。

    例) 保存在 C:\config

  2. 将已保存的集群配置信息保存到集群内的任意服务器中。

    例) 将在(1)中保存的 C:\config 下所有的内容保存到集群内任意服务器上的目录/root/tmp中。

  3. 在保存集群配置信息的服务器中执行以下命令。

    clpcfctrl --push -w -x "保存集群配置信息的目录" --force

    例) 在执行(2)后的服务器中执行以下命令:

    clpcfctrl --push -w -x "/root/tmp" --force
    

3.6.6. 更新服务器信息(在线版)

获取指定服务器的信息。
获得IP一览或者设备信息的同时,也获得License信息。若已注册Java Resource Agent资源的License,将显示集群属性的【JVM监视】标签页。另外,根据已注册的License,可以制作相应的监视资源。

更新条目

  • IP一览
    获取IP地址一览。
  • 设备信息
    获取磁盘设备和COM设备的信息。

注解

不能获取GPT管理的磁盘设备信息。

选择服务器

指定获取信息的服务器。通过切换表头复选框的选中状态, 能够切换所有的复选框的状态。

3.6.7. 进行通信的设置

更改关于通信的设定时,点击[选项],选择[已启动]。
该设置在脱机版中将被忽略。

通信超时 (0~999)

与服务器通信时的超时。

3.6.8. 设置Builder的日志级别

要更改Builder的日志级别,请选择[选项],选择[日志]。

日志级别

设置在Builder运行时输出的内部日志的级别。

  • ERROR
    仅输出错误级别。
  • WARNING
    输出警告级别和错误级别。
  • INFORMATION
    输出信息级别、警告级别和错误级别。
  • TRACE1,2,3
    输出内部跟踪信息、信息级别、警告级别和错误级别。数字越大,输出的跟踪信息越详细。

JAVA控制台输出

设置是否输出到JAVA控制台。

3.6.9. 收集Builder日志

要收集Builder日志,选择[日志保存]。

指定日志保存目录,点击[保存]。

3.6.10. 退出

结束Builder。但不结束Web浏览器。
正在编辑的信息发生了更改时,会显示确认保存的对话框。
需要保存时点击[是]。接下来会显示指定保存配置文件的文件夹的对话框。关于保存操作请参考"3.6.3. 保存信息文件"。
不需保存时点击[否]。取消正在编辑的集群信息并结束。
要取消结束时点击[取消]。

3.7. 表示菜单

选择[表示]菜单,会显示下面的下拉菜单。

脱机版不显示[表示]菜单。

菜单

功能介绍

操作模式

转换成操作模式。

设定模式

转换为设定模式。

参照模式

转换为参照模式。

验证模式

转换为验证模式。

3.7.1. 操作模式

从当前显示的模式切换到WebManager的操作模式。
与点击工具条上的图标时的效果相同。

3.7.2. 设定模式

从当前显示的模式切换到基于Builder的设置模式。
与点击工具条上的图标时的效果相同。

3.7.3. 参照模式

从当前显示的模式切换到WebManager的参照模式。
与点击工具条上的图标时的效果相同。

3.7.4. 验证模式

从当前显示的模式切换到 WebManager 的模拟模式。
与点击工具条上的图标时的效果相同。

3.8. 编辑菜单

选择[编辑]菜单后会显示下拉菜单。

菜单

功能概要

添加

添加对象。

删除

删除所选对象。

重命名

更改当前选中对象的名称。

属性

显示当前选中对象的属性。

添加用于Webmanager用的组

添加用于管理的组。

3.8.1. 添加

添加集群、服务器、组、组资源、监视资源。显示用于添加的向导画面。
选择对象不同可添加的对象也不同,因此请参考下表。

选择对象

要添加的对象

Groups

添加用于管理的组

[group_name]

组资源

Monitors

监视资源

Servers

服务器

注解

在[组属性]中将[失效切换属性]设定为[自动失效切换]时,无法添加镜像磁盘资源、共享型镜像磁盘资源。请将[失效切换属性]设定为[手动失效切换],添加镜像磁盘资源、共享型镜像磁盘资源。

3.8.2. 删除

显示确认对话框。要删除时点击[是]。删除选择的集群、服务器、组、组资源、监视资源。不删除时点击[否]。

删除集群的操作步骤与"3.6.1. 新建集群"相同。

以下条件时不能删除。

选择对象

不能删除的条件

反映方法

集群名

服务器名

- 不存在其它服务器。
- 设置为唯一可启动组的服务器。
- 登录到服务器组。

集群暂停/恢复

组名

- 是监视资源的复原对象。 6
- 具有组资源。
组停止
集群暂停/恢复
组启动

组资源名

- 是监视资源的复原对象。 6
- 是监视资源监视时的对象资源。 6
- 依赖于同一组内的其他组资源。
・非镜像磁盘资源和共享型镜像磁盘资源时
组停止
集群暂停/恢复
组启动
・镜像磁盘资源和共享型镜像磁盘资源时
集群停止
镜像Agent停止
镜像Agent开始
集群开始

监视资源名

- 镜像磁盘监视资源时,选中集群属性的镜像Agent标签页的[自动镜像复归]复选框。
- 为虚拟IP监视资源。

集群挂起/复原

6(1,2,3)

确认是否可删除该监视资源。选择了"是(Y)"时,删除了该指定对象的监视资源后,该对象也会被删除。

3.8.3. 重命名

显示更改所选集群、服务器、组、组资源、监视资源名的对话框。

下表中为它们各自的输入规则。

选择对象

输入规则

反映方法

组名

- 只可使用单字节的大写英文字符/小写英文字符,数字,短横线(-),下划线(_),空格。
- 最大可输入31个字符(31字节)。
- 字符串的开头与结尾处不能使用短横线(-)和空格。
组停止
集群暂停/恢复
组启动

组资源名

- 只可使用单字节的大写英文字符/小写英文字符,数字,短横线(-),下划线(_),空格。
- 最大可输入31个字符(31字节)。
- 字符串的开头与结尾处不能使用短横线(-)和空格。
・非镜像磁盘资源和共享型镜像磁盘资源时
组停止
集群暂停/恢复
组启动
・镜像磁盘资源和共享型镜像磁盘资源时
集群停止
镜像Agent停止
镜像Agent开始
集群开始
集群名
监视资源名
- 只可使用单字节的大写英文字符/小写英文字符,数字,短横线(-),下划线(_),空格。
- 最大可输入31个字符(31字节)。
- 字符串的开头与结尾处不能使用短横线(-)和空格。

集群暂停/恢复

服务器名

- 与OS中可设置的TCP/IP的主机名的规则相同。需要与服务器中设置的主机名完全一致。
- 最大可输入255个字符(255字节)。
- 字符串的开头和结尾处不能使用短横线(-)和空格。
- 不能使用下划线(_)。
- 不能使用全部为数字的字符串。
- 服务器名中不能使用"localhost"。
需要小心更改服务器名。关于服务器名的更改步骤请参考《维护指南》的"维护信息"的"更改主机名的步骤"。

请按分类在集群、服务器、组、组资源以及监视资源中输入统一(不区分大小写英文字符)名称。

3.8.4. 属性

显示所选集群、服务器、组、组资源、监视资源、servers的属性。
详细内容请参考"3.10. 参数的详细信息"。

3.9. 帮助菜单

3.9.1. 确认Builder的版本信息

要确认Builder 的版本信息时,点击[帮助]菜单中的[版本信息]。

3.10. 参数的详细信息

3.11. 集群属性

在集群的属性中可以显示集群的详细信息及更改设置。

3.11.1. 信息标签页

显示集群名,登录、更改注释。

集群名

显示集群名。此处不能更改名称。

注释 (127字节以内)

设置集群的注释。只可输入半角英文数字。

语言

从下列语言中选择集群的语言。请设置运行WebManager的OS的语言(区域设置)。

  • 英语

  • 日语

  • 中文

以集群属性的[语言]栏内设置的语言,显示WebManager和[clpstat]命令的结果。

注解

请在能够显示指定语言字体的环境下执行[clpstat]命令。
与服务器直接连接的控制台需要设置frame buffer。通过ssh等远程登录时,有时会需要可以显示指定语言的终端模拟器。

3.11.2. 私网标签页

设定集群服务器之间的网络通信线路的配置。

添加

添加通信线路。点击各服务器列的单元格,选择或输入IP地址,设定通信线路中各服务器的IP地址。部分没有连接服务器的通信线路,请设置未连接的服务器的单元格为空白。

删除

删除通信线路。选中要删除的通信线路所在列,点击[删除],则选中的线路被删除。

属性

表示DISK的心跳属性的画面。只有DISK类别能使用。

向上、向下

设定多个私网时,[优先级]列中编号较小的通信线路被优先用于集群服务器间的内部通信。点击[向上]、[向下],调整选中行的顺序,更改优先级。
有私网专用通信线路时,建议将该线路的优先顺序设定成高于其它线路。

注解

[优先级]用于决定集群服务器之间的内部通信所使用的通信线路的优先顺序。集群服务器之间的心跳无视[优先级]的设置,会在心跳用所设置的所有通信线路中被执行。

调整

表示心跳I/F调整属性的画面。

[优先级]列

表示私网的优先顺序。

[种类]列

从[内核模式] 、[用户模式] 、[DISK]、[COM]、[BMC]、[镜像通信专用]选择私网使用的线路。

  • [内核模式]通过内核模式LAN心跳资源进行死活监视

  • [用户模式]通过LAN心跳资源进行死活监视

  • [DISK]通过磁盘心跳资源进行死活监视

  • [COM]通过COM心跳资源进行死活监视

  • [BMC]通过BMC心跳资源进行死活监视

各心跳资源的详细说明请参考《参考指南》的"心跳资源的详细信息"。

[MDC] 列

将通信线路作为镜像磁盘连接线路来使用时,点击[MDC] 列的单元格,选择镜像磁盘连接。
输入内容因种类不同而异。
  • 内核模式、用户模式、镜像通信专用
    通过组合框选择镜像磁盘连接。
    不使用镜像磁盘连接时,选择[不使用]。

注解

镜像磁盘连接中使用的IP地址不能混杂IPv4和IPv6。请将所有的镜像磁盘连接指定为IPv4或者IPv6中的任何一方。

  • DISK、COM、BMC

    不能使用镜像磁盘连接。
    [MDC] 列会自动转变为 [不使用],此时不能进行编辑。

[Server] 列

根据种类不同输入内容不同。

  • 内核模式、用户模式、镜像通信专用
    输入IP地址。清空不使用的通信线路。
  • DISK
    输入磁盘设备。如果不使用磁盘设备,请清空此项。
  • COM
    输入COM设备。如果不使用COM设备,请清空此项。
  • BMC
    输入BMC 的 IP地址。如果不使用BMC,请清空此项。

注解

1台服务器中无法同时存在同属于一个网络地址的多个IP地址。另外,如下所示的包含关系也无法同时存在。

IP地址:10.1.1.10、子网掩码:255.255.0.0
IP地址:10.1.2.10、子网掩码:255.255.255.0

服务器关机通知

用于在服务器正常停止(包含关机、重启)时向集群内的其他服务器发出宕机通知。通过事先进行通知,可以更快速的进行失效切换。
服务器停止(包含关机、重启)时,如果组的非激活失败以及发生了其他异常,不论是否设置了服务器宕机通知,都不发出服务器宕机通知。
  • 复选框被选中
    通知服务器宕机。
  • 复选框未被选中
    不通知服务器宕机。

注解

当使用共享型镜像磁盘资源时,不要使用服务器关机通知功能。

DISK心跳属性

表示DISK心跳属性。

服务器

表示服务器一览。

设备

表示在上一画面中设定的设备。

RAW设备

如果使用RAW设备,、通过选择或直接输入的方式设定RAW设备。
如果不使用RAW设备,清空此项。

调整心跳I/F属性

  • 打开/关闭时机

    • 只启动/停止时
      集群启动时打开raw设备,集群停止时关闭raw设备。每个HB间隔仅执行raw设备的读入、写入。
    • 每个HB间隔
      每个HB间隔,打开、关闭raw设备。每个HB间隔,执行raw设备的打开、读入、写入、关闭。
  • 绑定检查

    • 打开
      确认用于磁盘心跳的raw设备是否在其他实际磁盘中绑定。如已被绑定到用于磁盘心跳之外的实际磁盘,则无法执行绑定。如果没有被绑定,则磁盘心跳资源的状态为离线状态。
    • 关闭
      对于用于磁盘心跳的raw设备是否在其他实际磁盘中被绑定不做确认。如被绑定,则解除该绑定状态,在用于磁盘心跳的实际磁盘中进行绑定。

3.11.3. NP解决标签页

进行网络分区I/F的设置更改。在[NP解决列表]内显示EXPRESSCLUSTER中使用的网络分区解决资源I/F。

追加

追加网络分区解决I/F。点击PingTarget列的空格设定IP地址。点击各Server列的空格设定[使用] [不使用] 。

删除

删除网络分区解决I/F。选择想要删除的网络分区解决I/F列,点击 [删除] ,就会删除掉选择的网络分区解决I/F。

属性

表示Ping NP的属性画面。

调整

表示调整网络解决属性的画面。

种类

设定网络分区解决IF的种类。能够使用的种类有「Ping」。

Ping对象

设定Ping 对象。

服务器名

选择「使用」、「不使用」的任意一个。

Ping NP的属性

  • 添加组列表

    • 添加组。

    • 组的最大登录数是16个。

    • 1个组内登录了复数个IP地址时,如果所有的IP地址不返回Ping命令的响应的状态持续一段时间后,就不能进行NP解决处理(只要有1个IP地址返回Ping命令的响应,就可以进行NP解决)。此外,登录了复数个组时,如果任何一个组都不返回Ping命令的响应的状态持续的话,就不能进行NP解决处理(所有的组返回Ping命令的响应时,才可进行NP解决)。

  • 删除组列表

    • 删除选择的组列表。

    • 添加IP地址列表

    • 向选择的组添加IP地址。

  • IP地址的最大登录数是16个。

    • 一个Ping NP内可以最多登录256个IP地址,其中只有16种IP地址能够登录。(可以多次使用相同的IP地址)

  • 删除IP地址列表

    • 从列表中删除选择的IP地址。

  • 编辑

    • 编辑选择的IP地址。

  • 间隔

    • 设定间隔。

  • 超时

    • 设定超时。

  • 重试次数

    • 设定重试次数。

  • 缺省值

    • 将间隔、超时、重试次数的设置恢复成缺省值。并且,间隔、重试次数的指定数值必须满足以下的条件表达式。不满足时,就不能正常执行NP的解决处理。

    条件表达式) 心跳超时
    > (PingNP间隔×PingNP重试次数)+PingNP超时
    

调整Ping NP

  • NP发生时动作

    • 停止集群服务
      停止网络分区状态的服务器的集群服务。
    • 停止集群服务并关闭操作系统
      停止网络分区状态的服务器的集群服务,OS关机。
    • 停止集群服务并重启操作系统
      停止网络分区状态的服务器的集群服务,OS重启。
    • Sysrq Panic
      在网络分区状态的服务器上进行sysrq的panic处理。
    • Keepalive Reset
      在网络分区状态的服务器上使用clpkhb驱动程序、clpka驱动程序,进行OS复位。
    • Keepalive Panic
      在网络分区状态的服务器上使用clpkhb驱动程序、clpka驱动程序,进行OS的panic处理。
    • BMC Reset
      在网络分区状态的服务器上使用ipmi命令,对服务器进行硬件重置。
    • BMC Power Off
      在网络分区状态的服务器上使用ipmi命令,关闭OS的电源。也有可能通过OS的 ACPI的设置执行OS关机。
    • BMC Power Cycle
      在网络分区状态的服务器上使用ipmi命令,对服务器电源进行循环(电源关闭/开启)。也有可能通过OS的 ACPI的设置执行OS关机。
    • BMC NMI
      在网络分区状态的服务器上使用ipmi命令,在服务器中触发NMI。NMI发生后的操作取决于OS的设置。
    • I/O Fencing(High-End Server Option)
      那个不能被使用。
  • 默认值

    • 将NP发生时动作恢复到默认值。

3.11.4. 超时标签页

设置超时等值。

同步等待时间 (0~99)

服务器启动时等待其他服务器启动的时间。

心跳线

心跳间隔及心跳超时。

  • 间隔(1~99)
    心跳间隔。
  • 超时(2~9999)
    心跳超时。如果在此处设置的时间内持续无应答,则视为服务器宕机。
  • 需要大于间隔的值。

  • 关机监视(参考第"3.11.8. 监视标签页")时,包含应用程序在内,需要设为比OS关机时间长的时间。

  • 如果使用共享型镜像磁盘资源,该值需要大于[Mirror Agent]标签页"的集群分区I/O超时值。

内部通信超时 (1~9999)

在执行EXPRESSCLUSTER的命令,WebManager上的操作,显示画面时等等,所执行的EXPRESSCLUSTER服务器的内部通信中使用的超时值。

默认值

用户返回到默认值。若点击[默认值],则所有项目都设为默认值。

3.11.5. 端口号标签页

设置TCP端口号、UDP端口号。

TCP

TCP的各端口号不能重复。若使用Replicator,则端口号[(镜像)]标签页的TCP的各端口号与所有的镜像磁盘资源、共享型镜像磁盘资源的镜像数据端口号也不能重复。

  • 内部通信端口号 (1~65535 7)
    内部通信所使用的端口号。
  • 数据传送端口号(1~65535 7)
    事务(集群配置信息反映/备份、License信息的收发、命令执行)所使用的端口号。
  • Webmanager管理器 HTTP 端口号(1~65535 7)
    浏览器与EXPRESSCLUSTER服务器通信时使用的端口号。

UDP

UDP的各端口号不能重复。若[端口号(日志)]标签页中的日志通信方法为UDP,则也不能与该端口号重复。

  • 心跳端口号(1~65535 7)
    用于心跳的端口号。
  • 内核模式心跳端口号(1~65535 7)
    用于内核模式心跳的端口号。
  • Alert同步端口号(1~65535 7)
    服务器间同步警报消息时使用的端口号。

默认值

用于返回到默认值。若点击[默认值],则所有的项目都设为默认值。

3.11.6. 端口号(镜像)标签页 -使用Replicator/Replicator DR时-

设置TCP端口号。

TCP

TCP的各端口号不能重复。端口号标签页的TCP的各端口号与所有的镜像磁盘资源、共享型镜像磁盘资源的镜像数据端口号也不能重复。

注解

不使用镜像磁盘资源和共享型镜像磁盘资源时,不可以使用端口号。

  • 镜像Agent端口号(1~65535 7)
    镜像Agent是指控制镜像磁盘资源和共享型镜像磁盘资源的用户模式模块。
    镜像Agent端口号为镜像Agent在进行服务器间的通信时所使用的端口号。
7(1,2,3,4,5,6,7)

不推荐使用Well-known端口,特别是1~1023的预约端口。

默认值

用于返回到默认值。点击[默认值],则所有的项目都设为默认值。

3.11.7. 端口号(日志)标签页

设置日志的通信方法。

日志的通信方式

  • UDP
    日志的通信方法使用UDP。
  • UNIX 域
    日志的通信方法使用UNIX域。
  • 消息队列
    日志的通信方法使用消息队列。

端口号 (1~65535)

日志的通信方法选择了UDP时使用的端口号。不能与端口号标签页的UDP的各端口号重复。

默认值

用于返回到默认值。点击[默认值],则所有的项目都设为默认值。

3.11.8. 监视标签页

设置监视相关的项目。关于关机监视、重启限制的详细信息,请参考《参考指南》的"监视资源的详细信息"。

关机监视

在通过EXPRESSCLUSTER的命令执行了集群关机或服务器关机时,监视OS是否停止。
若集群服务判断OS停止,则强行复位,或者做应急措施。服务器的应急措施只有在监视方法keepalive时才能进行设定。
  • 始终执行
    进行关机监视。包含应用程序在内,心跳超时(参考"3.11.4. 超时标签页")需要设为比OS关机时间长的时间。若使用共享磁盘或镜像磁盘,则推荐选择[开]。
  • 只在组非活性处理失败时执行
    仅在组的非激活处理失败时,进行关机监视。包含应用程序在内,心跳超时 (参考"3.11.4. 超时标签页"),需要设为比OS关机时间长的时间。
  • 不执行
    不进行关机监视。
    • 监视方法
      从下列参数中选择进行关机监视时的监视方法。
      • softdog

      • ipmi

      • ipmi (High-End Server Option)

      • keepalive

      关于设置监视方法的详细信息,请参考《参考指南》的"其他设置信息"-"关机监视"-"关机监视的方法"。

    • 超时发生时的动作
      在下述两种方法中选择当判断OS 停止时的动作。只有在监视方法选择为keepalive才可以设定。
      • RESET
        服务器复位。
      • PANIC
        对服务器作应急措施。
  • 将SIGTERM置为有效
    设置进行关机监视时是否将SIGTERM设为有效。
    关于设置SIGTERM的详细信息,请参考《参考指南》的"其他设置信息"-"关机监视"-"SIGTERM设置"。

    注解

    如果在[监视方法]中选择了ipmi,撤消了[将SIGTERM置为有效]的选中状态,则即使OS关机正常结束,也不会复位。

  • 使用心跳超时
    使关机监视的超时值与心跳超时值结合使用。
  • 设置超时(2~9999)
    如果不将心跳超时值用作关机监视的超时值,则指定超时值。
    由查出服务器宕机引发的失效切换发生时为了避免双活性,需要设定比心跳超时值小的值。

系统资源

设置系统资源信息的收集/不收集。

为提高运行性能,定期收集系统资源信息。系统资源信息有助于调查EXPRESSCLUSTER的动作状态,尤其易于查出因系统资源不足而引起的故障原因。

  • 选中复选框
    在集群运行中,定期收集CPU内存、进程等系统资源信息。
    收集的系统资源信息通过收集clplogcc命令或Webmanager日志来收集。
    通过clplogcc命令收集日志时,指定为Type2;通过Webmanager日志时,指定为方式2。收集日志的详细描述请参照本指南的"WebManager的功能"的"使用WebManager收集日志"、《参考指南》的"EXPRESSCLUSTER命令参考"的"收集日志(clplogcc命令)"。
    虽然依赖于进程启动数等系统运行状况,但保存资源信息需要450MB以上的磁盘区域。
  • 不选中复选框
    不收集系统资源信息。

3.11.9. 复归标签页

进行集群复原相关设置。

集群服务进程异常时的动作

指定集群服务进程异常时的动作。

  • 关闭OS
    关闭操作系统(OS)。
  • 重启OS
    重启OS。
  • sysrq panic
    在发生宕机的服务器上进行sysrq的panic处理。
  • keepalive reset
    在发生宕机的服务器上使用clpkhb驱动程序、clpka驱动程序,进行OS复位。
  • keepalive panic
    在发生宕机的服务器上使用clpkhb驱动程序、clpka驱动程序,进行OS的panic处理。
  • BMC reset
    在发生宕机的服务器上使用ipmi的命令,对服务器进行硬件重置。
  • BMC断电
    在发生宕机的服务器上使用ipmi的命令,关闭OS的电源。也有可能通过OS的 ACPI的设置执行OS关机。
  • BMC Power Cycle
    在发生宕机的服务器上使用ipmi的命令,对服务器电源进行循环(电源关闭/开启)。也有可能通过OS的 ACPI的设置执行OS关机。
  • BMC NMI
    在发生宕机的服务器上使用ipmi的命令,在服务器中触发NMI。NMI发生后的操作取决于OS的设置。
  • I/O Fencing(High-End Server Option)
    那个不能被使用。

HA进程异常时工作

  • 进程启动重试次数 (0~99)
    指定HA进程异常时的重启动次数。
  • 重试超时的动作
    指定HA进程异常中动作。
    • 不进行任何操作
      • 停止集群服务
        停止集群服务。
      • 停止集群服务和关闭OS
        停止集群服务、关闭OS。
      • 停止集群服务和重启动OS
        停止集群服务、重启动OS。

注解

HA进程是在系统监视资源或JVM监视资源、系统资源信息收集功能中使用的进程。

抑制监视资源异常时的复归动作

  • 选中复选框
    可控制由于监视资源的异常检测而产生的复归动作。
  • 不选中复选框
    不能控制由于监视资源的异常检测而产生的复归动作。

注解

消息接收监视资源不是由监视资源的异常检测而产生的复归动作的抑制对象。

发生组资源的激活/非激活失控时的动作

指定组资源的激活/非激活发生宕机时的动作。

  • 停止集群服务和OS关机
    停止发生宕机的服务器的集群服务,OS关机。
  • 停止集群服务和OS重启
    停止发生宕机的服务器的集群服务,OS重启。
  • Sysrq Panic
    在发生宕机的服务器上进行sysrq的panic处理。
  • Keepalive Reset
    在发生宕机的服务器上使用clpkhb驱动程序、clpka驱动程序,进行OS复位。
  • Keepalive Panic
    在发生宕机的服务器上使用clpkhb驱动程序、clpka驱动程序,进行OS的panic处理。
  • BMC reset
    在发生宕机的服务器上使用ipmi的命令,对服务器进行硬件重置。
  • BMC Power Off
    在发生宕机的服务器上使用ipmi的命令,关闭OS的电源。也有可能通过OS的 ACPI的设置执行OS关机。
  • BMC Power Cycle
    在发生宕机的服务器上使用ipmi的命令,对服务器电源进行循环(电源关闭/开启)。也有可能通过OS的 ACPI的设置执行OS关机。
  • BMC NMI
    在发生宕机的服务器上使用ipmi的命令,在服务器中触发NMI。NMI发生后的操作取决于OS的设置。
  • I/O Fencing(High-End Server Option)
    那个不能被使用。
  • 不进行任何操作(作为激活/非激活异常来处理)
    进行检测出组资源的激活/非激活异常时的复归动作。有关复归动作的详情,请参阅《参考指南》的"组资源的详细信息"的"资源的属性"的"复归操作标签页"。

注解

指定为「不进行任何操作(作为激活/非激活异常来处理)」,在发生宕机时,对组资源的影响变为不确定,因此不建议将设定更改为「不进行任何操作(作为激活/非激活异常来处理)」。
指定为「不进行任何操作(作为激活/非激活异常来处理)」时,检测出组资源的激活/非激活异常时的复归动作的设定如下所示。
  • 激活/非激活重试次数 : 0次

  • 失效切换次数 : 0次

  • 最终动作 : 伴随OS停止的动作

抑制异常检出时操作系统停止执行的最终动作

点击[详细设置],设置随异常检测而OS停止时的最终动作控制。
  • 激活组资源查出异常时:
    查出组资源激活异常时的最终动作设置为随OS停止而发生的情况下,其他服务器全部停止状态中差出激活异常时控制最终动作。
  • 非激活组资源查出异常时:
    查出组资源非激活异常时的最终动设置为随OS停止而发生的情况下,其他服务器全部停止状态中查出非激活异常时控制最终动作。
  • 监视资源查出异常时:
    查出监视资源异常时的最终动作设置为随OS停止而发生的情况下,其他服务器全部停止状态中查出异常时控制最终动作。

注解

  • 多台服务器几乎同时查出异常、执行最终动作的情况下,即使设定为在查出监视资源异常时控制最终动作,也有可能随OS停止而执行最终动作。

  • 消息接收监视资源不属于查出异常时控制操作的对象。

因查出组资源激活/非激活时的最终动作、或者查出监视资源异常时的最终动作,而使 OS停止会发生如下情况。

  • 集群服务停止和OS关机

  • 集群服务停止和OS重启

  • sysrq错误

  • keepalive复位

  • keepalive错误

  • BMC复位

  • BMC断电

  • BMC断电

  • BMC NMI

抑制检测出双活性时的关闭

点击[详细设置],查出双激活时控制所有服务器关闭。

检出双活性时不关闭的服务器组

选择一个服务器组。查出失效切换组的双激活时,抑制属于所选的服务器组的服务器关机。所选的服务器组内的服务器间查出双激活时,两个服务器都关机。在这样的情况下想要抑制服务器关机时,请设置下面的检出双活性时不关闭的服务器。

检出双活性时不关闭的服务器

选择一台服务器。查出失效切换组的双激活时,控制选用服务器关机。
设置了检出双活性时不关闭的服务器组时,只能选择属于已经设定了的服务器组的服务器。没有设置时,可以选择全部服务器。

注解

双激活发生时,组、资源的状态在服务器间变得不一致,随后可能出现失效切换或故障恢复失败。

在不一致发生的状态下,将输出以下alert日志。需实施以下三个方案的任何一个以解除这种状态:1,组的重启。2,集群重启(cluster reboot)或没有启动组的所有服务器的重启。3,对未启动组的所有服务器进行群集服务重启。

类型 : 警告
模块名 : rc
事件ID : 503
消息 : 服务器之间产生组%1状态的不匹配。

3.11.10. Alert服务标签页

设置邮件通告功能、网络警告灯、警报通报接收方和SNMP Trap发送。
使用邮件通告功能时,请登录Alert Service的License。
使用网络警告灯时,请登录Alert Service的License。

注解

要使用邮件通告功能、网络警告灯,请购买EXPRESSCLUSTER X Alert Service 4.0 for Linux。

使Alert通报设置生效

设置是否将警报通告目的地从默认设置更改为其他设置。如果要更改,请点击[编辑]并设置输出目的地。
如果不选中此处的复选框,则可将更改后的输出目的地暂时恢复到默认值。
关于默认通报目的地,请参考《参考指南》的"错误消息一览表"的"syslog、警告、邮件通告消息、SNMP Trap消息"。

邮件地址 (255字节以内)

输入通告目标邮件地址。如果要设置多个邮件地址,请用分号分隔邮件地址。

主题 (127字节以内)

请输入邮件名。

邮件发送方法

设置邮件发送方法。

  • MAIL
    使用mail命令。请事先确认通过mail命令能够向邮件地址发送邮件。
  • SMTP
    直接与SMTP服务器通信并发送邮件。

设置发送地址

设置SNMP Trap发送功能。如果要设置SNMP Trap的发送地址时,点击[设置]进行发送地址的设置。

将日志级别输出到syslog

在EXPRESSCLUSTER运行时输出的syslog的消息中添加级别。

使用机箱ID指示灯

设置是否使用机箱ID指示灯联动功能。

使用网络警告灯

设置是否使用网络控制的警告灯(本公司指定产品)。在服务器属性中输入IP地址。

更改警报发送地址

点击[编辑]按钮,显示更改警报发送地址的对话框。

添加

追加要定制通报接收方的模块类型和事件ID。点击[添加]按钮后,显示消息输入对话框。

分类

选择模块类型的大分类。

模块类型 (31字节以内)

选择要更改发送地址的模块类型名。

事件ID

输入要更改发送地址的模块类型的事件ID。关于事件ID,请参考《参考指南》的"错误消息一览表"的"syslog、警告、邮件通告消息、SNMP Trap消息"。

发送地址

选择通报接收方。

  • System Log
    发送到OS的syslog。
  • WebManager Alertlog
    发送到WebManager的警报视图。
  • Mail Report
    通过邮件通报功能发送。
  • Alert Extension
    使用警报扩展功能。点击[添加]和[编辑],可以对扩展进行设置或者更改。
  • SNMP Trap
    使用SNMP Trap发送功能来送信。

添加

追加警报扩展功能的命令。点击[添加]后,显示输入命令的对话框。针对1个事件ID,最多可以输入4个命令。

命令 (511字节以内)

输入SNMP trap等执行通报的命令。请指定绝对路径。不能浏览指定的命令的执行结果。

  • 关于关键词
    指定%%MSG%%后,将插入相应的事件ID的消息正文。
    对于1个命令,不能够使用多个%%MSG%%。
    设置时,包括%%MSG%%的内容在内,长度需要控制在511个字节内。此外,%%MSG%% 中有时会含有空格字符,因此指定为命令的参数时,请指定"%%MSG%%"。

设置示例:

/usr/local/bin/snmptrap -v1 -c HOME 10.0.0.2 0 10.0.0.1 1 0 '' 1 s "%%MSG%%"

删除

删除警报扩展功能的命令时使用。选择命令后,请点击[删除]。

编辑

编辑警报扩展功能的命令时使用。请选择命令,点击[编辑]。

SMTP设置

点击[SMTP设置]后,显示[SMTP设置]对话框。

邮件发送文书的字符编码 (127字节以内)

设置通过邮件通报时发送邮件的字符编码。

通信应答的等候时间 (1~999)

设置与SMTP服务器之间的通信超时。

主题的编码

设置是否对邮件主题进行编码。

SMTP服务器列表

显示已经设置的SMTP服务器。该版本中可以设置的SMTP服务器为4台。

添加

添加SMTP服务器。点击该按钮后,显示SMTP的输入对话框。

删除

用于删除SMTP服务器的设定。

编辑

用于变更SMTP服务器的设定。

SMTP服务器 (255字节以内)

设置SMTP服务器的IP地址或者主机名。

SMTP端口号 (1~65535)

设置SMTP服务器的端口编号。

发信人邮件地址 (255字节以内)

设置邮件通报发送的邮件的发送方地址。

SMTP认证有效

设置是否将进行SMTP认证。

认证方式

选择SMTP认证方式。

用户名 (255字节以内)

设置SMTP认证使用的用户名。

密码 (255字节以内)

设置SMTP认证使用的密码。

发送地址一览

显示设定的SNMP Trap发送地址。本版本中可设定的SNMP Trap发送地址最多为32件。

添加

添加SNMP Trap发送地址。点击[添加],显示发送地址的输入对话框。

删除

删除SNMP Trap发送地址的设置时使用。

编辑

改变SNMP Trap发送地址的设置时使用。

发送地址服务器 (255 字节以内)

设置SNMP Trap发送目的地的服务器名。

SNMP 端口号 (1-65535)

设置SNMP Trap发送目的地的端口号。

SNMP版本

设置SNMP Trap发送目的地的SNMP版本。

SNMP团体名 (255字节以内)

设置SNMP Trap发送目的地的SNMP Community名

3.11.11. Web管理器标签页

设置Web管理器。

使WebManager服务有效

将WebManager服务设为有效。

  • 选中复选框
    将WebManager服务设为有效。
  • 不选中复选框
    将WebManager服务设为无效。

加密设置

设置WebManager服务的加密。
选择[加密设置],则显示[加密设置]对话框。

通信方式

  • HTTP
    与客户端的通信不使用加密。
  • HTTPS
    与客户端的通信使用加密。

证书文件

设置与客户端通信时使用的服务器证书文件。服务器证书文件需要单独准备。

私钥文件

设置与客户端通信时使用的私钥文件。私钥文件需要单独准备。

SSL链接库

设置加密用的SSL链接库。请指定OpenSSL所提供的SSL链接库。请根据安装目录等环境不同而设定。

Crypto链接库

设置加密用的Crypto链接库。请指定OpenSSL所提同的Crypto链接库。请根据安装目录等环境不同而设定。

注解

OpenSSL是HTTPS所必需的。

可连接的客户端台数 (1~999)

可从客户端设定同时请求数量。发生超出本设定的同时请求时,请求会被废除。

由密码来控制连接

选择[设置]按钮,则显示WebManager用密码对话框。

WebManager

  • 操作用密码
    在WebManager中设置操作模式、设置模式和验证模式下用于连接的密码。
    点击[更改]按钮则显示[更改密码]对话框。
  • 参照用密码
    在WebManager中设置参照模式下用于连接的密码。
    点击[更改]按钮则显示[更改密码]对话框。
  • 旧密码(255字节以内)
    输入更改前的密码。
    如果未设置旧密码,则不输入。
  • 新密码(255字节以内)
    输入新密码。
    如果要删除密码,则不输入。
  • 密码输入的确认(255字节以内)
    再次输入新密码。
    密码可使用1字节的英文大写字母、小写字母、数字、符号、空格(ASCII 编码的 0x20 至 0x7E )。

通过客户端IP地址控制连接

通过客户端IP地址控制连接。

  • 选中复选框
    [添加]、[删除]、[编辑]变为有效。
  • 不选中复选框
    [添加]、[删除]、[编辑]变为无效。

添加

用于在[通过客户端IP地址控制连接]中添加IP地址。点击[添加]按钮,则显示IP地址的输入对话框。新添加的IP地址拥有操作权。
  • IP地址(80字节以内)
    输入允许连接的客户端IP地址。
    • IP地址时的示例 : 10.0.0.21

    • 网络地址时的示例 : 10.0.1.0/24

删除

用于从[通过客户端IP地址控制连接]中删除IP地址。请选择要从[客户端IP地址限制连接列表]删除的IP地址,点击[删除]。

编辑

用于编辑IP地址。在[通过客户端IP地址控制连接]中选择要编辑的IP地址,点击[编辑]。显示输入了所选IP地址的IP地址的输入对话框。已编辑的IP地址的操作权不变。

注解

允许该连接的客户端IP地址也用于限制基于clprexec的外部操作连接。

操作权

对[通过客户端IP地址控制连接]中登录的IP地址设置操作权。

  • 选中复选框
    客户端可进行集群的操作和状态显示。
  • 不选中复选框
    客户端仅能显示集群状态。

连接用IP地址

点击[设置],会显示统合WebManager用的IP地址对话框。
  • 添加
    添加统合WebManager用IP地址。点击各个服务器列的单元格选择或输入IP地址,设置各个服务器的IP地址。如果部分服务器不连接通信线路,请清空不连接服务器的单元格。
  • 删除
    删除通信线路。选中想要删除的通信线路点击 [删除],选中的线路会被删除。
  • 向上、向下
    当设置多个迁移WebManager用IP地址时,[优先级]列的数字小的通信线路在集群服务器间的内部通信中被优先使用。更改优先级的时候,点击[向上] [向下],更改选中行的顺序。

调整

用于调整Web管理器。点击[调整]则显示[Web管理器调整属性]对话框。
  • 客户端会话超时(1~999)
    从WebManager服务器不再与WebManager进行通信以后的超时时间。
  • Alert视图最大记录数 (1~999)
    WebManager的警报视图中显示的最大Record数。
  • 画面数据更新间隔 (0~999)
    更新WebManager画面数据的间隔。
  • 镜像Agent超时 (1~999)
    设置从镜像Agent等待数据的超时时间。
  • 客户端数据更新方法
    WebManager画面数据的更新方法可以选择下述两种。
    • Polling
      画面数据定期更新。
    • RealTime
      画面数据实时更新。
  • 日志文件的有效期限 (60~43200)
    是指在服务器上临时保存的日志收集信息到删除为止的有效期限。日志收集信息的保存对话框显示后,若不执行保存,过了有效期限,则服务器上的日志收集信息被删除。
  • 使用时刻信息显示功能。
    设定时刻信息显示功能有效/无效。
    • 选中复选框
      时刻信息显示功能有效。
    • 不选中复选框
      时刻信息显示功能无效。
  • 默认值
    用于返回到默认值。点击[默认值],则所有的项目都设为默认值。

3.11.12. Alert日志标签页

设置警报日志。

使Alert 服务有效

设置是否启动服务器的警报服务。

  • 选中复选框
    将警报服务设为有效。
  • 不选中复选框
    将警报服务设为无效。

保存最大Alert记录数(1~99999)

服务器的警报服务可保存的最大警报消息数。

Alert同步: 方法

同步警报日志时的通信方法。该版本中[方法]框中仅有unicast。

Alert同步: 通信超时 (1~300)

警报服务进行服务器间通信时的通信超时时间。

默认值

用于返回到默认值。点击[默认值],则所有的项目都设为默认值。

3.11.13. 延迟警告标签页

设置延迟警告。关于延迟警告的详细信息,请参考《参考指南》的"监视资源的详细信息"-"何谓监视资源?"-"监视资源延迟警告"。

心跳延迟警告 (0~100)

设置心跳延迟警告的比例。如果在此处指定的心跳超时时间的比例所示的时间内没有心跳的应答,则警报日志中显示警告。如果设为100则不显示警告。

监视器延迟警告 (0~100)

设置监视器的延迟警告的比例。如果在此处指定的监视器超时时间的比例所示的时间内没有监视器的应答,则在警报日志中显示警告。如果设为100则不显示警告。

注解

如果延迟警告中指定0%,则以心跳间隔、监视器间隔为单位分别显示警报日志。
在警报日志中可以确认监视所花费的时间,因此在测试运行等时候如果要确认监视时间,则设为0%。
在实际环境中请不要设置0%等较低的数值。

3.11.14. 镜像Agent标签页 -使用Replicator/Replicator DR时-

设置镜像Agent。

自动镜像复归

如果两台服务器间的镜像磁盘数据出现不匹配,则自动进行镜像复归。即使选中复选框,也可能无法自动进行镜像复归。详细信息请参考《参考指南》的"疑难解答"-"发生障碍时的步骤"-"自动复原镜像"。

  • 选中复选框
    自动进行镜像复归。
  • 不选中复选框
    不自动进行镜像复归。

收集统计信息

收集并参考有关镜像功能德各种信息。详细信息请参考《维护指南》的"维护信息"的"镜像统计信息采集功能"。

  • 选中复选框
    收集统计信息。
  • 不选中复选框
    不收集统计信息。

接收超时 (1~600)

设置连接镜像Agent后等待数据的超时。

发送超时 (1~600)

设置镜像Agent向对方服务器的镜像Agent发送数据后等待处理的超时。

复归数据的大小 (64~32768)

输入镜像复归的处理单位。

同步启动等待时间 (10~600)

使用共享型镜像磁盘资源时,镜像Agent会等待连接共享磁盘的所有服务器的起动。设定该最大等待时间。如果在设定的时间内其它的服务器没有起动,已经起动的服务器会临时取得共享型镜像磁盘资源的当前权。

集群分区I/O超时 (5~300)

使用共享型镜像磁盘资源时,设置集群分区访问的超时值。

  • 需要设置为小于"Timeout"标签页中的心跳超时的值。

复归次数的限制

在镜像复归中发生数据更新时,指定重新执行镜像复归的重试次数。

  • 开 (1~100)
    按照指定的次数重试。
  • 关闭
    如果发生更新数据,在没有差分之前一直进行镜像恢复。

默认值

用于返回到默认值。点击[默认值],则所有的项目都设为默认值。

3.11.15. 镜像驱动标签页 -使用Replicator/Replicator DR时-

设置镜像驱动程序。

请求队列最大数 (2048~65535)

设置镜像磁盘驱动程序对来自上层的I/O请求进行排列时的队列数。

差分Bitmap大小(1~5)

设置差分Bitmap领域的长度。只在集群里没有镜像磁盘资源和共享型镜像磁盘资源时可以更改。

Bitmap更新间隔 (1~600)

设置待机服务器是否进行差异Bitmap的写入的确认间隔。

查出I/O错误时的动作

  • 集群分区
    设定集群分区上的I/O错误发生时的动作。
  • 数据分区
    设定数据分区上的I/O错误发生时的动作。

默认值

用于返回到默认值。点击[默认值],则所有的项目都设为默认值。

3.11.16. JVM监视标签页

设置JVM监视中使用的详细参数。

注解

通过在线版Builder显示JVM监视标签页时,需在Java Resource Agent资源的License登陆状态下,执行【文件】菜单中的【更新服务器信息】。

Java安装路径 (1023字节以内)

设置JVM监视中使用的Java VM的安装路径。请一定指定为绝对路径和ASCII文字。末尾不要添加"/"。在集群内的服务器中属于共通设定。指定例:/usr/java/ jdk-9

最大Java堆内存大小 (7~4096)

JVM监视中使用的Java VM的最大堆大小使用兆字节来设定(相当于Java VM启动时的参数-Xmx)。在集群内的服务器中属于共通设定。

Java VM追加选项(1024字节以内)

设定JVM监控所使用的Java VM启动时选项。但请在[最大Java堆大小]中指定-Xmx。该指定是在集群内的服务器中的共同设定。指定示例:-XX:+UseSerialGC

日志输出设定

点击[设置]按钮后,显示输入命令的对话框。

资源测量设置

按压[设置]按钮,显示输入资源测量设置的对话框。

连接设置

按压[设置]按钮,显示输入连接设置的对话框。

负载均衡联动设置

选择负载均衡器类型,点击[设置]按钮,显示输入负载均衡连动设置的对话框。
从列表中选择负载均衡器类型。负载均衡器联动时,选择使用中的负载均衡器。负载均衡器不联动时,选择[不联动]。

指令超时 (30~300)

在JVM监控的各个画面中设定所指定的[指令]的超时值。该设定将成为[指令]的共同设定。

日志输出设置

按压[设置]按钮时,会显示输入日志输出设置的对话框。

日志级别

选择JVM监视输出的日志的日志级别。

保有的世代数 (2~100)

对JVM监视输出的日志,进行保持版本数的设置。[轮循方式]中指定[时间]时,因为执行了集群挂起就重置轮循次数,所以请注意每次挂起 <EXPRESSCLUSTER安装路径>\log\ha\jra 下的日志文件都会增加。

轮循方式

选择JVM监视输出的日志的Rotation方式。根据文件大小进行Rotation时,将JVM运用日志等每一个日志文件的最大容量设置为千字节(范围为200~2097151)。根据时间进行Rotation时,则将日志Rotation的开始时刻设置为"hh:mm"形式(hh:指定为0~23小时、mm:指定为0~59分),将Rotation间隔设置为小时(范围为1~8784)。

默认值

将日志级别、保有的世代数和轮循方式设置为返回默认值。

资源监测设置[共通]

按压[设置]按钮,显示输入资源监测设置的对话框。关于JVM监视如何判断异常的构造,请参考《参考指南》的"监视资源的详细信息"。

重试次数 (1~1440)

设置JVM中的资源监测失败时资源监测的重试次数。

异常判定次数 (1~10)

当JVM中通过资源监测获得的Java VM、应用程序服务器的资源使用量连续超出客户定义的限度值时,判断为异常的设置次数。

间隔 内存使用量・动作线程数 (15~600)

设置JVM中的监测储存器使用量和工作线程数之间的间隔。

间隔 Full GC发生次数・执行时间 (15~600)

设置JVM中的监测Full GC发生次数和发生时间之间的间隔。

默认值

将重试次数、异常判断限度值和间隔的设置返回默认值。

资源监测设置[WebLogic]

按压[设置]按钮,显示输入资源监测设置的对话框。关于JVM监视如何判断异常的构造,请参考《参考指南》的"监视资源的详细信息"。

重试次数 (1~5)

设置JVM中的资源监测失败时资源监测的重试次数。

异常判定次数 (1~10)

当JVM中通过资源监测获得的Java VM、应用程序服务器的资源使用量连续超出客户定义的限度值时,判断为异常的设置次数。

间隔 要求数 (15~600)

设置JVM中的WebLogic监视中监测工作管理器和线程Poor的要求数之间的间隔。

间隔 平均值 (15~600)

设置JVM中的WebLogic监视中监测工作管理器和线程Poor的要求数平均值之间的间隔。请将此数值设置为间隔 要求数中设定数值的整数倍数。

默认值

将重试次数、异常判断限度值和间隔的设置返回默认值。

连接设置

按压[设置]按钮,显示连接监视目标的Java VM的设置输入对话框。

管理端口号 (10000~65535)

设置JVM监视内部使用的端口号。不要覆盖其他端口号。在集群内的服务器中属于共通设定。不推荐使用42424~61000号。

重试次数 (1~5)

设置连接监视对象的Java VM失败时的重试次数。

到再次连接为止的等待时间 (15~60)

设置连接监视对象的Java VM失败时,到下一次连接前的间隔时间。

默认值

将管理端口号、重试次数、下一次连接前的等待时间的设置返回默认值。

负载均衡器联动设定

负载均衡器类型选择[BIG-IP LTM]以外后,点击[设置]按钮,显示输入负载均衡器联动设置的对话框。

负载均衡器联动的管理端口号 (10000~65535)

设置负载均衡器联动功能中使用的端口号。在集群内的服务器中属于共通设定。不推荐使用42424~61000号。

存活侦测(Health Check)功能联合

设置监视对象的Java VM检测出障碍时,是否使用负载均衡器的Health Check功能。

HTML文件保存目录 (1023字节以内)

设置使用负载均衡器的Help Check功能的HTML文件的保存目录。请一定指定使用绝对路径和ASCII文字。末尾不要添加"/"。

HTML文件名 (255字节以内)

设置使用负载均衡器的Help Check功能的HTML文件名。请指定使用ASCII文字。

HTML重命名文件名 (255字节以内)

设置使用负载均衡器的Help Check功能的HTML重命名文件名。请指定使用ASCII文字。请指定与[HTML文件名]不同的文件名。

重命名重试次数 (0~5)

设置HTML文件的重命名失败时的重试次数。

到重试的等待时间 (1~60)

设置HTML文件的重命名失败时,到下一次重试前之间的间隔。

默认值

将负载均衡器联动管理端口号、与Help Check功能联动、HTML保存目录、HTML文件名、HTML重命名文件名、重命名失败时的下一次重试次数、重试前的等待时间的设置返回默认值。

负载均衡器联动设定

负载均衡器类型选择[BIG-IP LTM]后,按[设置]按钮,则显示负载均衡器联动设定输入的对话框。

负载均衡器联动的管理端口号 (10000~65535)

设定负载均衡器联动功能所使用的端口号。在集群内的服务器中,共享设定。不建议42424~61000端口。

mgmt IP地址

设定BIG-IP LTM的IP地址。

用户名(255字节以内)

设定BIG-IP LTM管理用户名。

密码(255字节以内)

设置BIG-IP LTM管理用户密码。

通信端口号 (10000~65535)

设定与BIG-IP LTM通信的端口号。

添加

添加均衡节点的服务器名和IP地址。设置服务器名与hostname命令的输出结果同值、设置IP地址与BIG-IP Configration Utility的[LocalTrafic]-[Pools:PoolList]-[对应pool]-[Members]的Members同值。更改时,选择要更改的行,进行直接编辑。

删除

删除均衡节点的服务器名和IP地址。选择要删除的行后,点击[删除],则选中的服务器将被删除。

默认值

负载均衡器联动管理端口号、管理用户名、通信端口号返回默认值设定。

3.11.17. Oracle Clusterware联动标签页

那个不能被使用。

3.11.18. 扩展标签页

设定其他的集群机能。

再启动限制

设置了OS重启作为组资源和监视资源查出异常时的最终运行时,可能会永远反复重启。通过设置重启次数,可限制反复重启。

  • 最大再启动次数 (0~99)
    设置重启的限制次数。此处指定的次数在组资源、监视资源中分别计算。
  • 重置最大再启动次数的时间 (0~99)
    如果指定了最大重启次数,则当正常运行持续此处指定的时间,则复位这之前的重启次数。此处指定的时间在组资源、监视资源中分别计算。

    注解

    如果[重置最大再启动次数的时间]设为0,则不会重置再启动次数。重置再启动次数时,请使用[clpregctrl]命令。

使用强制停止功能

设置使用强行停止功能。

  • 选中复选框时
    使用强行停止功能。
    在使用强行停止功能时,请同时对服务器属性的BMC标签页进行设置。虚拟机(Guest OS)时,请设置服务器属性的[信息]标签页的[虚拟机]部分。
  • 没有选中复选框时
    不使用强行停止功能。

强制停止操作

指定强行停止的动作。

  • BMC Reset
    使用[ipmitool]命令,对服务器进行硬件重置。
  • BMC Power off
    使用[ipmitool]命令,切断服务器的电源。也有可能通过OS的 ACPI的设置执行OS关机。
  • BMC Power Cycle
    使用[ipmitool]命令,对服务器电源进行循环(电源关闭/开启)。也有可能通过OS的 ACPI的设置执行OS关机。
  • BMC NMI
    使用[ipmitool]命令,在服务器中触发NMI。NMI发生后的操作取决于OS的设置。

强制停止超时 (0~99)

设置执行强行停止时的超时。执行上述命令后,经过此处设置的时间,开始执行失效切换组的激活处理。

虚拟机强制停止设定

设置虚拟机(客机OS)的强行停止。点击[设置],就会显示[虚拟机强制停止设定]对话框。

虚拟机管理工具

  • vCenter
    使用vCenter控制虚拟机时指定。

强制停止

  • 操作
    指定强制停止的操作。
  • 掉电
    在[命令] 中使用指定的命令关闭服务器的电源。
  • 超时 (0~99)
    设置执行强制停止时的超时。执行上述的命令后,经过此设定值后,开始失效切换组的激活处理。
  • 命令 (1023 字节以内)
    指定强制停止的命令。

vCenter

  • 主机名 (45 字节以内)
    指定虚拟机管理工具的主机。
  • 用户名 (255 字节以内)
    指定虚拟机管理工具的用户名。
  • 密码
    指定虚拟机管理工具的密码。

注解

密码不能使用「"(双引号)」。

运行强制停止脚本

设置强制停止脚本的执行。

  • 选中复选框
    运行强制停止脚本。
  • 没有选中复选框
    不运行强制停止脚本。

脚本设置

设置强制停止脚本。单击[脚本设置],显示[编辑脚本]对话框。

用户应用程序

使用可在服务器上执行的文件(可执行的Shell Script文件或执行文件)作为脚本。文件名设置为服务器上的本地磁盘的绝对路径或可执行文件名。另外,绝对路径或文件名中包含空白栏时,请按照以下方法,用双引号(")括起来。

例:
"/tmp/user application/script.sh"
Builder的集群配置信息中不会包含各可执行文件。因为不能通过Builder进行编辑或上传,需要在各台服务器上准备。

用Builder创建的脚本

使用通过Builder准备的脚本文件作为脚本。根据需要,可以通过Builder编辑脚本文件。脚本文件将被包含到集群配置信息中。

文件(1023字节以内)

选择了[用户应用程序]时,设置运行的脚本(可执行的Shell Script文件或执行文件)。

显示

选择了[用Builder创建的脚本]时,通过脚本编辑器显示脚本文件。通过编辑器编辑并保存的内容不会被反映。如果要显示的脚本文件正在被显示或者正在被编辑,则不会显示该文件。

编辑

选择了[用Builder创建的脚本]时,通过脚本编辑器可以编辑脚本文件。要反映这些变更,需要执行覆盖保存。如果要编辑的脚本文件正在被显示或者正在被编辑,则不能编辑该文件。脚本文件名无法更改。

替换

选择了[用Builder创建的脚本]时,把脚本文件内容变更为文件选择对话框中所选择的脚本文件内容。脚本处于正在编辑或正在显示的状态时无法置换。请在此选择脚本文件。请不要选择二进制文件(应用程序等)。

超时 (1~999)

指定脚本运行完了的最大等待时间。缺省值为10秒。

更改

显示更改脚本编辑器的对话框。可以将用于显示或编辑脚本的编辑器更改为任意编辑器。

标准编辑器

使用标准的编辑器作为脚本编辑器。

  • Linux... vi(通过执行用户的搜索路径查找到的vi)

  • Windows ... 记事本(通过执行用户的搜索路径查找到的notepad.exe)

外部编辑器

指定任意脚本编辑器。选择[参照],指定使用的编辑器。
在Linux中要指定基于CUI的外部编辑器,请创建shell脚本。
以下示例为执行vi的shell脚本。
xterm -name clpedit -title "Cluster Builder" -n "Cluster Builder" -e vi "$1"

使用CPU频率控制功能

设置CPU频率控制。
选中复选框,则激活失效切换组的服务器CPU频率数设置为最高(high),停止失效切换组的服务器CPU频率数设置为最低(low)。
未选中复选框,则无法执行CPU频率控制功能。
通过命令、WebManager控制CPU频率时所变更的设置,不管失效切换组是启动还是停止,都为优先。但是,在集群停止/启动或者挂起/复原之后,通过命令、WebManager变更的设置会被废弃,CPU的频率由集群控制。
  • 选中复选框
    进行CPU频率控制。
  • 未选中复选框
    不进行CPU频率控制。

注解

使用CPU频率控制功能时,以下几点是必须的:可以在BIOS设置中变更CPU频率;CPU通过OS电源管理功能支持频率的控制;内核支持。

宕机后自动启动

如果使用集群关机、集群停止以外的方法停止服务器时,或者集群关机、集群停止时不能正常结束时,设定下次OS启动时集群服务是否自动启动。
关于宕机后不自动启动的条件请参考《参考指南》的"其他设置信息"的"禁止自动启动的条件"。

Mount/Unmount命令互斥

对磁盘资源、镜像磁盘资源、共享型镜像磁盘资源、NAS资源、VxVOL资源上执行的文件系统的挂载(mount)、卸载(unmount)操作的互斥进行设置。
如果选中复选框,则通过锁定/etc/mounttab,能够避免[mount]命令、[unmount]命令失败等问题,但由于文件系统的mount/unmount处理依次进行,则如果资源数较多,资源的激活和非激活需要花费一定时间。
  • 选中复选框
    互斥。
  • 不选中复选框
    不互斥。

默认值

用于返回到默认值。点击[默认值],则所有的项目都设为默认值。

3.12. Servers属性

在Servers属性中,处理关于所有服务器的设置信息。

3.12.1. 主服务器标签页

设置服务器的优先顺序和服务器组。显示被登录的所有服务器。主服务器是拥有集群配置信息主导权的服务器。也是优先顺序最高的服务器。

向上、向下

用来更改服务器的优先顺序。从服务器的定义列表中选中想要更改的服务器,然后点击[向上]或 [向下] 移动选中行。

设定

用来设置服务器组。点击[设置] 后[服务器组]的对话框会被显示。
  • 添加
    添加服务器组。会显示添加组的画面。
  • 删除
    确认对话框会被显示。如果要删除就点击[是]。选中的服务器组会被删除。不删除就点击[否]。
    下列的条件下,无法进行删除。

    选择对象

    不能删除的条件

    反映方法

    服务组名

    在失效切换类型组的中被登录的服务器组

    停止集群
    停止镜像Agent
    启动镜像Agent
    启动集群
  • 重命名
    显示更改选中服务器组名的对话框。
    有下列的输入规则。

    选择对象

    输入规则

    反应方法

    服务器组名

    - 与在OS上可设置的TCP/IP的主机名有相同的规则。
    - 最多31个文字(31字节)。
    - 不能在文字列的开头和结尾使用中划线(-)和空格。
    - 不能使用全部是数字的文字列。
    停止集群
    停止镜像Agent
    启动镜像Agent
    启动集群

    请在服务器组内输入唯一的(不区分英文大小写)的名称。

  • 属性
    显示选中的服务器组的属性。
  • 名称
    表示服务器组名。
  • 服务器
    显示属于服务器组的服务器名。
  • [服务器组的属性] - [信息标签页]
    进行服务器组名的显示、登录注释、更改。

名称

表示集群名。这里不能更改名称。

注释(127字节以内)

设置集群的注释。可以输入半角的英语和数字。

  • [服务器组的属性] - [服务器组标签页]
    设置服务器组的配置。

添加

将[可用服务器]中选择的服务器添加到[可以启动的服务器]中。

删除

将在[可以启动的服务器]中选择的服务器从列表中删除。

向上、向下

用来更改服务器的优先顺序。在[可以启动的服务器]中选择想要更改的服务器名, 点击[向上]按钮或者[向下]按钮移动所选行。

3.13. 服务器属性

在服务器的属性中,进行构成集群的各个服务器的固有设置。

3.13.1. 信息标签页

进行服务器名的显示、注释的登录、更改。

名称

显示服务器名。此处不能更改名称。

注释 (127字节以内)

设置服务器的注释。仅能输入半角英文数字。

虚拟机

指定该服务器是否为虚拟机 (客机 OS)。

  • 选中复选框
    显示虚拟机 (客机 OS)。可进行虚拟机的设置。
  • 不选中复选框
    显示物理机。不能进行虚拟机的设置。

种类

指定虚拟化基础架构的种类。

  • vSphere
    是Vmware公司的虚拟化基础架构。
  • KVM
    是Linux内核虚拟化基础架构。
  • XenServer
    是Citrix 公司的虚拟化基础架构。
  • Container
    是Oracle公司的虚拟化基础架构。
  • Hyper-V
    是Microsoft 公司的虚拟化基础架构。
  • other
    用来指定其它的虚拟化基础架构。

强制停止设定

设置虚拟机 (客机 OS) 的信息。点击[设定] ,就会显示 [虚拟机名输入] 的对话框。

虚拟机名 (80 字节以内)

设置虚拟机 (客机 OS) 名。

注解

虚拟机名不要使用 「"(双引号)」和 「%(百分号)」。

数据中心名 (80 字节以内)

设置管理虚拟机 (客户 OS) 的数据中心名。

注解

数据中心名不要使用 「"(双引号)」和 「%(百分号)」。

vCenter

设定管理虚拟机(客户机OS)的vCenter服务器。点击[设定],则显示[虚拟机强制停止设定]的对话框。
有关详细的[虚拟机强制停止设定],请参考"扩展标签页"。

3.13.2. 警告灯标签页

设置网络控制的警告灯(本公司指定)的IP地址。

添加

用于添加I/F。点击[添加],则显示[警告灯输入]对话框。
  • IP地址(80字节以内)
    输入警告灯的IP地址。

注解

每台服务器需要一台警告灯。请不要在多台服务器中设置同一警告灯IP地址。

  • 警告灯的类型
    请选择所用警告灯的型号。各型号支持的产品如下所示。

型号

产品名称

DN-1000S/DN-1000R/DN-1300GL

DN-1000S/DN-1000R/DN-1300GL

DN-1500GL

DN-1500GL

NH-FB series / NH-FB1 series

NH-FB series / NH-FB1 series

NH-FV1 series

NH-FV1 series

  • 音频文件回放
    音频文件回放设定在警告灯类型为DN-1500GL,NH-FV1 series时生效。
    设定音频文件回放后,更改为DN1500GL,NH-FV1 series以外的其他警告灯类型时,音频文件回放设定失效。

服务器开始运行时声音提示

  • 选中复选框
    服务器启动时音频文件回放。只能回放1次音频文件。
  • 不选中复选框
    服务器启动时,不回放音频文件。
  • 声音文件编号 (DN1500GL :01 ~ 20, NH-FV1 series: 01 ~ 70)
    设置服务器启动时回放的音频文件号。

服务器终止运行时声音提示

  • 选中复选框
    服务器停止时,音频文件回放。音频文件在手动停止之前连续回放。
  • 不选中复选框
    服务器停止时,不能重启。
  • 声音文件编号(DN1500GL :01 ~ 20, NH-FV1 series: 01 ~ 70)
    设置服务器停止时回放的音频文件号。

编辑

编辑警告灯设定时使用。

注解

重启音频文件时,应事先在网络警告灯里登录音频文件。
有关音频文件登录,请参阅各网络警告灯的使用说明书。
声音文件编号请使用网络警告灯里登录的与音频文件相对应的声音文件编号。

3.13.3. BMC标签页

使用强行停止功能、机箱ID指示灯联动功能时,设置BMC的管理用LAN端口。
各服务器分别设置1个。

添加

新设置时使用。点击[添加]后,出现[BMC输入]对话框。
  • IP地址(80字节以内)
    输入为BMC管理所用LAN端口设置的IP地址。
  • 用户名 (255字节以内)
    输入为BMC设置的用户名具有Administrator权限的用户名称。
    如果不输入,则执行[ipmitool]命令时不设置用户名参数。
    实际有效的用户名长度取决于[ipmitool]命令以及服务器的BMC规格要求。
  • 密码 (255字节以内)
    输入上述设置的用户名的密码。
    实际有效的密码长度取决于[ipmitool]命令、以及服务器的BMC规格要求。
    关于用户名和密码,请参考服务器的用户手册。

删除

删除设置时使用。选择要删除的设置,点击[删除]。

编辑

变更设置时使用。选择要变更的设置,点击[编辑]。显示[BMC输入]对话框。
由不同机型的服务器构成集群,存在没有实现BMC功能的服务器时,请不要设置没有实现BMC功能的服务器的[BMC]标签页。
在这种配置下,机箱ID指示灯联动、强行停止功能运行后,将会显示表示BMC的操作失败的警报。

3.13.4. BMC(High-End Server Option) 标签页

那个不能被使用。

3.13.5. 磁盘I/O阻塞标签页

设定I/O阻塞设备。

添加

用于添加阻塞设备。点击[添加],则显示[请输入设备名]对话框。
  • 设备名 (1023字节以内)
    输入磁盘I/O阻塞设备。

删除

用于删除阻塞设备。[磁盘 I/O 阻塞]中选择想要删除的设备,点击[删除]。

编辑

用于编辑磁盘 I/O 阻塞设备。显示[请输入设备名]。

向上、向下

用于更改I/F号。[I/F]中选择想要变更的I/F,点击[向上]或者[向下],移动选择行。

3.13.6. PCI插槽阻塞(High-End Server Option) 标签页

那个不能被使用。

3.14. 安装脱机版Builder

脱机版Builder不需要安装在配置集群的服务器中。只有在除配置集群的服务器之外的PC中更改集群配置信息时,需要安装。

注解

脱机版 Builder 只支持Windows环境。

根据以下步骤,安装脱机版Builder。
安装Builder时,请安装到按照用户的安全权限能够进行文件访问(读写)的位置。

注解

即,在安装Builder时,卸载之后再安装时,请指定另外的安装目录进行安装。

  1. 在CD-ROM 驱动中插入安装 CD-ROM。

  2. 移动至CD-ROM 内的 Linux\4.0\cn\builder\ ,执行以下命令。

    expressclsbuilder -<版本号>-<发行号>.linux.i686.exe

    显示[Cluster Builder self-extracting dialog]对话框,选择安装文件夹,点击[Decompress](默认设置为"Program Files")。在指定的位置下将会创建"CLUSTERPRO\clpbuilder-l"目录,Builder被安装到该目录下。

  3. 显示[ZIP self-extract]对话框后点击[确定],安装完成。

    注解

    安装后移动安装文件夹时,请不要更改目录内部结构,移动整个"clpbuilder-l" 目录。

在Web浏览器中加载以下文件,启动脱机版Builder。
(安装路径)/clptrek.htm

3.15. 卸载脱机版Builder

Linux时

注解

卸载Builder必须使用root用户权限执行。

按照以下步骤,卸载Builder。

  1. 关闭所有 Web 浏览器。

  2. 执行rpm -e expressclsbuilder

注解

请勿指定除此之外的选项。

Windows时

按照以下步骤,卸载Builder。

  1. 关闭所有 Web 浏览器 (请在任务栏中确认JavaVM图标消失)。

  2. 在资源浏览器中删除安装了Builder的文件夹。

4. 疑难解答

4.1. 安装Builder时

错误消息

原因

处理方法

1

failed to open //var/lib/rpm/packages.rpm error: cannot open //var/lib/rpm/packages.
rpm

用户不具有root权限。

请使用具有root权限的用户身份执行。

2

error: package expressclsbuilder -* is already installed

Builder 已经安装。

请先卸载再重新安装。

4.2. 卸载Builder时

错误消息

原因

处理方法

1

failed to open //var/lib/rpm/packages.rpm
error: cannot open //var/lib/rpm/packages.rpm

用户不具有root权限。

请使用具有root权限的用户身份执行。

2

error: Cluster Builder is running

Builder已启动。

请关闭Web浏览器。稍等片刻再重新卸载。