1. 前言

1.1. 读者对象及用途

本手册《EXPRESSCLUSTER® X 硬件整合指南》面向管理者,对特定的硬件以及与其整合的功能进行说明。

本手册是对《EXPRESSCLUSTER X 安装&设置指南》的补充。

请参考在构建和操作集群时所需要的信息。

1.2. 本手册的构成

1.3. EXPRESSCLUSTER X手册体系

EXPRESSCLUSTER X 的手册分为以下 5 类。各指南的标题和用途如下所示。

EXPRESSCLUSTER X 开始指南》(Getting Started Guide)

本手册的读者对象为使用EXPRESSCLUSTER的用户,对产品概要,运行环境,升级信息,现有的问题等进行了说明。

EXPRESSCLUSTER X 安装&设置指南》(Install and Configuration Guide)

本手册的读者对象为导入使用EXPRESSCLUSTER的集群系统的系统工程师以及导入集群系统后进行维护和操作的系统管理员,对导入使用EXPRESSCLUSTER的集群系统后到开始操作前的必备事项进行说明。手册按照实际导入集群系统时的顺序,对使用EXPRESSCLUSTER 的集群系统的设计方法,EXPRESSCLUSTER 的安装设置步骤,设置后的确认以及开始操作前的测试方法进行了说明。

EXPRESSCLUSTER X 参考指南》(Reference Guide)

本手册的读者对象为管理员以及使用EXPRESSCLUSTER导入集群系统的系统工程师。手册对EXPRESSCLUSTER的操作步骤,各模块的功能以及疑难解答信息等进行了说明,是对《安装&设置指南》的补充。

EXPRESSCLUSTER X 维护指南》(Maintenance Guide)

本手册的读者对象为管理员以及导入使用EXPRESSCLUSTER的集群系统后进行维护和操作的系统管理员,对EXPRESSCLUSTER的维护的相关信息进行了说明。

《EXPRESSCLUSTER X 硬件整合指南》 (Hardware Feature Guide)

本手册的读者对象为管理员以及导入使用EXPRESSCLUSTER的集群系统的系统工程师,对特定的硬件以及与其整合的功能进行说明。是对《安装&设置指南》的补充。

1.4. 本手册的标记规则

在本手册中,需要注意的事项,重要的事项以及相关信息等用如下方法标记。

注解

表示虽然比较重要,但是并不会引起数据损失或系统以及机器损伤的信息。

重要

表示为避免数据损失和系统,机器损坏所必需的信息。

参见

表示参考信息的位置。

另外,在手册中使用以下标记法。

标记

使用方法

[ ]方括号
在命令名的前后
显示在画面中的字句 (对话框,菜单等) 的前后。
点击[开始]。
[属性]对话框

命令行中的[ ]方括号

表示括号内的值可以不予指定(可省)。

clpstat -s[-h host_name]

#

表示Linux用户正以root身份登录的提示符。

# clpcl -s -a

等宽字体
路径名,命令行,系统输出(消息,提示等),目录,文件名,函数,参数。
/Linux/5.2/cn/server/
粗体
表示用户在命令提示符后实际输入的值。
输入以下内容。
clpcl -s -a
斜体
用户将其替换为有效值后输入的项目。
clpstat -s [-h host_name]

EXPRESSCLUSTER X 在本手册的图中,为了表示EXPRESSCLUSTER,使用该图标。

1.5. 最新信息来源

关于最新的产品信息,请参考以下Web站点

2. 与服务器管理基础设施的整合

本章介绍Enterprise Linux with Dependable Support中包含的服务器管理基础设施的概要。

本章包含以下内容。

2.1. 服务器管理基础设施的概要

服务器管理基础设施是Enterprise Linux with Dependable Support中的产品之一。服务器管理基础设施是提供以下功能的软件。

  • 是记录与强化设备驱动器所检测到的故障相关的信息的功能。

  • 强化设备驱动器检测到系统致命故障时,与EXPRESSCLUSTER联动,执行失效转换的功能

详细信息,请参考Enterprise Linux with Dependable Support手册。

2.2. 与服务器管理基盘的整合概要

所谓与EXPRESSCLUSTER中的服务器管理基础设施的整合功能,并非EXPRESSCLUSTER自行执行监视,而是EXPRESSCLUSTER接收由driver模块自动发出的消息,被动执行失效切换等的整合功能。

以下显示概要图。

发生错误的Server1,正常的Server2以及Management PC

图 2.1 与服务器管理基盘的整合概要

Enterprise Linux with Dependable Support中包含的强化设备驱动器(以下称强化驱动器)在系统出现致命错误时通过服务器管理基础设施向EXPRESSCLUSTER发送消息。EXPRESSCLUSTER在接收到消息时执行以下动作。

  • 将对应的消息接收监视资源(mrw)的状态设为异常。由此,管理员可以从视觉上确认通过Cluster WebUI及EXPRESSCLUSTER的命令进行状态确认从而查出了异常。

  • 按照发生异常时所设置的动作,执行业务的失效切换及关闭OS。

2.4. 消息接收监视资源

消息接收监视资源对外部通知的错误消息进行监视。本节只介绍与服务器管理基础设施整合时的情况。其它情况,请参考《参考指南》的 "监视资源的详细信息"。

2.4.1. 与消息接收监视资源相关的注意事项

与服务器管理基础设施整合时,消息接收监视资源的状态由EXPRESSCLUSTER进行管理,因此,请不要使用[clprexec]命令。
指定了消息接收监视资源的关键字时,指定为关键字的设备在查出异常时将出现错误,执行查出异常时的动作。
未指定消息接收监视资源的关键字时,在与种类相同的任意一个的设备中查出异常时将出现错误,执行查出异常时的动作。

2.4.2. 使用消息接收监视资源进行监视的种类

与服务器管理基础设施整合时,消息接收监视资源接收的消息类型如下。

  1. NIC
    监视网络接口卡的错误消息。
  2. FC
    监视Fibre Channel的错误消息。
  3. HA/SS
    监视EXPRESSCLUSTER X HA/StorageSaver的错误消息。
  4. HA/AM
    监视EXPRESSCLUSTER X HA/ApplicationMonitor的错误消息。
  5. HA/RS
    监视EXPRESSCLUSTER X HA/ResourceSaver的错误消息。
  6. SPS
    监视SPS的错误消息。

2.4.3. 监视(固有)标签页

信息标签页,监视(共通)标签页请参考《参考指南》的" 监视资源的详细信息"。

分类 (32字节以内)

指定种类
请务必从列表框中选择默认字符串。

关键字 (1023字节以内)

指定监视对象。

2.4.4. 复归动作标签页

信息标签页,监视(共通)标签页请参考《参考指南》的 "监视资源的详细信息"。

设置复归对象和查出异常时的操作。如为消息接收监视资源,则查出异常时的动作从"重新启动复归对象","针对复归对象执行失效切换"或"最终动作"中选择1个。但,如复归对象处于停止状态时,则不进行恢复动作。

复归动作

选择监视器查出异常时的动作。

  • 执行复归脚本
    监视器查出异常时,执行复归脚本。
  • 重启复归对象
    监视器查出异常时,重启选中为复归对象的组或组资源。
  • 针对复归对象执行失效切换
    监视器查出异常时,针对选中为复归对象的组或组资源所属组执行失效切换。
  • 执行最终动作
    监视器查出异常时,执行选中为最终动作的动作。

在服务器组外进行失效切换

只可设置消息接收监视资源。设置是否在接收到异常检测通知时,让非主服务器组的其他服务器组执行失效切换。

* 关于其它设置项目,请参考《参考指南》的 "监视资源的详细信息" - "监视资源的属性" - "复归动作标签页"。