1. 前言

1.1. 读者对象及用途

本手册《EXPRESSCLUSTER® X 硬件整合指南》面向管理者,对特定的硬件以及与其整合的功能进行说明。
本手册是对《EXPRESSCLUSTER X 安装&设置指南》的补充。
请参考在构建和操作集群时所需要的信息。

1.2. 本手册的构成

1.3. EXPRESSCLUSTER X手册体系

EXPRESSCLUSTER 的手册分为以下6类。各指南的标题和用途如下所示。

EXPRESSCLUSTER X 开始指南》 (Getting Started Guide)

本手册的读者对象为所有用户,对产品概要,运行环境,升级信息,现有的问题等进行说明。

EXPRESSCLUSTER X 安装&设置指南》 (Installation and Configuration Guide)

本手册的读者对象为导入使用了EXPRESSCLUSTER的集群系统的系统工程师以及导入集群系统后进行维护和操作的系统管理员,对导入使用了EXPRESSCLUSTER的集群系统后到开始操作前的必备事项进行了说明。手册按照实际导入集群系统时的顺序,对使用EXPRESSCLUSTER的集群系统的设计方法,EXPRESSCLUSTER的安装设置步骤,设置后的确认以及开始操作前的测试方法进行了说明。

EXPRESSCLUSTER X 参考指南》 (Reference Guide)

本手册的读者对象为管理员以及导入使用了EXPRESSCLUSTER的集群系统的系统工程师。手册对EXPRESSCLUSTER的操作步骤,各模块的功能以及疑难解答信息等进行了说明,是对《安装&设置指南》的补充。

EXPRESSCLUSTER X 维护指南》(Maintenance Guide)

本手册的读者对象为管理员以及导入使用EXPRESSCLUSTER的集群系统后进行维护和操作的系统管理员,对EXPRESSCLUSTER的维护的相关信息进行了说明。

《EXPRESSCLUSTER X 硬件整合指南》 (Hardware Feature Guide)

本手册的读者对象为管理员以及导入使用EXPRESSCLUSTER的集群系统的系统工程师,对与特定硬件整合的功能进行了说明。是对《安装&设置指南》的补充。

EXPRESSCLUSTER X 兼容功能指南》(Legacy Feature Guide)

本手册的读者对象为管理员以及导入使用EXPRESSCLUSTER的集群系统的系统工程师,对EXPRESSCLUSTER X 4.0 WebManager,Builder 以及EXPRESSCLUSTER Ver 8.0 兼容指令的相关信息等进行了说明。

1.4. 本手册的标记规则

在本手册中,需要注意的事项,重要的事项以及相关信息等用如下方法标记。

注解

表示虽然比较重要,但是并不会引起数据损失或系统以及机器损伤的信息。

重要

表示为避免数据损失和系统,机器损坏所必需的信息。

参见

表示参考信息的位置。

另外,在手册中使用以下标记法。

标记

使用方法

[ ] 方括号
在命令名的前后,
显示在画面中的字句 (对话框,菜单等) 的前后。
点击[启动]
[详细信息]对话框

命令行中的[ ] 方括号

表示括号内的值可以不予指定(可省)。

clpstat -s [-h host_name]

等宽字体

路径名,命令行,系统输出(消息,提示等),目录,文件名,函数,参数。

c:\Program files\EXPRESSCLUSTER

粗体
用户在命令提示符后实际输入的值。
输入以下内容。
clpcl -s -a

斜体

用户将之替换为有效值后输入的项目。

clpstat -s [-h host_name]

EXPRESSCLUSTER X 在本手册的图中,为了表示EXPRESSCLUSTER,使用该图标。

1.5. 最新信息来源

关于最新的产品信息,请参考以下Web站点。

https://www.nec.com/global/prod/expresscluster/

2. 与特定硬件的整合

本章就特定的硬件与EXPRESSCLUSTER进行整合时的设置进行说明。

本章中说明的项目如下所示。

2.1. 与Express5800/A1080a,A1040a 系列的整合

2.1.1. 何谓Express5800/A1080a,A1040a 系列的整合

Express5800/A1080a,A1040a 系列的整合指,当搭载在服务器的BMC 查出异常发生时,通过与EXPRESSCLUSTER整合,确实执行业务交替的功能。

本功能中使用BMC 心跳和消息接收监视。

BMC 心跳使用BMC 用的网络进行服务器的死活监视。

通过把消息接收监视设置到整合用的Express5800/A1080a,A1040a 系列,可使搭载在服务器上的BMC 发出异常发生的通知,并执行恢复操作。

2.1.2. Express5800/A1080a,A1040a 系列整合的注意事项

使用本功能时,需要满足以下的条件。

  • 需要BMC 的硬件和固件可支持该功能。关于可使用的机型,请参阅《开始指南》的"EXPRESSCLUSTER的运行环境"的"对应Express5800/A1080a,A1040a 系列整合的服务器"。

  • 需要事先启动 ipmi 服务。

  • 与ESMPRO/ServerAgent使用于同一环境中时,请使用ESMPRO/ServerAgent的控制面板(ESMamsadm),将通报以下的Agent Event后的操作从"关闭"更改为"不操作"。

    资源名:ESMCOMMONSERVICE,ID:C00001FD,C0000203,C0000454

    【控制面板(ESMamsadm)的启动方法】

    1. 使用拥有root 认证的用户名来登录。

    2. 移动到存储ESMamsadm 的目录。

      # cd /opt/nec/esmpro_sa/bin/
    3. 启动控制面板(ESMamsadm)。

      # ./ESMamsadm

    【指定通报各监视事件后的操作的方法】

    1. 启动控制面板(ESMamsadm),选择「设置Agent Event」。

    2. 在「资源名」中选择资源。(使用"↑" 或 "↓"键来选择)

    3. 在「事件ID」中选择要设置的事件ID。(使用"↑" 或 "↓"键来选择)

    4. 按压[设置...]按钮。显示[设置监视事件] 画面。

    5. 将「通报后的操作」从"关闭"更改为"不操作"。

      详细信息,请参阅ESMPRO/ServerAgent 用户指南(Linux篇)。

2.1.3. 利用Express5800/A1080a,A1040a 系统整合的配置信息的创建方法

下面对利用Express5800/A1080a,A1040a 系列的整合功能的配置信息的创建步骤举例说明。

集群环境的示例

以构筑以下图中的网络配置的集群环境为例来说明。此外,下图与 Express5800/A1080a,A1040a 系列整合功能没有直接的关系,因此省略了磁盘配置等。

通过2个Interconnect网络和1个BMC网络连接的Server1和Server2

图 2.1 集群环境的示例

以下记载了构筑上图的集群系统所需的集群配置信息的样例值。以下逐一说明在此条件下创建集群配置信息的步骤。实际设置值时,请换成构筑的集群配置信息后输入。

设置参数

设置值

集群配置

集群名

cluster

服务器数

2

失效切换的组数

1

监视资源数

2

心跳资源

LAN 心跳数

2

COM 心跳数

0

磁盘心跳数

0

BMC 心跳数

1

第1台服务器的信息
(主服务器)

服务器名

server1

私网的 IP 地址 (专用)

192.168.0.1

私网的 IP 地址 (备份)

10.0.0.1

BMC的服务器Web控制台用IP地址

192.168.0.11

第2台服务器的信息

服务器名

server2

私网的 IP 地址 (专用)

192.168.0.2

私网的 IP 地址 (备份)

10.0.0.2

BMC的服务器Web控制台用IP地址

192.168.0.12

第1个组

类型

失效切换

组名

failover1

启动服务器

所有服务器

组资源数

-

组资源(略)

-

-

-

-

-

-

第1个监视资源
(默认创建)

类型

用户空间监视

监视资源名

userw

第2个监视资源

类型

消息接收监视

类别

BMCNOTICE

关键词 (共通)

192.168.0.1

关键词
(服务器个别设置:server1)

192.168.0.1

关键词
(服务器个别设置:server2)

192.168.0.2

复归操作

对复归对象执行失效切换

复归对象

failover1

创建集群配置信息的步骤

创建集群配置信息基本分为创建集群,创建组,创建监视资源3步。下面显示 Express5800/A1080a,A1040a 系列整合固有的项目的设置步骤的流程。关于其他项目,请参阅《安装&设置指南》的"创建集群配置信息

注解

集群配置信息的操作可以反复执行。此外,创建的大部分的内容可使用名称更改功能或属性显示功能后进行更改。

1 创建集群

创建集群,添加服务器。

1-1 添加集群

添加构筑的集群,输入名称。没有Express5800/A1080a,A1040a 系列整合固有的项目。

1-2 添加服务器

添加服务器。设置服务器名,IP地址等。没有Express5800/A1080a,A1040a 系列整合固有的项目。

1-3 设置网络配置

设置构筑集群的服务器间的网络配置。设置BMC心跳资源作为Express5800/A1080a,A1040a 系列整合固有的项目。

1-4 设置网络分区解决处理

设置网络分区解决资源。没有Express5800/A1080a,A1040a 系列整合固有的项目。

2 创建失效切换组

创建进行失效切换时的单位——失效切换组。没有Express5800/A1080a,A1040a 系列整合固有的项目。

2-1 添加失效切换组

以失效切换为单位,添加组。没有Express5800/A1080a,A1040a 系列整合固有的项目。

2-2 添加组资源

添加构成组的资源。没有Express5800/A1080a,A1040a 系列整合固有的项目。

3 创建监视资源

在集群内添加监视指定的监视对象的监视资源。

3-1 添加监视资源 (消息接收监视)

添加使用的监视资源。

1 创建集群的步骤

首先,创建集群。在创建的集群中添加构成集群的服务器,决定优先度和心跳的优先度。Express5800/A1080a,A1040a 系列整合固有的设置仅需 1-3 。

1-1 添加集群

本项目中没有 Express5800/A1080a,A1040a 系列整合固有的项目。

1-2 添加服务器

本项目中没有 Express5800/A1080a,A1040a 系列整合固有的项目。

1-3 设置网络配置

设置配置集群的服务器间的网络配置。

  1. 用于接收或发送心跳信息的通信路径(私网)请点击 [种类] 列表的单元格并选择 [BMC]。点击各服务器列表的单元,输入 BMC 的服务器Web控制台用IP地址。

1-4 设置网络分区解决处理

本项目中没有 Express5800/A1080a,A1040a 系列整合固有的项目。

2 创建失效切换组

本项目中没有 Express5800/A1080a,A1040a 系列整合固有的项目。

3 创建监视资源

向集群添加监视指定的对象的监视资源。Express5800/A1080a,A1040a 系列整合功能中设置消息接收监视。有关监视的详细信息,请参阅"2.1.4. 何谓消息接收监视资源的 Express5800/A1080a,A1040a 系列整合"。

3-1 添加监视资源 (消息接收监视)

添加监视接收到来自服务器的异常发生通知的监视资源。

  1. 在[组] 中点击[下一步]。

  2. 显示[监视资源] 。点击[添加]。

  3. 打开[监视资源的定义] 对话框。在[类型] 框中选择监视资源的类型 (消息接收监视) ,在[名称] 框中输入监视资源名 (mrw1) 。点击[下一步]。

  4. 输入监视设置。此处不变更默认值,点击[下一步]。

  5. 在[类别]框中输入 BMCNOTICE,在[关键词] 框中输入可与各服务器的BMC通信的OS侧的IP地址作为发生异常通知时的通知目标的 IP 地址。由于IP 地址因服务器不同而不同,请务必利用服务器的单独设置。在本例中,在[共通] 和 [server1]中输入 192.168.0.1 ,在[server2]中输入 192.168.0.2 。

  6. 在复归操作中设置为 [对复归对象执行失效切换]。在Express5800/A1080a,A1040a 系列整合中原则上将复归操作选择为此设置。

  7. 设置复归对象。点击[参照],在显示的树形图中选择 [failover1],点击[OK] 。这样,[复归对象] 设置为[failover1]。

  8. 点击[结束]。

Express5800/A1080a,A1040a 系列整合固有项目的集群配置信息的创建到此结束。

2.1.4. 何谓消息接收监视资源的 Express5800/A1080a,A1040a 系列整合

当Express5800/A1080a,A1040a 系列上搭载的BMC查出异常发生时,马上使用EXPRESSCLUSTER执行复归操作的功能。

不使用本功能时,如果BMC查出异常发生就会马上执行服务器重启等。因此,不执行应用程序的结束处理等。

通过使用本功能,即便BMC 查出异常发生时,也能在EXPRESSCLUSTER执行复归操作后进行服务器重启等。

以下是消息接收监视资源的 Express5800/A1080a,A1040a 系列整合中的操作概要图。

具有与同一个网络连接的BMC和NIC,并在内部运行消息接收监视资源的服务器

图 2.2 消息接收监视资源的Express5800/A1080a,A1040a系列整合的操作概要

2.1.5. 消息接收监视资源的 Express5800/A1080a,A1040a 系列整合相关注意事项

除了"Express5800/A1080a,A1040a 系列整合的注意事项"的内容以外,还需要满足以下的条件。

  • 由于使用SNMP Trap发生来自BMC 的消息接收资源的异常发生通知,因此需要BMC 的网络接口和 OS 的网络接口之间可进行TCP/IP 通信。

此外,在BMC 连动用的设置中需要注意以下的事项。

  • 类型必须设置为「BMCNOTICE」。

  • 关键词需要在各服务器上单独设置。由于是异常发生时的通知目标,因此请设置为与各服务器的 BMC连接的OS 侧的 IP 地址和端口编号。

2.1.6. 监视(固有)标签页

其他标签页请参阅《参考指南》的"监视资源的详细信息"。

分类 (32 字节以内)

指定分类。
请务必指定为 BMCNOTICE 。

关键字 (1023 字节以内)

指定可与各服务器的 BMC 通信的 IP 地址。它们是用于接收异常发生通知的 IP 地址和端口编号。

请务必使用服务器的单独设置,对各服务器进行单独设置。

可省略端口编号 (默认值为 162)。设置数值时,请在所有的消息接收监视中将同一服务器的值设置同一值。

记述格式如下。

<IP 地址>[:<端口编号>]