5. 心跳资源的详细信息

本章说明心跳资源的详细内容。

5.1. 何谓心跳资源?

集群内的服务器对其他服务器进行死活监视。服务器之间的死活监视通过心跳资源来实现。心跳设备包括以下几种。

  1. LAN心跳/内核模式LAN心跳(Primary interconnect)

    连接到共享磁盘的2台服务器

    图 5.1 LAN心跳/内核模式LAN心跳(Primary interconnect)

  2. LAN心跳/内核模式LAN心跳(Secondary interconnect)

    连接到共享磁盘的2台服务器

    图 5.2 LAN心跳/内核模式LAN心跳(Secondary interconnect)

  3. 磁盘心跳

    连接到共享磁盘的2台服务器

    图 5.3 磁盘心跳

  4. COM心跳

    连接到共享磁盘的2台服务器

    图 5.4 COM心跳

  5. BMC心跳

    连接到共享磁盘的2台服务器

    图 5.5 BMC心跳

  6. Witness心跳

    连接到共享磁盘的2台服务器

    图 5.6 Witness心跳

心跳资源名

简称

功能概要

LAN心跳资源 (1) (2)

lanhb

使用LAN对服务器进行死活监视
也用于集群内通信。

内核模式LAN心跳资源 (1) (2)

lankhb

内核模式的模块使用LAN进行服务器的死活监视。

磁盘心跳资源 (3)

diskhb

使用共享磁盘上的专用分区对服务器进行死活监视。

COM心跳资源 (4)

comhb

将2台服务器使用COM线缆连接,对服务器进行死活监视。

BMC心跳资源 (5)

bmchb

使用BMC对服务器进行死活监视。

Witness心跳资源(6)

witnesshb

使用witness服务器进行死活监视。

  • 至少要设置LAN心跳资源或内核模式LAN心跳资源其中之一。建议设置为2个以上。推荐设置可承受系统负载的内核模式LAN心跳资源。

  • 必须设定一个以上全服务器间可以通信的LAN心跳资源或内核模式LAN心跳资源。

  • 请根据以下基准设置磁盘心跳以及COM心跳的I/F。

    使用共享磁盘时

    [Number of servers: up to 2]
    基本的为COM I/F方式和磁盘I/F方式
    [Number of servers: 3 or more]
    磁盘I/F方式

    不使用共享磁盘时

    [Number of servers: up to 2]
    COM I/F方式

5.2. 理解LAN心跳资源

5.2.1. LAN心跳资源的注意事项

  • 需要设置1个以上LAN心跳资源或内核LAN心跳资源。建议设置私网专用的LAN心跳资源与私网和公网公用的LAN心跳资源等2个以上。

  • 公网LAN I/F中未登录的私网I/F中传输用于通报同步的通信数据。请在设置时考虑到网络负荷。

5.3. 理解内核模式LAN心跳资源

5.3.1. 内核模式LAN心跳资源的运行确认信息

注解

由于依存于Distribution,内核版本,因此请在设置前参考《开始指南》-"EXPRESSCLUSTER的运行环境" - "软件" - "可运行的Distribution和kernel"。

5.3.2. 内核模式LAN心跳资源的设置

使用内核模式的驱动程序模块实现与LAN心跳同样的功能。具有如下特征。

  • 由于使用内核模式的驱动程序,会减少对负载的影响,私网连接切断的误认也会减少。

  • 通过同时设置用户空间监视资源的keepalive方式,可在其它的服务器中记录下用户模式出现停止时的重置。

5.3.3. 内核模式LAN心跳资源的注意事项

  • 建议设置私网专用的内核模式LAN心跳资源以及私网与公网共用的内核模式LAN心跳资源等2个以上设置。

5.4. 理解磁盘心跳资源

5.4.1. 磁盘心跳资源设置

使用磁盘心跳资源之前需要以下设置。

  • 请在共享磁盘上确保专用分区。(无需创建文件系统。)

  • 请设置能够使用相同设备名访问在所有服务器中共享磁盘上的专用分区。

使用磁盘心跳资源时,即便网络切断,也可以确认其他服务器的运行状态。

  1. 图中,2台服务器连接到共享磁盘中。
    共享磁盘上的分区之一用作磁盘心跳的分区。
    2台服务器和共享磁盘

    图 5.7 磁盘心跳资源 (1)

  2. 连接服务器的2个网络中,一方已经断开连接。

    2台服务器和共享磁盘

    图 5.8 磁盘心跳资源 (2)

  3. 即使连接服务器的网络都断开时,磁盘心跳资源可防止共享磁盘上的文件系统被两个系统启动破坏。

    2台服务器和共享磁盘

    图 5.9 磁盘心跳资源 (3)

若集群由3台以上服务器配置而成,则可如下使用磁盘心跳资源进行配置。可设置仅在使用集群内共享磁盘的服务器之间使用磁盘心跳资源。

详情请参照本指南的"2. 参数的详细信息" - "集群属性" - "私网标签页"。

3台服务器和共享磁盘

图 5.10 使用磁盘心跳资源的配置(3台服务器)

5.4.2. 磁盘心跳资源的注意事项

  • 使用共享磁盘时,建议同时使用LAN心跳资源与磁盘心跳资源。

  • 使用多个LUN时,建议在集群内使用1个或2个磁盘心跳资源。由于每隔单位心跳间隔,需要对磁盘进行read/write,因此请在设置磁盘心跳资源时考虑到磁盘负载。

  • 请在各LUN中确保磁盘心跳专用分区。当由于磁盘故障等原因设备名发生不一致的情况时,可执行会损坏文件系统,因此请在不使用磁盘心跳的LUN中确保虚拟分区。
    请确保各LUN中磁盘心跳专用分区的编号相同。
    该图显示的是两个存储机箱,每个存储机箱包含了4个LUN。
    各存储机箱中的各LUN,都有一个专用的磁盘心跳分区,但是,每个机箱中实际使用的只有一个(LUN 1-1,LUN 2-1上的 Disk heartbeat partition)。
    确保了其他LUN上的磁盘心跳专用分区(Dummy partition),因此即使设备名被无意更改时,也不会破坏文件系统,该文件系统实际上并没有使用。
    2个存储机箱以及其中的LUN

    图 5.11 磁盘心跳专用分区

  • 请不要登录到存储Pool中。

5.5. 理解COM心跳资源

5.5.1. COM心跳资源的注意事项

为了避免网络中断时启动两个系统,建议在COM可用的环境中使用COM心跳资源。

5.6. 理解BMC心跳资源

5.6.1. BMC心跳资源的注意事项

使用BMC实现与LAN心跳同样的功能。具有如下特征。

5.7. 理解Witness心跳资源

5.7.1. 设置Witness 心跳资源

使用Witness 心跳资源需要进行以下设置。

使用Witness 心跳资源时,定期确认保存Witness服务器的服务器死活信息。由于服务器死活信息被集中,因此服务器之间的死活信息不太会发生混乱。此外,通过并用HTTP网络分区解决资源,区分"自服务器与Witness服务器间断绝通信"和"其他服务器与Witness服务器间断绝通信"来进行操作。

5.7.2. Witness 心跳资源的注意事项

  • 如果集群名中包含空格字符,则Witness心跳资源无法正常运行。集群名中请不要包含空格字符。

  • 与Witness服务器进行通信,NIC以及源地址请根据OS的设置进行选择。

  • 选中[使用Proxy]时,推荐同时选中[使用SSL]。当通过Squid使用Proxy服务器与Witness服务器通信时,已确认由于Squid的行为,对于每个HTTP的请求,在Proxy服务器上都生成了TIME_WAIT状态的端口。对于HTTPS时,不会发生相同的现象。