6. 网络分区解决资源的详细信息

本章说明网络分区解决资源的详细信息。

6.1. 何谓网络分区?

网络分区状态是指集群服务器之间的所有通信线路都发生故障,网络断开的状态。
在没有对应网络分区状态的集群系统中,无法区分通信线路故障和服务器的故障,可执行会发生多个服务器访问同一资源导致数据遭破坏的情况出现。在EXPRESSCLUSTER中,如果查出其它服务器的心跳切断,会使用网络分区解决资源,判断属于服务器故障还是网络分区状态。如果判断为服务器宕机,则通过在正常的服务器上启动各种资源,启动业务应用程序来进行失效切换。如果判断为网络分区状态,则保护数据的优先级别高于继续运行业务,所以会采取紧急关机等处理措施。

6.2. 何谓网络分区解决资源?

集群内的服务器通过心跳资源监视其他服务器的死活状态。当所有的心跳资源都断线,或者其他服务器因集群之外的原因被关机时,使用网络分区解决资源进行网络分区解决。网络分区解决资源包括以下类型。

网络分区解决
资源

简称

功能概要

PING网络分区解决资源(PING方式)

pingnp

通过[ping]命令判断可以通信的服务器,执行网络分区解决。

HTTP网络分区解决资源(HTTP方式)

httpnp

通过对Web服务器的HTTP HEAD请求,判断可以通信的服务器,执行网络分区解决。

  • 可以利用的LAN只存在1个系统时,请设置PING网络分区解决资源或者HTTP网络分区解决资源。

6.3. 理解PING方式的网络分区解决

6.3.1. 设置PING网络分区解决资源

要使用PING网络分区解决资源,需要进行以下设置。

  • 需要能够接收[ping]命令并能返回响应的一直运行的设备(以下简称为"ping设备")。

PING网络分区解决资源在查出其他服务器的心跳切断时,如果响应从ping装置发出[ping]命令,则认为对方服务器关机,执行失效切换。如果没有响应[ping]命令,则认为是由于网络分区状态自身从网络中孤立出来,执行发生网络分区时的动作。

2台服务器以及Ping设备

图 6.1 PING 网络分区解决资源 (1)

查出其他服务器的心跳切断,对ping设备没有ping应答时,则关闭服务器。这样可以防止同一组在两个系统中都处于启动状态。

2台服务器以及Ping设备

图 6.2 PING 网络分区解决资源 (2)

关于详细信息,请参考本指南的"参数的详细信息" - "集群属性" - "NP解决标签页"。

6.3.2. PING网络分区解决资源的注意事项

使用PING网络分区解决资源时所指定的地址,请使用登录到配置信息中的,可通过互联LAN收发的任意地址。

因为Ping设备发生的故障等原因,导致在心跳结束之前仍然继续处于接收不到[ping]命令应答的状态时,不能执行网络分区解决,所以在该状态下如果查出心跳断开,则在所有服务器执行发生网络分区时的动作。

PING网络分区解决资源虽然可以按服务器选择[使用]和[不使用],但是不合适地设置了[不使用]时,有可执行不能执行网络分区解决处理从而发生双重启动。
下面的例子就是由于设置不合适导致网络分区解决处理不执行的情况。

6.4. 理解HTTP 方式的网络分区解决

6.4.1. 设置HTTP网络分区解决资源

使用HTTP网络分区解决资源,需要进行以下设置

  • 需要不间断运行可以进行HTTP通信的服务器(以下称为"Web服务器")。

HTTP网络分区解决资源,在查出其他服务器心跳切断时,如果Web服务器有响应,则判断对方服务器宕机,执行失效切换;如果没有响应,则根据网络分区状态判断自身为与网路隔离状态,实施网络分区发生时的操作。

2台服务器以及不间断运行的Web服务器

图 6.3 HTTP 网络分区解决资源 (1)

查出其他服务器的心跳切断,并且Web服务器没有响应,则关闭服务器。 这样可以防止同一组在两个系统中都处于启动状态。

2台服务器以及不间断运行的Web服务器

图 6.4 HTTP 网络分区解决资源 (2)

详细信息请参考本指南的"参数的详细信息"-"集群属性"-"NP解决标签页"。

6.4.2. HTTP 网络分区解决资源的注意事项

与Web服务器的通信,NIC以及源地址请根据OS的设置进行选择。

6.5. 不进行网络分区解决

因为不进行网络分区解决,所以当集群服务器之间的所有网络通信线路都发生故障时,所有服务器都执行失效切换。