493333王中王开奖结果-王中王开奖一马中特

493333王中王开奖结果让不同类型的网络可以可靠地互相联接,王中王开奖一马中特拥有规模庞大的原创游戏,在这里您将享受的不一样快乐。

网络频道

当前位置:493333王中王开奖结果 > 网络频道 > 【虚拟化实战】Cluster设计之三HA

【虚拟化实战】Cluster设计之三HA

来源:http://www.soniaLorenzana.com 作者:493333王中王开奖结果 时间:2019-12-03 20:05

作者:范军 Frank Fan) 新浪微博:@frankfan7

一、背景介绍

一 为什么使用HA

某企业在成生产环境中使用8台Esxi5.1物理服务器和1台vCenter5.1物理服务器组虚拟化平台,拓扑如下图所示,为了验证平台故障发生时的高可用性,计划分别对2台Esxi物理主机采取拔电源线和拔网线的方式模拟主机和网络故障,由于vCenter是物理主机,所以不用考虑vCenter与集群中Master主机同时挂掉的情况,且主机断电故障情景简单(vmware HA细节可参考文章http://www.linuxidc.com/Linux/2017-03/142355.htm),本处只讨论网络故障时vmware HA的场景

高可用性是虚拟化平台最突出的特性之一,设置和维护非常简单,技术非常成熟。对于一些非常关键的应用,可能对容灾的要求特别高,可以考虑采用基于应用层的HA,或者操作系统层的HA,比如MSCS。虚拟层的HA是在底层架构上实现的高可用性,在恢复时间可接受的情况下是非常好的选择。

王中王开奖一马中特 1

相对应用层和操作系统层HA而言,vSphere HA以较低的成本实现了整个集群的高可用性,同时实施和维护都十分的简单。无需在应用或者VM上作任何设置或改动。

二、准备工作

二 HA是如何工作的?

1.在模拟故障发生前首先确认集群HA功能是否启用,否则高可用就是空谈

HA Agent

王中王开奖一马中特 2

vSphere5.0之后的版本对架构作了很多的改动。摒弃了原来Cluster中的Primary Node和Secondary Nodes的概念。并且引入了Master  HAagent 和 Slave HA Agent的概念。通常情况下一个Cluster中仅有一个Master HA Agent。HA Agent有以下的功能:

王中王开奖一马中特,2.在要进行模拟故障的目标Esxi物理主机上确认主机监控已开启,否则故障发生时不会进行切换

-与vCenter互相交换信息

王中王开奖一马中特 3

-Master  HA Agent监控VM的状态,在其出现问题时重启

3.确认目标Esxi物理主机上的VM虚拟机已受到vSphere HA保护

-Slave  HA Agent把VM的状态信息传递给Master HA Agent, 并且在MasterAgent 的指令下重启VM

王中王开奖一马中特 4

-检测VM上运行的应用的状态

三、网络故障场景详细介绍

当Master HA所在的主机出现问题时,其他主机上的Agent开始参与竞选成为MasterHA,   连接DataStore数目最多的主机会成为Master。如果两台主机DataStore数目相同,Managed Object Id较高的主机会成为Master。

vSphere 5以后的版本HA的判断除了需要共享存储外,还需要网络心跳(管理网络)、隔离网关和存储心跳(存储网络)。本次由于没有详细说明模拟网络故障具体切断的网络,所以需要将每种情况都考虑进去,于是网络层面故障造成的结果就分为:主机分区(管理网络故障)和主机隔离(管理网络和隔离网关同时故障)

HeartBeating

1.主机分区

用来判断主机是否仍然正常运行。

集群中部分host主机无法通过管理网络与Master通信,但隔离网关(host主机通过管理网络与隔离网关通信)和存储心跳通信正常,此时就会触发主机分区。这种场景下被分区的host主机和位于其上的VM虚拟机此时对外仍然正常提供服务,HA不会做任何操作。此时集群会变为下图所示的这种情况:

Network Heartbeating

王中王开奖一马中特 5这并不代表该故障不重要,官方的解释为:

每台Slave都和Master主机互相发送Heartbeat信息。

虚拟机保护:vCenter允许虚拟机打开电源,但仅当虚拟机与负责它的首选主机在相同的分区中运行时,才能对其进行保护

Datastore Heartbeating

集群管理:vCenter只能与群集中的部分host主机进行通信,且只能连接到一台首选主机。因此,只有在解决分区之后,配置中影响 vSphere HA的更改才能生效。此故障可能会导致其中一个分区在旧配置下操作,而另一个分区使用新的设置

有的情况下Management网络中断之后,如果VM还能够继续访问其他网络和存储,那么就无需对被隔离主机上的VM采取响应措施。这是就需要检测Datastore Heartbeating来进一步验证。

2.主机隔离

对于Converged Infrastructure,比如Cisco UCS等系统,Datastore  Heartbeating能起的作用不大,因为管理网络和存储共用物理链路,在管理网络中断的情况下,存储很可能也无法访问了。

集群中部分host主机丢失网络心跳和隔离网关,只与存储网络通信正常,此时就会触发主机隔离。此时集群会变为下图所示的这种情况:

主机隔离

王中王开奖一马中特 6

检测:在某个主机无法与Management Network通讯时,也就是ping isolation Address失败后,该主机会被认为处于隔离状态。 Management Network的网关缺省作为isolationAddress。 为了增加可靠性和避免误判,可以设置多个isolationAddress

被隔离的host主机和位于其上的VM虚拟机此时对外无法正常提供服务,HA会按照预先设置好的策略执行,每个VM虚拟机还可以自定义各自的启动优先级和隔离响应策略

响应:

王中王开奖一马中特 7

下面的分析帮助你在确认主机处于隔离状态后,选择合适的响应动作

以下对这两个策略进行详细介绍:

本文由493333王中王开奖结果发布于网络频道,转载请注明出处:【虚拟化实战】Cluster设计之三HA

关键词: