[发明专利]一种服务器主机高可用的方法在审
申请号: | 202110206482.6 | 申请日: | 2021-02-24 |
公开(公告)号: | CN112994977A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 王霖 | 申请(专利权)人: | 紫光云技术有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L12/24 |
代理公司: | 天津滨海科纬知识产权代理有限公司 12211 | 代理人: | 薛萌萌 |
地址: | 300459 天津市滨海新区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 服务器 主机 可用 方法 | ||
本发明提供了一种服务器主机高可用的方法,通过分布式agent上报的方式,逐级逐步上报;而后,域monitor对于超时没有上报的节点进行主动探测的方法,域monitor上报结果给控制中心,由控制中心来综合判断集群计算节点是否处于正常状态,及是否触发主动的迁移虚拟机业务。本发明所述的一种服务器主机高可用的方法可靠性高,探测准确度好,对于问题的响应时间短,定位更准确。
技术领域
本发明属于通信技术领域,尤其是涉及一种服务器主机高可用的方法。
背景技术
目前,针对云计算平台业务中计算节点主机高可用的常见方案,主要是通过monitor检测ping各个服务器的方法,即单数monitor节点组成集群,选举主节点,定期通过ping各个计算节点,根据返回结果判断该服务器是否正常可通信;但上述方法会存在一下弊端:
1、ping的结果受网络现状的影响明显,如果是monitor集群网络和计算节点网络出现连接异常,但计算节点自身的业务网络和存储网络正常,monitor集群根据ping的结果做出任何响应都可能导致目标计算节点的业务受到中断的影响;
2、monitor节点的负载随着集群规模的扩大会不断增加,从而很快会对monitor节点产生网络性能瓶颈以及处理瓶颈;
3、monitor节点采用keepalive或者pacemaker进行多活高可用,依赖于vrrp协议,对网络自身要求高,稳定性相对较差。
发明内容
有鉴于此,本发明旨在提出一种服务器主机高可用的方法,以解决上述问题存在的不足。
为达到上述目的,本发明的技术方案是这样实现的:
一种服务器主机高可用的方法,包括以下步骤:
S1、计算节点agent守护进程周期性进行自身状态探测,当探测自身状态出现异常状态时,则将异常状态信息添加至心跳报文里;
S2、计算节点服务器运行agent守护进程周期性向域monitor服务器上报心跳报文;
S3、域monitor判断是否接收到心跳报文;若收到心跳报文,即该主机为上报状态机器,此时将心跳报文信息上报给控制中心,则跳转至步骤S4;若超时没有收到心跳报文,则此时计算节点agent上报功能异常,通过管理网络和存储网络发起主动探测该主机,并将心跳报文上报至控制中心,则跳转至步骤S5;
S4、控制中心接收到心跳报文后,按照预处理规则进行处理,跳转至步骤S8;
S5、控制中心发现域monitor超时未上报,则主动发起探测域monitor,并跳转至步骤S6;
S6、当探测域monitor出现异常状态,则按照控制中心预处理规则进行处理,并同时触发域内重新选举产生新的monitor,继续跳转至步骤S7;
S7、当选举产生新的域monitor,控制中心更新域monitor信息,并下发新的域monitor信息给计算节点agent,计算节点agent更新上报域monitor地址,跳转至步骤S8;
S8、控制中心综合判断计算节点agent是否处于正常状态,及是否触发主动迁移虚拟机业务。
进一步的,步骤S1中,自身状态探测内容包括探测管理网络和存储网络的连通性,以及业务网络的状态。
进一步的,采用ping方式进行探测管理网络和存储网络的连通性。
进一步的,步骤S1中,当出现管理网络和存储网络的探测失败或者业务网络故障,则将该异常状态信息添加至上报给域monitor的心跳报文里。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于紫光云技术有限公司,未经紫光云技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110206482.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便于攀爬维修的通信塔
- 下一篇:一种距离控制摆头热量摆动的颈部治疗仪