[发明专利]一种用于集群计算机系统的投票仲裁方法及装置有效
申请号: | 201180001450.7 | 申请日: | 2011-07-26 |
公开(公告)号: | CN102308559A | 公开(公告)日: | 2012-01-04 |
发明(设计)人: | 杜学文;王卫伟 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 广州三环专利代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 集群 计算机系统 投票 仲裁 方法 装置 | ||
技术领域
本发明涉及计算机通信网络,尤其涉及一种用于集群计算机系统的投票仲裁方法及装置。
背景技术
在集群计算机系统中,当发生故障使集群系统分裂为几个子集群时,如果不采用相应的防止手段会导致集群发生脑裂,即分裂后的几个子集群都互相接管其他子集群的服务共同向外提供服务或访问共享资源。仲裁机制是解决当前集群计算机系统脑裂的手段之一,其实现方式为:集群系统中的每个节点投一票或多票,当集群发生分裂时,节点票数多的子集群为合法集群,然后由合法集群接管不合法子集群的服务。但是,采用上述节点投票方式为分裂后合法子集群的确定(即子集群的接管)进行仲裁的过程中,当不合法子集群上运行了启动时间较长,完成切换所需时间较长的资源,而合法子集群上运行的资源切换相对简单时,会增加资源的切换时间,从增加服务宕机时间,降低集群计算机系统连续对外服务的时间,即降低集群系统的可用性。
发明内容
本发明实施例提供了一种用于集群计算机系统的投票仲裁方法及装置,通过将分裂后子集群的节点票数和节点上的资源票数作为合法集群接管仲裁的考虑因素,有效地解决仅将节点数作为仲裁考虑因素而导致的接管切换时间增加,集群系统连续服务时间降低的问题。
根据本发明实施例的第一方面,提供了一种用于集群计算机系统的投票仲裁方法,所述方法包括:
当所述集群计算机系统发生分裂时,根据所述分裂后子集群内节点上的资源票数和节点票数为分裂后合法子集群的确定进行仲裁以使所述仲裁得到的合法子集群继续提供服务,其中
所述资源票数可根据节点上运行的应用资源的启动时间进行设置。
根据本发明实施例的第二方面,提供了一种用于集群计算机系统的投票仲裁装置,所述装置包括:
用于当所述集群计算机系统发生分裂时,根据所述分裂后子集群内节点上的资源票数和节点票数为分裂后合法子集群的确定进行仲裁以使所述仲裁得到的合法子集群继续提供服务,其中
所述资源票数可根据节点上运行的应用资源的启动时间进行设置。
实施本发明实施例,具有如下有益效果:通过根据节点上的运行资源的启动时间为各节点设置资源票数,在集群发生分裂后,将分裂后子集群的节点票数和节点上的资源票数作为分裂后子集群接管的仲裁因素,有效地降低了分裂后子集群接管的切换处理时间,达到了减少服务宕机时间的效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1图示了根据本发明实施方式的用于集群计算机系统的投票仲裁方法流程示意图。
图2图示了根据本发明实施方式的集群内节点上的资源票数设置的流程示意图。
图3图示了根据本发明实施方式的双节点高可用集群计算机系统的组网模型示意图。
图4图示了根据本发明实施方式的用于集群计算机系统的投票仲裁装置的结构示意图。
图5图示了根据本发明实施方式的资源票数设置模块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图示了根据本发明实施方式的用于集群计算机系统的投票仲裁方法流程示意图,本发明提供的用于集群计算机系统的投票仲裁方法包括:
当所述集群计算机系统发生分裂时,根据所述分裂后子集群内节点上的资源票数和节点票数为分裂后合法子集群的确定进行仲裁以使所述仲裁得到的合法子集群继续提供服务,其中
所述资源票数可根据节点上运行的应用资源的启动时间进行设置。
本发明的实施方式中,当集群计算机系统发生故障分裂时,根据分裂后各子集群内节点上的资源票数和节点票数为分裂后合法集群的确定(即子集群的接管)进行仲裁以使仲裁得到的合法子集群继续提供服务。其中,所述故障可能是因节点间的心跳检测故障而导致的集群分裂,也可能是因某一节点自身故障而导致的集群分裂。例如,双节点集群系统因两节点间的心跳检测故障发生分裂,分裂为子集群1(包括节点1)和子集群2(包括节点2)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180001450.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:过滤设备
- 下一篇:一种多功能电动开门机