[发明专利]分布式集群系统中节点的工作状态的监测方法、装置及系统有效
申请号: | 201710591183.2 | 申请日: | 2017-07-19 |
公开(公告)号: | CN107426051B | 公开(公告)日: | 2018-06-05 |
发明(设计)人: | 张俊峰;游峰;李纲彬;金鑫鑫 | 申请(专利权)人: | 北京华云网际科技有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26 |
代理公司: | 北京智晨知识产权代理有限公司 11584 | 代理人: | 张婧 |
地址: | 100085 北京市海淀区宝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式集群系统 网络连接状态 监测 装置及系统 节点判断 判断结果 心跳检测 超时 集群 时长 断开 畅通 | ||
本发明实施例提供了一种分布式集群系统中节点的工作状态的监测方法、装置以及系统。所述分布式集群系统中节点的工作状态的监测方法,包括:获取预定时长内分布式集群系统中各个节点的被其他节点判断为心跳检测超时的次数;从所述各个节点中选择所述次数最高的节点;获取选择出的所述节点的网络连接状态;当选择出的所述节点的网络连接状态为畅通时,判断为选择出的所述节点为假死节点;当选择出的所述节点的网络连接状态为断开时,生成判断结果为:选择出的所述节点为真死节点。本发明可以及时、有效、可靠、快速的识别假死节点,提高了集群的稳定性。
技术领域
本发明涉及分布式系统领域,尤其涉及一种分布式集群系统中节点的工作状态的监测方法和装置以及系统。
背景技术
随着云计算在各领域的广泛应用和数据量的增加,对分布式文件系统的规模、性能和可靠性都提出了很高的需求。在大规模集群下,小概率事件会变得频繁发生。节点假死就是其中一个需要解决的问题。节点假死后,如果不能有效及时的识别出来,会严重影响整个集群的稳定性和性能,会导致上层应用出现短暂的不可用。但假死节点很难检测,如果方法不对,也会误判。
发明内容
本发明的实施例提供了一种分布式集群系统节点的工作状态的监测方法和装置以及系统,能够及时有效识别节点的工作状态。
为了实现上述目的,本发明采取了如下技术方案。
一种分布式集群系统中节点的工作状态的监测方法,包括:
获取预定时长内分布式集群系统中各个节点的被其他节点判断为心跳检测超时的次数;
从所述各个节点中选择所述次数最高的节点;
获取选择出的所述节点的网络连接状态;
当选择出的所述节点的网络连接状态为畅通时,生成判断结果为:选择出的所述节点为假死节点;
当选择出的所述节点的网络连接状态为断开时,生成判断结果为:选择出的所述节点为真死节点。
一种分布式集群系统中节点的工作状态的监测装置,包括:
第一获取模块,获取预定时长内分布式集群系统中各个节点的被其他节点判断为心跳检测超时的次数;
选择模块,从所述各个节点中选择所述次数最高的节点;
第二获取模块,获取选择出的所述节点的网络连接状态;
判断模块,当选择出的所述节点的网络连接状态为畅通时,生成判断结果为:选择出的所述节点为假死节点;当选择出的所述节点的网络连接状态为断开时,生成判断结果为:选择出的所述节点为真死节点。
一种分布式集群系统中节点的工作状态的监测系统,包括:分布式集群系统中的至少三个节点、监测装置;
所述监测装置用于:获取预定时长内分布式集群系统中各个所述节点的被其他节点判断为心跳检测超时的次数;从所述各个节点中选择所述次数最高的节点;获取选择出的所述节点的网络连接状态;当选择出的所述节点的网络连接状态为畅通时,生成判断结果为:选择出的所述节点为假死节点;当选择出的所述节点的网络连接状态为断开时,生成判断结果为:选择出的所述节点为真死节点。
由上述本发明的实施例提供的技术方案可以看出,本发明实施例中解决了现有技术中无法准确、快速判断出节点的工作状态的问题。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华云网际科技有限公司,未经北京华云网际科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710591183.2/2.html,转载请声明来源钻瓜专利网。