[发明专利]一种分布式系统中的节点状态探测方法、系统和装置有效
申请号: | 201210151262.9 | 申请日: | 2012-05-16 |
公开(公告)号: | CN103428011A | 公开(公告)日: | 2013-12-04 |
发明(设计)人: | 黄明生;曾波 | 申请(专利权)人: | 深圳市腾讯计算机系统有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L29/08 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 张玉波;宋志强 |
地址: | 518057 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 系统 中的 节点 状态 探测 方法 装置 | ||
技术领域
本发明涉及网络技术领域,尤其涉及一种分布式系统中的节点状态探测方法、系统和装置。
背景技术
分布式系统在当前网络中应用较为广泛,例如,内容传送网络(Content Delivery Network,CDN)系统就是一种典型的分布式系统。分布式系统包括大量的网络节点,在实际应用中,常常需要监控分布式系统中的各个网络节点,从而及时发现状态异常的节点,即发现异常节点。其中,引起网络节点状态异常的常见原因有网络质量异常和节点进度状态异常。目前,常用的探测异常节点的方法主要有两种,其一是依据节点的网络质量探测异常节点,其二是依据节点的进度状态探测异常节点,下面分别进行介绍。
当各式各样的数据在网络介质中通过TCP/IP等网络协议进行传输时,如果信息量过大,则超额的网络流量将导致网络节点设备的处理速度变慢,进而产生网络时延。因此,衡量网络质量的一个典型指标是网络时延。
目前,依据网络质量探测分布式系统中的异常节点的典型方法为:向被测网络节点发送因特网控制报文协议(Internet Control Message Protocol,ICMP)数据包,根据被测节点针对该ICMP数据包的返回信息,例如网络时延,探测出节点的网络质量,进而可以发现异常节点。
具体地,目前预先设置固定的网络时延阈值,通过向被测网络节点发送ICMP数据包,获得被测节点的网络时延,将该网络时延与预设的阈值进行比较,当小于该阈值时,判定被测节点为正常节点,当大于或等于该阈值时,判定被测节点为异常节点。
由上述方案可见,通过发送ICMP数据包并预先设置固定的网络时延阈值,来探测分布式系统中的异常节点的方法,存在以下的不足:
现有技术中预先设置的阈值是固定的,不能适应网络情况的变化,因此,当由于整个网络的数据传输量过大等并非网络节点本身的问题,而导致网络时延增加时,将导致探测异常节点的准确性降低。
例如,当前有1000个节点,在某一时刻,有999台节点的网络时延是10ms,最后一台节点X的网络时延是1s。如果预先设置的检测阀值是1s,则这时会上报最后一台节点X异常,此时的检测结果是正常的。
但是,如果有999台节点因为某种末知的原因,例如整个网络的数据传输量过大等,其网络时延都达到了1s,最后一台节点X的网络时延达到了10s,则会上报这1000节点均异常的告警,显然,这种检测结果并没有将网络质量较差的真正异常节点X检测出来。
因此,目前通过设置固定阈值来探测异常节点的方法,无法探测出被测节点在当前网络状态下相对于其他网络节点是否异常,异常节点探测的准确性较低。
另外,在分布式系统中,常常会存在数据的分发路径被约束的情况,例如,数据从源节点A发送到目标节点C的过程中,虽然从节点A到节点C存在多条路径,但是从源节点A发出的数据只能从其中的一条专门路径到达节点C,而按照目前的协议,ICMP数据包不会受到路径约束,也就是说,ICMP数据包可能采用与数据传输路径不同的另一路径达到节点C,由于ICMP所采用的路径与数据传输路径不同,因此,采用发送ICMP数据包的方法测得的网络时延,也不能真实地反映数据传输时的网络时延,因而异常节点的探测结果也不够准确。
衡量节点状态的另一个典型指标是节点处理数据的进度状态,因此,也可以通过节点处理数据的进度状态检测异常节点。目前,通过获取节点的CPU使用率等指标,利用这些指标的值来推断节点的进度状态是否正常,进而推断节点是否是异常节点。然而,获得节点的CPU使用率等指标,又存在着较多的系统调用和运算开销,因此提高了检测成本。
发明内容
有鉴于此,本发明提供了一种分布式系统中的节点状态探测方法、系统和装置,以便提高节点状态探测的准确性。
本发明的技术方案具体是这样实现的:
一种分布式系统中的节点状态探测方法,该方法包括:
按照探测序列中各个探测元素的排列顺序,向每个被测节点依次发送探测序列中的探测元素,接收被测节点在接收到该探测元素后返回的响应;
根据接收到的被测节点返回的响应,计算在一时间段结束时多个被测节点最后返回的响应对应的探测元素的平均值、以及在该时间段结束时每个被测节点最后返回的响应对应的探测元素与所述探测元素的平均值之间的差值;
根据所述差值所在的差值范围,确定所述差值对应的被测节点的状态。
一种分布式系统中的节点状态探测系统,该系统包括探测装置和多个被测节点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯计算机系统有限公司,未经深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210151262.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电容器结构及其制作方法
- 下一篇:基于CSP获取远端加密指令的方法及系统