[发明专利]一种适应于大规模存储集群的失效检测方法有效
申请号: | 201210259254.6 | 申请日: | 2012-07-25 |
公开(公告)号: | CN102769673A | 公开(公告)日: | 2012-11-07 |
发明(设计)人: | 郑胜;黄骏 | 申请(专利权)人: | 楚云汉智武汉网络存储系统有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L12/24 |
代理公司: | 武汉天力专利事务所 42208 | 代理人: | 吴晓颖;冯卫平 |
地址: | 430070 湖北省武汉市光*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适应 大规模 存储 集群 失效 检测 方法 | ||
1.一种适应于大规模存储集群的失效检测方法,该方法在存储集群系统中设置有失效检测模块,其特征在于:该方法采用的失效检测故障模型为失效/恢复模型,该方法采用的失效节点信息的传播机制为永久免疫传染病的传播模型;
所述失效检测故障模型采用失效/恢复模型,每个存储节点都有唯一ID号,对于被检测出的失效节点,重启后恢复将被赋予新的ID号;所述失效节点信息的传播机制采用永久免疫传染病的传播模型,将失效节点信息附加在ping和ack消息中,根据永久免疫传染病的传播模型进行传播。
2.根据权利要求1所述的一种适应于大规模存储集群的失效检测方法,其特征在于:所述永久免疫传染病模型,具体实现时,系统中任意一个存储节点需要在缓存中保存两个节点列表,一个列表P1保存正常节点的ID号和相关信息;一个列表P2保存最近被认为失效的节点的ID号和一个计数器,所述计数器用于记录失效节点信息被传播的次数;系统根据计数器选择下一个传播的失效节点信息,每一个失效节点信息最多被传播αlogn次,其中n表示整个系统中存储节点的总数,α是整数,取{2,3}两个值,当最初发出失效节点信息的存储节点,收到所有存储节点发回的确认消息后,失效节点将会从该存储节点的列表P2中删除,当计数器的值大于αlogn 后,该存储节点也会把失效节点从列表P2中删除,如果附加的系统成员更新信息太多,超过了ping和ack消息包的最大值时,将优先选择计数器值较小的失效节点信息进行传播;所述失效节点信息是在失效检测模块中产生的,若系统中有节点被认为失效,就会产生失效节点信息,包括该节点ID号和认为该节点失效的时刻,永久免疫传染病的传播模型就将失效节点信息附加在ping和ack消息中传播到系统中的所有节点,使得系统中所有节点都获知该存储节点失效了。
3.根据权利要求2所述的一种适应于大规模存储集群的失效检测方法,其特征在于:该方法中判断节点失效并产生失效节点信息的步骤包括
(1)存储集群系统中每个节点周期性的按轮询方式从成员列表P1,即保存正常节点的ID号和相关信息的列表中选取一个成员并发送心跳消息,存储节点I向存储节点J发送心跳消息,心跳消息用来确认存储节点J是否失效,消息格式是ping(I;J;timestampe),若存储节点J正常工作,在收到存储节点I的心跳消息之后马上回复ack消息,遍历完成员列表P1后,以随机方式重新排序成员列表P1;
(2)若在规定时间内,存储节点I收到存储节点J的回复ack消息,则进行步骤3;否则,认为存储节点J失效,生成失效节点信息,进行步骤5;
(3)根据接收到恢复ack消息和发送ping消息的时间差值,计算得到时间差T,并加入到W列表中,若T大于回复的平均时间间隔,则进行步骤4;否则,进行步骤5;所述W列表是一个长度固定为L的列表,保存最近收到存储节点J应答的L个心跳消息的检测时间,用来计算本步骤所述的回复的平均时间间隔;
(4)存储节点I从成员列表P1中随机选择M个存储节点,并向M个存储节点发送ping-req消息,ping-req的消息格式为(I;J;Timestampe),I表示发送请求消息的节点,J表示希望其他存储节点帮助检测的可能失效的存储节点,Timestampe记录了发送消息的时间信息;该消息用来向成员列表P1中的存储节点确认存储节点J是否真正的失效了,若在规定时间N内存储节点I没有收到任何一个存储节点的ack消息,则认为存储节点J失效,生成失效节点信息,进行步骤5;否则,至少收到一个存储节点ack消息,说明存储节点J正常;
(5)程序结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于楚云汉智武汉网络存储系统有限公司,未经楚云汉智武汉网络存储系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210259254.6/1.html,转载请声明来源钻瓜专利网。