[发明专利]一种面向实时云平台的故障检测与容错方法及系统有效
申请号: | 201310681028.1 | 申请日: | 2013-12-12 |
公开(公告)号: | CN103716182A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 张闯;李钊;徐克付;张鹏 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种面向实时云平台的故障检测与容错方法及系统,包括发送命令,提交任务,并将分配给工作节点的任务存储在相应路径下的客户端;用于监控各工作节点的运行状态,根据工作节点上传的心跳信息进行节点级故障检测与容错,执行故障节点中任务的迁移的全局状态监控模块;用于存储全局状态监控模块和各个工作节点的工作状态及心跳信息的全局状态存储模块;用于执行任务,运行守护进程来守护工作进程,并执行程序级故障检测与容错的工作节点;本发明中使整个集群的状态信息全部存储在Zookeeper系统中,实现节点的无状态架构,节点故障不会造成状态丢失,具有完善的故障检测与容错机制,实现多级容错,保障实时业务的不间断运行。 | ||
搜索关键词: | 一种 面向 实时 平台 故障 检测 容错 方法 系统 | ||
【主权项】:
一种面向实时云平台的故障检测与容错方法,其特征在于,包括如下步骤:步骤1:客户端向全局状态存储模块发送待处理的任务,并将分配给各个工作节点的任务存储到全局状态存储模块的相应路径下;步骤2:所述各工作节点每隔心跳时间到全局状态存储模块相应路径下,检测是否有待执行的任务,一旦发现新任务,便启动工作进程运行相应任务;步骤3:所述每个工作节点内运行一个守护进程来守护在执行任务的工作进程,并执行程序级故障检测与容错;步骤4:全局状态监控模块每隔心跳时间到全局状态存储模块中检查每个工作节点上传的心跳信息,并根据心跳信息进行节点级故障检测与容错。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310681028.1/,转载请声明来源钻瓜专利网。
- 上一篇:一套用于蜡糊提纯精制糠蜡的设备
- 下一篇:无线送电方法