[发明专利]一种集群数据处理系统中的在线故障容错方法有效
申请号: | 201310577099.7 | 申请日: | 2013-11-18 |
公开(公告)号: | CN103678051A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 高越;陈彦斌;刘焱;吴唯然;孟祥国 | 申请(专利权)人: | 航天恒星科技有限公司 |
主分类号: | G06F11/20 | 分类号: | G06F11/20 |
代理公司: | 中国航天科技专利中心 11009 | 代理人: | 安丽 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种集群数据处理系统中的在线故障容错方法,包括以下步骤:步骤1:前一级处理节点将处理结果以文件碎片方式存储;步骤2:下一级处理节点读取文件碎片继续处理;步骤3:使用数据库记录每个节点上处理的文件碎片标记;步骤4:当检测到节点故障时,启动新节点代替故障节点工作;步骤5:新节点从数据库中读取故障节点上的文件碎片,恢复故障现场。本发明实现了数据处理过程中的故障容错。 | ||
搜索关键词: | 一种 集群 数据处理系统 中的 在线 故障 容错 方法 | ||
【主权项】:
一种集群数据处理系统中的在线故障容错方法,其特征在于包括以下步骤:(1)将集群数据处理系统按照数据处理流程划分为多级计算环节,每级计算环节通过其中的计算节点协同完成;(2)将上一级计算环节的结果以文件碎片方式存储,用于实现各级计算节点之间的数据传递工作;(3)下一级计算节点读取步骤(2)中文件碎片存储的结果进行计算并存储为下一级计算节点使用;(4)集群数据处理系统记录每级计算节点的运行状态以及每级计算节点与文件碎片的对应关系;(5)根据步骤(4)中集群数据处理系统记录的运行状态对计算节点进行检测,当检测到计算节点发生故障时,进行任务分配判断,若为故障计算节点正在执行的任务,则进入步骤(6);若为故障计算节点待执行的任务,则进入步骤(7);(6)启动备份计算节点代替故障计算节点进行正在执行的任务的处理并进入步骤(8);(7)将故障计算节点需要承担的待执行的任务分散到其他的计算节点上来完成进入步骤(9);(8)备份计算节点从数据库恢复故障现场,读取正在执行的任务对应的文件碎片,用于代替故障节点继续工作,实现整个集群数据系统在运行过程中的在线故障恢复进入步骤(9);(9)结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天恒星科技有限公司,未经航天恒星科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310577099.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种物联网家庭终端机
- 下一篇:数据恢复方法及设备