[发明专利]分布式文件系统集群节点的数据恢复方法、装置及介质有效
申请号: | 201811333895.5 | 申请日: | 2018-11-09 |
公开(公告)号: | CN109213637B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 李彦博 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 文件系统 集群 节点 数据 恢复 方法 装置 介质 | ||
本申请公开了一种分布式文件系统集群节点的数据恢复方法,包括:当集群节点出现故障时,获取集群节点中的故障OSD;判断故障OSD的数量与集群节点中的OSD总量的比值是否大于或等于预设阈值;若大于或等于,则保持故障OSD的故障状态。相较于现有技术中,当判断出故障OSD之后,则按照预设规则为故障OSD进行数据恢复操作,当存在大量的故障OSD时,需要恢复的数据量很大,从而影响前端业务的读写操作;本方法避免了数据恢复操作占用大量的带宽,进而降低对数据读写操作的影响,因此提高了分布式文件系统的稳定性。本申请还公开了一种分布式文件系统集群节点的数据恢复装置计算机可读存储介质,均具有上述有益效果。
技术领域
本发明涉及数据处理领域,特别涉及一种分布式文件系统集群节点的数据恢复方法、装置及计算机可读存储介质。
背景技术
近年来,分布式文件系统(DFS,Distributed File System)因其能够实现集中管理文件共享而受到越来越广泛的应用。在运行分布式文件系统的过程中,集群节点将不可避免地出现故障的情况。现有技术中,当分布式文件系统的集群节点出现故障时,如果在预设时间内该集群节点没有恢复正常工作,则将该集群节点中的故障OSD(Object-basedStorage Device,对象存储设备)设置为out状态,并触发数据恢复的流程,使得这些故障OSD在进行数据恢复之后重新添加至集群中。当集群节点中的故障OSD数量较多时,则为这些故障OSD进行数据恢复时,需要恢复的数据量较大,在这种情况下,由于集群带宽是固定的,在进行数据恢复的过程中将占用大量的带宽,从而减少了前端业务的读写操作能够使用的带宽,导致读写操作卡顿,甚至将导致整个分布式文件系统的死机。
因此,如何降低集群节点的数据恢复操作对分布式文件系统的影响,提高系统的稳定性是本领域技术人员目前需要解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种分布式文件系统集群节点的数据恢复方法,能够降低集群节点的数据恢复操作对分布式文件系统的影响,提高系统的稳定性;本发明的另一目的是提供一种分布式文件系统集群节点的数据恢复装置及计算机可读存储介质,均具有上述有益效果。
为解决上述技术问题,本发明提供一种分布式文件系统集群节点的数据恢复方法,包括:
当集群节点出现故障时,获取所述集群节点中的故障OSD;
判断所述故障OSD的数量与所述集群节点中的OSD总量的比值是否大于或等于预设阈值;
若大于或等于,则保持所述故障OSD的故障状态。
优选地,所述当集群节点出现故障时,获取所述集群节点中的故障OSD具体为:
当集群节点出现故障时,获取所述集群节点中的所述故障OSD并开始计时;
对应的,所述保持所述故障OSD的故障状态具体为:
利用初始计时时间更新所述故障OSD的计时时间以保持所述故障OSD的所述故障状态。
优选地,在所述判断所述故障OSD的数量与所述集群节点中的OSD总量的比值是否大于或等于预设阈值之后,进一步包括:
若小于,则判断所述故障OSD在预设时间阈值内是否开始正常工作;
若否,则复制与所述故障OSD对应的PG中的对象数据;
将所述对象数据存储至所述集群节点中除所述故障OSD之外的其他OSD中。
优选地,在所述判断所述故障OSD是否在预设时间阈值内开始正常工作之后,进一步包括:
若是,则判断与所述故障OSD对应的PG中的对象数据在计时过程中是否发生变化;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811333895.5/2.html,转载请声明来源钻瓜专利网。