[发明专利]一种双控集群故障恢复的方法、系统及设备有效
申请号: | 202011033849.0 | 申请日: | 2020-09-27 |
公开(公告)号: | CN111984474B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 张孙旻 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F11/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王晓坤 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 集群 故障 恢复 方法 系统 设备 | ||
本申请公开了一种双控集群故障恢复的方法,包括:确定后发生故障的控制器为第一控制器,确定先发生故障的控制器为第二控制器;控制第一控制器获取第一内存中的固化信息进行恢复,并将第一控制器中的配置信息同步到业务端,以恢复业务端的io业务;当业务端的io业务处理完成后,将第一控制器中的固化信息同步到第二控制器中,并控制第一控制器和第二控制器同时恢复业务流程。本申请降低了数据恢复的难度,并使得两个控制器不会因业务端io业务的不同而导致数据不同,进而保证了双控制器集群的两个控制器都出现故障时,恢复的数据在双控间的一致性及可靠性。本申请还提供了一种双控集群故障恢复的系统、设备及可读存储介质,具有上述有益效果。
技术领域
本申请涉及集群故障恢复领域,特别涉及一种双控集群故障恢复的方法、系统、设备及可读存储介质。
背景技术
为了提高存储系统的可用性,保障业务的连续性,人们设计了集群存储系统,集群内的各控制器节点通过网络等手段进行通信。目前使用最广泛的是由两个控制器组成的双控制器集群。双控制器集群的后端存储介质是通过光纤或SAS链路共享磁盘阵列的逻辑卷,或是通过SAS链路共享expander上的磁盘,前端业务则是通过以太网或光纤,使用nfs、cifs、scst等协议,提供文件级或块级的存储导出服务。
双控制器集群有两种工作模式,一种是active-standby模式:集群中的两个控制器一个为主控制器,另一个为备控制器。应用程序主要运行在主控制器上,当主控制器出现故障时,通知备控制器接管原先在主控制器上的业务,以使业务不间断;另一种是active-active模式:集群中的两个控制器同时对外提供业务,两个控制器互为主备,一个控制器出现故障后,将其上的业务切换到另一个控制器上。
然而,当双控制器集群的两个控制器都出现故障时,现有技术无法保证恢复的数据在双控间具有一致性及可靠性。
因此,如何保证恢复的数据在双控间具有一致性及可靠性是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种双控集群故障恢复的方法、系统、设备及可读存储介质,用于保证恢复的数据在双控间具有一致性及可靠性。
为解决上述技术问题,本申请提供一种双控集群故障恢复的方法,该方法包括:
确定后发生故障的控制器为第一控制器,确定先发生故障的控制器为第二控制器;
控制所述第一控制器获取第一内存中的固化信息进行恢复,并将所述第一控制器中的配置信息同步到业务端,以恢复所述业务端的io业务;
当所述业务端的io业务处理完成后,将所述第一控制器中的固化信息同步到所述第二控制器中,并控制所述第一控制器和所述第二控制器同时恢复业务流程。
可选的,将所述第一控制器中的配置信息同步到业务端,以恢复所述业务端的io业务,包括:
将所述业务端的各个模块设置为单控制器处理模式,所述业务端包括位图数据模块、元数据模块、垃圾回收模块中的至少一项;
将所述第一控制器中的配置信息同步到所述业务端的各个模块,以恢复所述业务端的io业务。
可选的,控制所述第一控制器和所述第二控制器同时恢复业务流程,包括:
将所述业务端的各个模块设置为双控制器处理模式,并控制所述第一控制器和所述第二控制器同时恢复业务流程。
可选的,所述固化信息包括所述配置信息、元数据和位图数据,将所述第一控制器中的固化信息同步到所述第二控制器中,包括:
将所述第一控制器中的配置信息同步到所述第二控制器中,并控制所述第二控制器将第二内存中的元数据和位图数据丢弃;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011033849.0/2.html,转载请声明来源钻瓜专利网。