[发明专利]一种集群以及异常断电重启集群的方法、系统以及介质在审
| 申请号: | 202010177218.X | 申请日: | 2020-03-13 |
| 公开(公告)号: | CN111400095A | 公开(公告)日: | 2020-07-10 |
| 发明(设计)人: | 胡玉鹏;亓开元;文钧正 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
| 主分类号: | G06F11/14 | 分类号: | G06F11/14 |
| 代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 刘小峰 |
| 地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 集群 以及 异常 断电 方法 系统 介质 | ||
本发明公开了一种集群,集群包括若干个节点和修复装置,每一个节点包括代理装置;修复装置配置为:建立与每一个节点的代理装置的连接;基于在预设时间段内循环获取的每一个节点的代理装置发送的信息以及预先存储的信息判断是否与每一个节点的代理装置连接成功;响应于与每一个节点的代理装置连接成功,获取每一个节点的代理装置发送的每一个节点的参数;基于参数以及预设策略确定主节点;指示主节点的代理装置以主节点模块启动主节点;响应于接收到主节点的代理装置发送的启动成功的消息,指示其他节点的代理装置启动其他节点。本发明还公开了一种异常断电重启集群的方法、系统以及介质。本发明提出的方案实现了集群自动恢复。
技术领域
本发明涉及集群领域,具体涉及一种集群以及异常断电重启集群的方法、系统以及介质。
背景技术
出于高可用的考虑,MariaDB集群通常有3台服务器组成高可用集群,提供云平台其他组件的数据查询与数据写入。当MariaDB集群正常离线1-2台服务器时,集群可正常提供服务,当MariaDB集群全部正常离线时,再恢复的时候,MariaDB也可自动恢复,提供服务,但是在异常离线,比如机房突然断电,这种情况下,MariaDB将无法自动恢复,出现集群不可用的状态,这是因为异常断电下,3个节点在上电启动后,彼此不知道谁在本地存储的数据是最新的,进一步将导致云平台不能正常运转,因此无法确定主节点进而无法引导另外的两个节点重建集群。
发明内容
有鉴于此,为了克服上述问题的至少一个方面,本发明实施例提出一种集群,所述集群包括:
若干个节点,每一个所述节点包括代理装置;以及
修复装置,所述修复装置具有处理器和存储器,存储器存储有处理器可执行指令,指令被处理器执行时实现以下步骤:
建立与所述每一个节点的代理装置的连接;
基于在预设时间段内循环获取的所述每一个节点的代理装置发送的信息以及预先存储的信息判断是否与所述每一个节点的代理装置连接成功;
响应于与所述每一个节点的代理装置连接成功,获取所述每一个节点的代理装置发送的所述每一个节点的参数;
基于所述参数以及预设策略确定主节点;
指示所述主节点的代理装置以主节点模块启动所述主节点;
响应于接收到所述主节点的代理装置发送的启动成功的消息,指示其他节点的代理装置启动其他节点。
在一些实施例中,获取所述每一个节点的代理装置发送的所述每一个节点的参数,进一步包括:
所述代理装置对相应的节点的grastate.dat文件和gvwstate.dat文件进行解析以获取每一个节点对应序列号、my_uuid和view_id。
在一些实施例中,基于所述参数以及预设策略确定主节点,进一步包括:
判断所述序列号的大小;
响应于只有一个节点的所述序列号最大,则将所述序列号最大的节点作为主节点;
响应于多个节点的所述序列号相同且最大,将所述my_uuid与所述view_id相同的节点作为主节点。
在一些实施例中,所述修复装置还配置为:
响应于与节点未连接成功,通过邮件将未连接成功的节点的相关信息发送于管理员。
基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提出一种异常断电后重启集群的方法,包括以下步骤:
建立与所述集群中的每一个节点的连接;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010177218.X/2.html,转载请声明来源钻瓜专利网。





