[发明专利]针对MySQL Galera集群故障的检测和恢复方法及系统在审
申请号: | 202010434125.0 | 申请日: | 2020-05-21 |
公开(公告)号: | CN111597079A | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 宋伟;蔡卫卫;谢涛涛;李敏;申嘉童 | 申请(专利权)人: | 山东汇贸电子口岸有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F11/30 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 mysql galera 集群 故障 检测 恢复 方法 系统 | ||
1.针对MySQL Galera集群故障的检测和恢复方法,其特征在于,
包括以下步骤:
(1)MySQL Galera集群节点运行监测采集程序,同时监测服务端有针对MySQL集群各节点的数据网连通探测;
(2)每3秒采集周期采集监测指标数据上报监控服务端;
(3)对采集数据分析判断出故障类型并触发告警;
(4)通过Restful API调用传递到故障分类处理,判断出对节点的处理动作包括网络持续丢包或不通,发出告警;集群数据不一致则根据判定出的节点进行逐步处理;若MySQL数据库节点系统异常则进行节点的机器的重启;
(5)在故障处理完成后,对MySQL Galera集群的可用性进行验证,包括:wsrep_cluster_size=3、wsrep_cluster_status=Primary、wsrep_ready=On数据值是否正常,集群节点间uuid、seqno是否一致;
(6)验证服务组件连接数据库是否正常,包括对数据库进行查询及测试数据写入验证。
2.根据权利要求1所述的方法,其特征在于,
所述步骤(2)采集数据特指针对MySQL Galera集群状态参数及可用性的关键指标,包括MySQL服务状态、网络连通性、MySQL进程状态、wsrep_cluster_size、wsrep_cluster_status、wsrep_ready uuid、seqno。
3.根据权利要求1所述的方法,其特征在于,
所述步骤(3)异常检测,包括:MySQL服务是否正常、进程ID是否存在、wsrep_cluster_size、wsrep_cluster_status、wsrep_ready数据值是否正常、集群各节点uuid、seqno是否一致。
4.根据权利要求1所述的方法,其特征在于,
所述步骤(4)故障分类处理,对运行MySQL Galera服务的节点进行重启、集群不一致时按照恢复程序进行节点重启操作的步骤如下:
停止集群所有MySQL服务;备份seqno的值最大的节点的my.cnf文件;修改seqno的值最大的节点的my.cnf的wsrep_cluster_address=gcomm://值,启动seqno值最大的节点MySQL服务,启动正常后逐个启动剩余节点;最后关闭seqno的值最大的节点,恢复my.cnf文件,启动MySQL服务。
5.根据权利要求1所述的方法,其特征在于,
所述步骤(5)恢复检测,指对MySQL Galera集群的MySQL数据库状态、集群数据的一致性进行检测,确保MySQL Galera集群恢复正常且可用。
6.根据权利要求1所述的方法,其特征在于,
所述步骤(6)服务检测验证,指对使用MySQL作为数据库存储系统的业务应用进行数据库查询及数据写入操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东汇贸电子口岸有限公司,未经山东汇贸电子口岸有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010434125.0/1.html,转载请声明来源钻瓜专利网。