[发明专利]ctdb服务健康状态监控方法、系统、装置及存储介质在审
申请号: | 202110839413.9 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113626238A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 董文华;张亚奇;李二明 | 申请(专利权)人: | 济南浪潮数据技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 赵阳 |
地址: | 250000 山东省济南市中国(山东)自由贸易*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | ctdb 服务 健康 状态 监控 方法 系统 装置 存储 介质 | ||
本发明提出的一种ctdb服务健康状态监控方法、系统、装置及存储介质,所述方法包括:监控并识别节点中ctdb的进程内部的异常行为:根据识别到的异常行为,按照预设评分机制对节点的ctdb服务进行健康状态评分,若节点的ctdb健康状态评分为0,则将该节点置为异常状态,并将该节点踢出集群;若集群内任一节点被置为异常状态的次数达到预设次数上限N,则先杀掉该节点的ctdb进程,再重启该节点的ctdb进程。本发明能够及时识别并处理ctdb服务的异常行为,有效避免ctdb服务行为异常引起的集群更大的损失。
技术领域
本发明涉及计算机技术领域,更具体的说是涉及一种ctdb服务健康状态监控方法、系统、装置及存储介质。
背景技术
ctdb(Cluster Trivial Database)是一种轻量级的集群数据库实现,是集群Samba的集群数据库组件,主要用于处理Samba的跨节点消息以及在所有集群节点上实现分布式的TDB数据库。CTDB的主要功能包括:提供TDB数据库的集群版本,并在节点故障时自动重建/恢复数据库;监视集群中的节点和每个节点上运行的服务;管理用于向客户端提供服务的公共IP地址池。现今,CTDB不仅支持管理Samba,而且也支持管理NFS、HTTPD、VSFTPD、ISCSI、WINBIND等应用。
ctdb服务模块能够在server san和对象存储等模块中作为简单的HA组件使用。ctdb提供的虚拟ip漂移、节点监控管理、模块监管等集群功能已经可以满足各种高可用项目场景。当出现宕机或者所监控的软件故障时,虚拟ip可以漂移到正常节点,保证该ip可以继续使用,继续提供服务。单节点故障发生后,虚拟ip漂移在1分钟以内。
在现有技术中,由于ctdb集群规模较大,每个节点中进程的异常行为很多,但是有些异常行为是进程内部存在的,我们无法在外部识别到这些异常,通常这些异常行为经过量变后会引起质变,从而将故障表现外在化,但此时已为时已晚,从而可能会造成集群的数据库存储出现严重问题。
因此,如何及时准确及时的监控ctdb服务的健康状态,是当前亟待解决的问题。
发明内容
针对以上问题,本发明的目的在于提供一种ctdb服务健康状态监控方法、系统、装置及存储介质,能够及时识别并处理ctdb服务的异常行为,有效避免ctdb服务行为异常引起的集群更大的损失。
本发明为实现上述目的,通过以下技术方案实现:一种ctdb服务健康状态监控方法,包括如下步骤:
S1:监控并识别节点中ctdb的进程内部的异常行为:
S2:根据识别到的异常行为,按照预设评分机制对节点的ctdb服务进行健康状态评分,若节点的ctdb健康状态评分为0,则将该节点置为异常状态,并将该节点踢出集群;
S3:若集群内任一节点被置为异常状态的次数达到预设次数上限N,则先杀掉该节点的ctdb进程,再重启该节点的ctdb进程。
进一步,所述节点中ctdb的进程内部的异常行为包括:申请内存失败、节点间网卡信息不同步、网络通信异常和数据库信息不同步。
进一步,所述步骤S2包括:
初始化节点的ctdb服务的健康状态评分;
若识别到节点中ctdb的进程内部的异常行为,将当前的健康状态评分减1;
若在预设间隔时间内,未识别到节点中ctdb的进程内部的异常行为,则初始化健康状态评分;
若当前节点的ctdb服务的健康状态评分为0,则将该节点置为异常状态,并将该节点踢出集群。
进一步,所述步骤S3包括:
集群内任一节点被置为异常状态后,将该节点的异常次数n加1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮数据技术有限公司,未经济南浪潮数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110839413.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种SAS扩展器的固件适配方法和装置
- 下一篇:抽真空装置