[发明专利]基于metaq集群的自动监控恢复方法有效
申请号: | 201711000405.5 | 申请日: | 2017-10-24 |
公开(公告)号: | CN107911230B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 谢二菊;周龙波 | 申请(专利权)人: | 丹露成都网络技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L29/08 |
代理公司: | 成都三诚知识产权代理事务所(普通合伙) 51251 | 代理人: | 成实;曾娟 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 metaq 集群 自动 监控 恢复 方法 | ||
1.基于metaq集群的自动监控恢复方法,其特征在于:包括以下步骤:
(1)进行前期准备;
(11)准备若干台部署有metaq的服务器并在该服务器上创建相应的业务topic,将部署有metaq的服务器组成一个集群;
(12)在每台metaq服务器上创建一个监控topic,且保证同一集群中的每台服务器上创建的监控topic均不相同;
(13)将集群中的所有业务topic都至少在两台metaq服务器上进行创建;
(14)将同一集群中的所有的metaq均注册到同一个zookeeper集群中;
(2)利用python语言编写一个能够实现metaq发送消息的客户端;
(3)将该客户端连接上该集群所注册的zookeeper集群;
(4)客户端从zookeeper集群中获取所有的监控topic以及每个监控topic所在的服务器的IP;
(5)客户端定时向每个监控topic发送一条空消息,若空消息全部发送成功则重复步骤(5),若有空消息发送失败则进行步骤(6);
(6)客户端统计发送空消息失败的监控topic,并在该监控topic所在的统计变量上将失败次数+1,若该监控topic的失败次数未到3次,则返回步骤(5),若该监控topic的失败次数到达3次或3次以上,则进行步骤(7);
(7)客户端检查失败3次或3次以上的监控topic所在服务器的上次重启时间,若重启时间与当前时间间隔未超过预设值则返回步骤(5),若重启时间与当前时间间隔超过预设值则进入步骤(8);
(8)客户端检查当前时间是否在维护时间段,若当前时间在维护时间段则返回步骤(5),若当前时间不在维护时间段则进行步骤(9);
(9)客户端调用失败3次或3次以上的监控topic所在服务器的系统命令以重启相应的metaq,并调用微信和邮件接口向预设的微信和邮箱发送告警信息,接着将该topic的失败次数信息清零并记录重启时间信息,最后再次返回步骤(5)。
2.根据权利要求1所述的基于metaq集群的自动监控恢复方法,其特征在于:所述步骤(5)中客户端发送空消息的频率默认为10秒一次,且具体时间频率能根据需求进行更改。
3.根据权利要求2所述的基于metaq集群的自动监控恢复方法,其特征在于:所述步骤(7)中的预设值为10分钟,且该预设置的时间长短需要根据实际需求进行调整,设置预设值时需要保证服务器在预设值中可以完成重启。
4.根据权利要求2所述的基于metaq集群的自动监控恢复方法,其特征在于:所述步骤(8)中的维护时间段是根据实际的维护需求进行确定的,维护时间段应选择在业务量较少的夜间或凌晨。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于丹露成都网络技术有限公司,未经丹露成都网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711000405.5/1.html,转载请声明来源钻瓜专利网。