[发明专利]一种集群的告警方法、装置、设置及存储介质在审
申请号: | 202010037379.9 | 申请日: | 2020-01-14 |
公开(公告)号: | CN111258851A | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 王玉君;毛茂德;王华夏;王兴刚 | 申请(专利权)人: | 广州虎牙科技有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/34 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 511400 广东省广州市番禺*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 集群 告警 方法 装置 设置 存储 介质 | ||
本发明实施例公开了一种集群的告警方法、装置、设置及存储介质。该方法通过检测在集群中部署的各资源的、针对运行故障的事件信息;基于预置的分发策略,确定所述事件信息所关联的目标用户;将所述事件信息分发至所述目标用户,以对所述资源进行针对所述运行故障的维护操作,解决因以分析同一监控指标来确定集群的监控状态所带来的过度监控、缺乏针对性的问题,实现增加对集群中各资源的运行故障进行维护操作的针对性,减少发现和修复运行故障的时间,增加集群正常运行的持续时间,减少集群宕机的频率。
技术领域
本发明实施例涉及集群的技术,尤其涉及一种集群的告警方法、装置、设置及存储介质。
背景技术
容器集群是部署有多个容器的计算机集群。在容器集群中的容器或微服务都可以接受管理并有序接入外部环境,从而实现调度、负载均衡以及分配等任务。
一般的,可以使用容器集群管理工具,对容器集群进行监控。该容器集群管理工具可以是Kubernetes,该Kubernetes简称K8s,是一个开源的、用于管理云平台中多个主机上的容器化的应用。容器集群管理工具主要的监控对象为集群中的容器单元(Pod)、宿主机、虚拟机以及集群的核心进程,监控的指标则可以包括中央处理单元(Central ProcessingUnit,CPU)、内存、磁盘输入输出(Input and Output,IO)、网络标识号、核心进程的性能指标等。
集群中的用户可以包括运维人员、开发人员等,专门负责对集群进行不同维度的维护操作,如开发人员对集群中的代码进行维护,运维人员对集群的配置进行维护。
但是,对集群进行维护操作的维度不同,所使用的监控指标不同,分析方式也不同。若所有用户使用同一收集的监控指标进行分析,容易造成对集群的过度监控,占用了过多的集群运算资源、存储资源等,却无法使得用户有针对性的对集群进行相应维度的维护操作,导致集群的维护具有高延迟、针对性差的问题。
发明内容
本发明提供一种集群的告警方法、装置、设置及存储介质,以实现增加对集群中各资源的运行故障进行维护操作的针对性,减少发现和修复运行故障的时间,增加集群正常运行的持续时间,减少集群宕机的频率。
第一方面,本发明实施例提供了一种集群的告警方法,该方法包括:
检测在集群中部署的各资源的、针对运行故障的事件信息;
基于预置的分发策略,确定所述事件信息所关联的目标用户;
将所述事件信息分发至所述目标用户,以对所述资源进行针对所述运行故障的维护操作。
进一步的,所述检测在集群中部署的各资源的、针对运行故障的事件信息,包括:
确定部署在所述集群中的资源;
以预置的检测方式检测所述资源所发生的运行故障的类型;
生成与所述类型的运行故障相匹配的事件信息。
进一步的,所述检测方式包括:监听方式;
所述以预置的检测方式检测所述资源所发生的运行故障的类型,包括:
在监听方式下,监听关于所述资源的运行状态发生变更的变更事件;
响应于所述变更事件,以获取所述资源在运行状态发生变更时的状态数据;
基于所述状态数据,确定所述资源所发生的运行故障的类型。
进一步的,所述资源包括容器单元,所述容器单元的运行状态包括:所述容器单元处于崩溃状态、进程退出状态、待定状态;
所述基于所述状态数据,确定所述资源所发生的运行故障的类型,包括:
从所述状态数据中确定所述资源所处的运行状态;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙科技有限公司,未经广州虎牙科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010037379.9/2.html,转载请声明来源钻瓜专利网。