[发明专利]用于服务器集群故障诊断的处理方法、处理装置、及处理设备、用于服务器故障诊断的方法及计算机可读存储介质有效
申请号: | 202110322834.4 | 申请日: | 2021-03-25 |
公开(公告)号: | CN112988444B | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 曾令新;林哲伟;严勇;李小龙 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王娟 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 服务器 集群 故障诊断 处理 方法 装置 设备 计算机 可读 存储 介质 | ||
公开了一种用于服务器集群故障诊断的处理方法、处理装置、处理设备、和计算机可读存储介质。本公开的实施例通过对造成自动诊断失败的故障类型进行梳理,将由于信息不全或多部件报错导致无法自动诊断的故障通过诊断失败信息进行实时上报并进入自动化处理流程,从而使得自动诊断失败故障处理更加快速且高效。此外,该处理方法通过在历史操作信息中基于诊断失败信息所包含的关键字来实现对自动诊断结果的区分与统计,提高了数据统计的可行性,并且通过线上系统对接服务器供应商以进行数据的实时反馈与记录,有利于服务器后续版本的自动诊断能力的提升和优化。
技术领域
本公开涉及服务器集群管理工具领域,并且更具体地,涉及一种用于服 务器集群故障诊断的处理方法、处理装置、处理设备和计算机可读存储介质。
背景技术
随着服务器在各种应用场景中的重要作用所带来的服务器保有量的增加, 在服务器不断负载运行的同时,不可避免地会出现各种故障问题。例如,处 理器内部错误引起的服务器故障可能导致诸如服务器死机、异常重启等问题。 因此,如何有效发现并解决服务器故障问题,即对服务器故障进行自动化识 别与处理,对于服务器的正常运行来说非常重要。
其中,随着服务器中硬件故障自动明确化率的提升,对于导致自动诊断 失败的故障也愈发关注,然而,由于当前故障自动诊断失败或成功时,服务 器均输出指示故障报错的日志,而自动诊断失败的故障相较于自动诊断成功 的故障所输出的日志并无相应的显式指示,造成服务器运维人员无法监控自 动诊断失败的故障,而是需要对发生故障的所有服务器进行逐台分析以确定 发生自动诊断失败故障的服务器,给海量服务器运营带来了极大不便。此外, 为了提升自动诊断成功率,需要收集并统计自动诊断失败的案例并反馈至服 务器供应商,但是由于难以通过日志快速确定这些案例,而是需要通过穷举 所有指示故障报错的日志来从中确定失败的比例,也为数据统计带来一定挑 战。
因此,需要一种能够快速高效识别并处理自动诊断失败故障的方法。
发明内容
为了解决上述问题,本公开通过将自动诊断失败的故障通过诊断失败信 息进行实时上报并进入自动化处理流程,从而使得自动诊断失败故障处理更 加快速且高效。
本公开的实施例提供了涉及一种用于服务器集群故障诊断的处理方法、 处理装置、处理设备、和计算机可读存储介质。
本公开的实施例提供了一种用于服务器集群故障诊断的处理方法,包括: 响应于所述服务器集群中出现发生灾难性故障的服务器,在所述服务器中执 行自动诊断;在所述自动诊断失败的情况下,在所述服务器输出的实时操作 信息中添加诊断失败信息,其中,所述诊断失败信息包括与所述自动诊断失 败对应的诊断失败关键字,并且所述诊断失败关键字用于指示所述灾难性故 障;基于所述诊断失败信息中的所述诊断失败关键字,从所述实时操作信息 中筛选出所述诊断失败信息,并对所述诊断失败信息进行分析;以及基于分 析结果,确定对所述服务器的所述故障的处理方式。
本公开的实施例提供了一种用于服务器故障诊断的方法,包括:响应于 所述服务器发生灾难性故障,在所述服务器中执行自动诊断;以及在所述自 动诊断失败的情况下,在所述服务器输出的实时操作信息中添加诊断失败信 息,其中,所述诊断失败信息包括与所述自动诊断失败对应的诊断失败关键 字,并且所述诊断失败关键字用于指示所述灾难性故障。
本公开的实施例提供了一种用于服务器集群故障诊断的处理方法,包括: 从所述服务器集群中所包括的至少一个发生灾难性故障的服务器接收实时操 作信息,其中,所述实时操作信息中包括诊断失败信息,所述诊断失败信息 包括与所述自动诊断失败对应的诊断失败关键字,并且所述诊断失败关键字 用于指示所述灾难性故障;基于所述诊断失败信息中的所述诊断失败关键字, 从所述实时操作信息中筛选出所述诊断失败信息,并对所述诊断失败信息进 行分析;以及基于分析结果,确定对所述服务器的所述故障的处理方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110322834.4/2.html,转载请声明来源钻瓜专利网。