[发明专利]一种服务器硬件故障的诊断方法、诊断装置及诊断设备有效
申请号: | 202011181637.7 | 申请日: | 2020-10-29 |
公开(公告)号: | CN112286709B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 于云杰;韩红瑞 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 史翠 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 服务器 硬件 故障 诊断 方法 装置 设备 | ||
本发明公开了一种服务器硬件故障的诊断方法,从多项电源的角度出发,根据各多项电源控制芯片的可读取报错信息进行判断,若与服务器部件对应的各多项电源控制芯片的可读取报错信息的类型均为报错,则确定服务器部件出现故障;若与服务器部件对应的各多项电源控制芯片的可读取报错信息的类型不均为报错,则确定服务器主板出现故障,从而可以高效地定位服务器硬件故障原因,大幅度提高运维人员解决问题的效率。本发明还公开了一种服务器硬件故障的诊断装置、诊断设备及计算机可读存储介质,具有上述有益效果。
技术领域
本发明涉及服务器监控技术领域,特别是涉及一种服务器硬件故障的诊断方法、诊断装置、诊断设备及计算机可读存储介质。
背景技术
近年随着信息技术的快速发展,数据处理量出现爆发式增长,数据中心的业务量急剧增加。数据中心的服务器数量也随之增加,近年来大型数据中心的服务器数量逐步达到了数万乃至十万台的量级,如何高效的运营维护这些服务器正常的工作以及当服务器出现问题时如何迅速定位问题快速维修是一个亟待解决的问题。然而,现有的服务器硬件故障定位方案通常是在服务器出现故障时,通过拆开机箱进行线下量测、分析的方式来定位故障,不仅浪费了大量人力,还导致服务器较长时间的中断运行。
发明内容
本发明的目的是提供一种服务器硬件故障的诊断方法、诊断装置、诊断设备及计算机可读存储介质,用于快速、自动化地定位服务器硬件的故障,节约人力成本。
为解决上述技术问题,本发明提供一种服务器硬件故障的诊断方法,包括:
获取各多项电源控制芯片的可读取报错信息;
若与服务器部件对应的各所述多项电源控制芯片的可读取报错信息的类型均为报错,则确定所述服务器部件出现故障;
若与所述服务器部件对应的各所述多项电源控制芯片的可读取报错信息的类型不均为报错,则确定服务器主板出现故障。
可选的,所述可读取报错信息的类型具体包括:电源欠压保护信息、输出项错误信息、输入欠压保护信息、输入过压保护信息、输出欠压保护信息、输出过压保护信息、输出过流保护信息、输出短路保护信息、过温保护信息和过温报警信息。
可选的,所述若与服务器部件对应的各所述多项电源控制芯片的可读取报错信息的类型均为报错,则确定所述服务器部件出现故障,具体为:
若与服务器部件对应的各所述多项电源控制芯片的可读取报错信息的类型均为报错,则根据与所述可读取报错信息的类型均为报错对应的所述多项电源控制芯片的地址确定出现故障的服务器部件。
可选的,还包括:
输出与服务器硬件故障类型对应的服务器硬件故障报警信号。
可选的,所述获取各多项电源控制芯片的可读取报错信息,具体为:
通过轮询的方式读取各所述多项电源控制芯片的可读取报错信息。
可选的,所述获取各多项电源控制芯片的可读取报错信息,具体为:
当接收到的复杂可编程逻辑器读取的电源正常信号为异常断电信号时,读取与所述异常断电信号对应的服务器部件处的各所述多项电源控制芯片的可读取报错信息。
可选的,所述诊断方法应用于基板管理控制器。
为解决上述技术问题,本发明还提供一种服务器硬件故障的诊断装置,包括:
获取单元,用于获取各多项电源控制芯片的可读取报错信息;
判断单元,用于在与服务器部件对应的各所述多项电源控制芯片的可读取报错信息的类型均为报错时,则确定所述服务器部件出现故障;在与所述服务器部件对应的各所述多项电源控制芯片的可读取报错信息的类型不均为报错,则确定服务器主板出现故障。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011181637.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种肢体周径测量器
- 下一篇:图像处理方法、装置、设备及介质