[发明专利]一种服务器温度故障诊断方法、装置、存储介质及系统有效
申请号: | 202111208041.6 | 申请日: | 2021-10-15 |
公开(公告)号: | CN113971101B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 叶琴;陈才;张坤;陈彪;毛长雨 | 申请(专利权)人: | 飞腾信息技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/30 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
地址: | 300450 天津市滨海新*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 服务器 温度 故障诊断 方法 装置 存储 介质 系统 | ||
本发明公开了一种服务器温度故障诊断方法、装置、存储介质及系统,包括:获取服务器内被监测芯片的结温;将所述结温与预设的温度阈值进行比较;当所述结温大于所述温度阈值时,获取所述被监测芯片的功耗;将所述功耗与预设的功耗阈值进行比较;当所述功耗大于所述功耗阈值时,判定温度故障原因为芯片功耗过高;当所述功耗不大于所述功耗阈值时,获取所述被监测芯片的壳温和所述服务器的进风温度,至少根据所述壳温和所述进风温度计算获得所述被监测芯片的芯片热阻,根据芯片热阻和预设的热阻阈值诊断温度故障原因。采用本发明的技术方案能够实现服务器的温度故障检测以及对故障原因进行自动排查,并且操作简单,节省时间及人力成本。
技术领域
本发明涉及服务器散热技术领域,尤其涉及一种服务器温度故障诊断方法、装置、计算机可读存储介质及系统。
背景技术
目前,市面上的大部分服务器能够通过温度传感器检测其芯片温度信息,以通过温度检测判断服务器是否出现温度故障问题,但是,采用温度检测的方法只能发现温度故障问题,并不能自动排查温度故障原因,当发现服务器温度异常时,需要专业工程师进行现场故障排查,并且还需要进行关闭服务器、拆卸散热器、在相应测点开槽安装热电偶等操作才能判断温度故障位置及原因,费时费力,操作麻烦。
发明内容
本发明实施例所要解决的技术问题在于,提供一种服务器温度故障诊断方法及系统,能够实现服务器的温度故障检测以及对故障原因进行自动排查,并且操作简单,节省时间及人力成本。
为了解决上述技术问题,本发明实施例提供了一种服务器温度故障诊断方法,包括:
获取服务器内被监测芯片的结温;
将所述结温与预设的温度阈值进行比较;
当所述结温大于所述温度阈值时,获取所述被监测芯片的功耗;
将所述功耗与预设的功耗阈值进行比较;
当所述功耗大于所述功耗阈值时,判定温度故障原因为芯片功耗过高;
当所述功耗不大于所述功耗阈值时,获取所述被监测芯片的壳温和所述服务器的进风温度,至少根据所述壳温和所述进风温度计算获得所述被监测芯片的芯片热阻,根据芯片热阻和预设的热阻阈值诊断温度故障原因。
进一步地,所述获取服务器内被监测芯片的结温,具体包括:
根据预设的时间周期获取所述被监测芯片的当前结温;
根据所述当前结温和已经获取的N1个历史结温进行求平均值处理,相应获得所述结温;其中,N1>0;
所述获取所述被监测芯片的功耗,具体包括:
根据预设的时间周期获取所述被监测芯片的当前功耗;
根据所述当前功耗和已经获取的N2个历史功耗进行求平均值处理,相应获得所述功耗;其中,N2>0;
所述获取所述被监测芯片的壳温和所述服务器的进风温度,具体包括:
根据预设的时间周期获取所述被监测芯片的当前壳温和所述服务器的当前进风温度;
根据所述当前壳温和已经获取的N3个历史壳温进行求平均值处理,相应获得所述壳温;其中,N3>0;
根据所述当前进风温度和已经获取的N4个历史进风温度进行求平均值处理,相应获得所述进风温度;其中,N4>0。
进一步地,所述芯片热阻包括壳环热阻和结壳热阻,所述热阻阈值包括第一热阻阈值和第二热阻阈值;
则,所述至少根据所述壳温和所述进风温度计算获得所述被监测芯片的芯片热阻,根据芯片热阻和预设的热阻阈值诊断温度故障原因,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于飞腾信息技术有限公司,未经飞腾信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111208041.6/2.html,转载请声明来源钻瓜专利网。