[发明专利]一种服务器启动过程中的故障定位方法、系统及装置有效
申请号: | 202110326285.8 | 申请日: | 2021-03-26 |
公开(公告)号: | CN113064747B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 韩红瑞 | 申请(专利权)人: | 山东英信计算机技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 侯珊 |
地址: | 250001 山东省济南市高新区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 服务器 启动 过程 中的 故障 定位 方法 系统 装置 | ||
1.一种服务器启动过程中的故障定位方法,其特征在于,包括:
预先将服务器的整个启动过程划分为多个阶段,并相应为每个阶段设定故障监控策略;
在所述服务器的启动过程进入目标阶段时,按照所述目标阶段对应的故障监控策略监控所述服务器当前的启动过程,得到所述目标阶段对应的故障监控结果;其中,所述目标阶段为任一阶段;
在所述服务器启动失败时,根据得到的故障监控结果进行所述服务器的故障定位;
其中,将服务器的整个启动过程划分为多个阶段的过程,包括:
将服务器的整个启动过程划分为上电模式进入阶段、硬件上电阶段、BIOS自检阶段、BIOS运行阶段及OS启动阶段;
所述服务器包括用于接收电源按键的按键信号,并将所述按键信号透传至ME单元的CPLD;还包括用于在接收到所述按键信号后,返回上电启动信号至CPLD以完成所述上电模式进入阶段的ME单元;
相应的,为所述上电模式进入阶段设定故障监控策略的过程,包括:
从所述CPLD接收到所述按键信号时开始计时,判断在计时时间到达预设时间T0时,所述ME单元是否发出上电启动信号;
若是,则确定所述ME单元运行正常;
若否,则确定所述ME单元运行失败;
所述服务器还包括通过通道切换器件与所述ME单元连接、用于存储ME镜像文件的存储芯片;
所述服务器启动过程中的故障定位方法还包括:
在确定所述ME单元运行失败后,判断是否可获取到所述ME单元的运行状态;
若可获取到,则在所述运行状态存在异常时确定所述ME单元存在运行异常的情况;
若不可获取到,则判断所述存储芯片的供电电压是否正常;
若供电电压异常,则确定所述存储芯片的周围电路异常;
若供电电压正常,则确定所述存储芯片的周围电路正常,并通过控制所述通道切换器件与所述存储芯片建立通信,判断是否可正常访问到所述存储芯片;
若不可正常访问到,则确定所述存储芯片异常;
若可正常访问到,则确定所述存储芯片正常,并判断是否可读取到所述存储芯片内的ME镜像文件;
若不可读取到,则确定所述存储芯片缺失所述ME镜像文件;
若可读取到,则对所述存储芯片内的ME镜像文件进行数据校验,若校验失败,则确定所述存储芯片内的ME镜像文件损坏,并根据系统备份的ME镜像文件重新刷写所述存储芯片,并重启系统;
若系统重启后依旧异常,则确定所述ME单元自身故障。
2.如权利要求1所述的服务器启动过程中的故障定位方法,其特征在于,所述服务器的供电系统包括PSU及与所述PSU连接、用于对应为所述服务器的各部件供电的多个VR供电芯片;
且所述CPLD还用于在接收到上电启动信号后发送主电使能信号至所述PSU,并在接收到所述PSU返回的PG信号后依次发送芯片使能信号至多个VR供电芯片,且在接收到所有VR供电芯片返回的PG信号后发出电源正常信号以完成所述硬件上电阶段;所述CPLD在版本更新后还用于在所述PSU或任一VR供电芯片未按时返回PG信号时,相应记录此异常情况到自身的状态寄存器,并依次控制已上电的VR供电芯片及PSU进行下电操作;
相应的,为所述硬件上电阶段设定故障监控策略的过程,包括:
从所述ME单元发出上电启动信号时开始计时,判断在计时时间到达预设时间T1时,所述CPLD是否发出电源正常信号;
若发出电源正常信号,则确定所述服务器的主板硬件上电正常;
若未发出电源正常信号,则确定所述服务器的主板硬件上电异常,并根据所述CPLD的版本号判断所述CPLD是否具有异常记录功能;
若具有异常记录功能,则读取所述CPLD的状态寄存器,以定位所述PSU或VR供电芯片的异常情况,并在VR供电芯片有异常情况时,根据异常的VR供电芯片的寄存器状态分析异常的VR供电芯片的故障原因;
若不具有异常记录功能,则读取所述PSU和VR供电芯片的状态寄存器,以定位所述PSU或VR供电芯片的异常情况,并在VR供电芯片有异常情况时,根据异常的VR供电芯片的寄存器状态分析异常的VR供电芯片的故障原因。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东英信计算机技术有限公司,未经山东英信计算机技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110326285.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服务器固件自恢复系统及服务器
- 下一篇:移动式氨基酸粉生产设备