[发明专利]一种服务器启动过程中的故障定位方法、系统及装置有效
申请号: | 202110326285.8 | 申请日: | 2021-03-26 |
公开(公告)号: | CN113064747B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 韩红瑞 | 申请(专利权)人: | 山东英信计算机技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 侯珊 |
地址: | 250001 山东省济南市高新区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 服务器 启动 过程 中的 故障 定位 方法 系统 装置 | ||
本发明公开了一种服务器启动过程中的故障定位方法、系统及装置,预先将服务器的整个启动过程划分为多个阶段,并相应为每个阶段设定故障监控策略;在服务器的启动过程进入目标阶段时,按照目标阶段对应的故障监控策略监控服务器当前的启动过程,得到目标阶段对应的故障监控结果;在服务器启动失败时,根据得到的故障监控结果进行服务器的故障定位。可见,本申请对服务器启动过程中的各个阶段都进行了故障监控,有助于服务器启动过程的故障定位。
技术领域
本发明涉及服务器运维领域,特别是涉及一种服务器启动过程中的故障定位方法、系统及装置。
背景技术
随着数据中心的规模越来越大,千万台级别的服务器给运维工作带来巨大的挑战,智能运维被越来越多的提出。目前,服务器启动异常在每个数据中心都存在,由于服务器的整个启动过程包含的阶段较多,现有的服务器启动过程中的故障监控方案大都是局部阶段的故障监控,无法完整监控到服务器的整个启动过程,导致故障定位效果较差。
因此,如何提供一种解决上述技术问题的方案是本领域的技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种服务器启动过程中的故障定位方法、系统及装置,对服务器启动过程中的各个阶段都进行了故障监控,有助于服务器启动过程的故障定位。
为解决上述技术问题,本发明提供了一种服务器启动过程中的故障定位方法,包括:
预先将服务器的整个启动过程划分为多个阶段,并相应为每个阶段设定故障监控策略;
在所述服务器的启动过程进入目标阶段时,按照所述目标阶段对应的故障监控策略监控所述服务器当前的启动过程,得到所述目标阶段对应的故障监控结果;其中,所述目标阶段为任一阶段;
在所述服务器启动失败时,根据得到的故障监控结果进行所述服务器的故障定位。
优选地,将服务器的整个启动过程划分为多个阶段的过程,包括:
将服务器的整个启动过程划分为上电模式进入阶段、硬件上电阶段、BIOS自检阶段、BIOS运行阶段及OS启动阶段。
优选地,所述服务器包括用于接收电源按键的按键信号,并将所述按键信号透传至ME单元的CPLD;还包括用于在接收到所述按键信号后,返回上电启动信号至CPLD以完成所述上电模式进入阶段的ME单元;
相应的,为所述上电模式进入阶段设定故障监控策略的过程,包括:
从所述CPLD接收到所述按键信号时开始计时,判断在计时时间到达预设时间T0时,所述ME单元是否发出上电启动信号;
若是,则确定所述ME单元运行正常;
若否,则确定所述ME单元运行失败。
优选地,所述服务器还包括通过通道切换器件与所述ME单元连接、用于存储ME镜像文件的存储芯片;
所述服务器启动过程中的故障定位方法还包括:
在确定所述ME单元运行失败后,判断是否可获取到所述ME单元的运行状态;
若可获取到,则在所述运行状态存在异常时确定所述ME单元存在运行异常的情况;
若不可获取到,则判断所述存储芯片的供电电压是否正常;
若供电电压异常,则确定所述存储芯片的周围电路异常;
若供电电压正常,则确定所述存储芯片的周围电路正常,并通过控制所述通道切换器件与所述存储芯片建立通信,判断是否可正常访问到所述存储芯片;
若不可正常访问到,则确定所述存储芯片异常;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东英信计算机技术有限公司,未经山东英信计算机技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110326285.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服务器固件自恢复系统及服务器
- 下一篇:移动式氨基酸粉生产设备