[发明专利]BMC主进程故障诊断方法、装置、设备及可读存储介质在审
申请号: | 201910463811.8 | 申请日: | 2019-05-30 |
公开(公告)号: | CN110187996A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 翟振辉 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主进程 重启 故障诊断 可读存储介质 准确度 异常信息 日志 服务器管理系统 故障诊断装置 实时获取系统 系统信息变化 系统异常信息 读取 运行稳定性 故障分析 故障信息 故障原因 日志文件 系统异常 系统重启 原因分析 状态监测 保存 看门狗 运维 监控 帮助 | ||
本发明公开了一种BMC主进程故障诊断方法,通过对目标BMC下的AST看门狗进行状态监测,在WDT监控到BMC系统主进程IPMIMain发生异常后、系统重启之前进行BMC系统异常信息的收集并生成日志,可以实时获取系统故障信息,避免重启之后系统信息变化影响故障分析准确度,保存异常信息到本地日志文件能够在再次重启后通过读取保存的异常信息日志进行BMC系统异常重启原因分析,帮助用户和运维人员查看BMC异常重启的故障原因,增加了服务器管理系统故障诊断的准确度,提升了BMC主进程运行稳定性。本发明还公开了一种BMC主进程故障诊断装置、设备及一种可读存储介质,具有上述有益效果。
技术领域
本发明涉及服务器管理领域,特别涉及一种BMC主进程故障诊断方法、装置、设备及一种可读存储介质。
背景技术
BMC(Baseboard Management Controller,基板管理控制器)是服务器特有的管理控制器,BMC可以自动监控服务器运行状态,并及时根据当前状态进行调控,对服务器日常运行起着至关重要的作用。
然而目前只有针对BMC主进程故障的系统宕机恢复机制,但是无法找到宕机原因,这会导致同样的问题多次发生,严重影响系统正常运行,影响用户体验。
因此,如何提升BMC主进程运行稳定性,从而进一步提升系统运行稳定性,是本领域技术人员需要解决的技术问题。
发明内容
本发明的目的是提供一种BMC主进程故障诊断方法,该方法可以提升BMC主进程运行稳定性,从而进一步提升系统运行稳定性;本发明的另一目的是提供一种BMC主进程故障诊断装置、设备及一种可读存储介质。
为解决上述技术问题,本发明提供一种BMC主进程故障诊断方法,包括:
对目标BMC下的AST看门狗进行状态监测;
当监测到BMC系统主进程异常时,采集系统运行信息,得到异常信息记录文件;
保存所述异常信息记录文件;
根据所述异常信息记录文件进行BMC主进程故障诊断。
可选地,所述BMC系统主进程异常的判定方法,包括:
当监测到所述AST看门狗启动超时预中断时,判定BMC系统主进程异常;
则相应地,所述对目标BMC下的AST看门狗进行状态监测具体为:实时判断看门狗预中断函数是否发送SIGIO信号。
可选地,所述实时判断看门狗预中断函数是否发送SIGIO信号,包括:
调用延时睡眠函数每隔预设时间判断看门狗预中断函数是否发送SIGIO信号。
可选地,所述BMC主进程故障诊断方法还包括:
当所述异常信息记录文件保存完成时,发送强制BMC系统重启指令。
可选地,当监测到BMC系统主进程异常时,采集系统运行信息,包括:
当监测到BMC系统主进程异常时,采集系统CPU、内存、运行时间、交换分区、执行的线程信息、系统内存使用状况信息、文件系统的磁盘空间占用情况信息、网络接口配置信息、网口0和网口1的基本设置信息、当前运行的所有进程信息、硬盘及分区信息以及网络状态信息。
本发明公开一种服务器故障处理装置,包括:
看门狗监测单元,用于对目标BMC下的AST看门狗进行状态监测;
信息采集单元,用于当监测到BMC系统主进程异常时,采集系统运行信息,得到异常信息记录文件;
文件存储单元,用于保存所述异常信息记录文件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910463811.8/2.html,转载请声明来源钻瓜专利网。