[发明专利]一种自主式实现批量BMC自恢复的方法及系统在审
申请号: | 201810969921.7 | 申请日: | 2018-08-24 |
公开(公告)号: | CN109240851A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 伯绍文 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F11/30;G06F11/32 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 刘雪萍 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自恢复 重启 恢复程序 自主式 触发 报错信息 程序监测 监控程序 健康状态 实时监控 再次检测 自动判断 重启动 散热 两级 服务器 上报 输出 监控 检测 | ||
本发明提供一种自主式实现批量BMC自恢复的方法及系统,包括如下步骤:步骤1:监控BMC的功能;若BMC功能异常步骤2,否则执行步骤1;步骤2:触发一级恢复程序进行BMC软重启;BMC软重启后,再次检测到BMC带外异常执行步骤3,否则执行步骤1;步骤3:触发二级恢复程序进行BMC冷重启动作,若BMC冷重启后检测BMC功能异常执行步骤4,否则执行步骤1;步骤4:输出报错信息。一种自动判断BMC失效并实现自恢复的方法,通过监控程序实时监控每台服务器BMC的健康状态,当程序监测到BMC异常时,通过两级自恢复动作实现BMC的自恢复,解决了BMC出现故障时无法第一时间得到处理,从而导致散热失效、故障得不到上报等问题。
技术领域
本发明涉及服务器技术领域,具体涉及一种自主式实现批量BMC自恢复的方法及系统。
背景技术
随着互联网大数据和云计算的发展,客户采购服务器的数量日趋庞大,客户面对数以万计的机房,对运维工作提出了极大的挑战,几万台甚至几十万台服务器中可能有不同厂商,不同型号,客户一般会通过访问服务器的BMC来对每台服务器进行监控,BMC作为服务器平台管理的“大脑”,在客户运维环境中起着至关重要的作用。
当程序监测到BMC异常时无法第一时间得到处理,从而导致散热失效、故障得不到上报等问题。
发明内容
为了克服上述现有技术中的不足,本发明提供一种自主式实现批量BMC自恢复的方法及系统,以解决上述技术问题。
本发明的技术方案是:
一种自主式实现批量BMC自恢复的方法,包括如下步骤:
监控BMC的功能;
若BMC功能异常,触发一级恢复程序进行BMC软重启;
BMC软重启后,再次检测到BMC带外异常;
触发二级恢复程序进行BMC冷重启动作。
进一步的,步骤触发二级恢复程序进行BMC冷重启动作之后还包括:
BMC冷重启后BMC还无响应,输出报错信息。
进一步的,步骤监控BMC的功能,具体包括:
对测试机进行参数配置;
从配置文件中自动识别解析使每台监控设备生成的设定数量的变量参数;
设置监控脚本给测试机分发任务实现BMC批量监控。
进一步的,步骤对测试机进行参数配置中,参数包括:
BMC IP、用户名、密码和OS IP、用户名、密码。
进一步的,步骤从配置文件中自动识别解析使每台监控设备生成的设定数量的变量参数中,生成的变量参数的数量为6个,分别为被监控服务器BMC的变量$IP、被监控服务器BMC的用户名$USER、被监控服务器BMC的密码$PASSWD、、被监控服务器OS的变量$IP1、被监控服务器OS的用户名$USER1、被监控服务器OS的密码$PASSWD1。
进一步的,步骤设置监控脚本给测试机分发任务实现BMC批量监控,具体实现过程:
每隔设定时间间隔向被监控的服务器发送一条IPMI命令,通过判断命令的返回值来对BMC的功能异常情况进行监控。
进一步的,步骤设置监控脚本给测试机分发任务实现BMC批量监控,具体实现过程:
每隔5秒向被监控服务器发送一条IPMI命令;
若60秒没内没有收到返回信息,则判定BMC功能异常。
进一步的,步骤若BMC功能异常,触发一级恢复程序进行BMC软重启包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810969921.7/2.html,转载请声明来源钻瓜专利网。