[发明专利]一种服务器内存故障报警方法无效
申请号: | 201210033268.6 | 申请日: | 2012-02-15 |
公开(公告)号: | CN102609350A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 平原 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06F11/32 | 分类号: | G06F11/32;G06F11/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 服务器 内存 故障 报警 方法 | ||
技术背景
当前服务器系统中,现有技术只通过内存部件触发硬件故障电路信号,通过板载的LED进行故障指示,此类设计存在以下不足:
1、故障信息无法记录,一旦系统断电,本次开机发现的故障信息将会被清除;
2、系统能识别的故障种类有限:仅支持内存部件自身可检测的简单错误信息,例如内存温度过高、Error IO记录数量过高。但对于例如内存芯片产生故障、内存安装错误这类内存部件自身无法检测或报告的错误信息,服务器系统无法产生报警信息;
3、无法根据故障严重程度分级别进行报警。
发明内容
通过软件程序在服务器系统启动阶段识别内存错误信息,将信息传递给内嵌主板上的管理芯片进行分类判断并按级别报警,系统包括:故障信息识别单元(1)、错误信息数据库(2)、报警单元(3),其中:
故障信息识别单元(1)负责通过获取系统中内存部件发出的错误信息作为判断内存故障的依据;
错误信息数据库(2)负责收集传递内存错误信息;
报警单元(3)负责根据不同的错误信息判断选择不同的故障报警方式;
报警流程如下:
系统上电,检测错误信息库中是否存在历史错误,并检测故障是否仍存在,其中:
1)故障存在,把错误信息分类为不同的故障,根据不同的故障按照故障级别以不同的方式进行报警;
2)如果故障不存在,检测本次开机是否内存发错误信息,a) 内存发错误信息,错误信息被记录到错误信息数据库,把错误信息分类为不同的故障,根据不同的故障进行报警;b)不存在内存发错误信息,清除错误信息数据库中的历史数据。
本发明的优异效果是:报警单元以软件进程形式包含在BMC中的监控程序中,可根据错误信息数据库记录的错误数据进行故障报警分类,通过Debug数码灯、LED灯或者蜂鸣器,根据不同级别的错误严重程度进行分类报警。
在服务器系统中实施此类内存故障报警方法,可很大程度上可以提高系统的可靠性功能,方便维护,提升产品的整体形象。
附图说明
图1是本发明的报警流程图。
具体实施方式
参照附图对本发明的报警方法做以下详细的说明。
本发明的方法是将故障信息识别单元以软件进程形式包含在BIOS中,在系统启动时查询错误信息数据库的历史错误信息及本次开机时是否存在内存错误信息。
通过故障信息识别单元的软件检测,不仅可以识别出:(1)内存部件自身发出硬件故障电路信号,还可以检测出(2)内存芯片产生故障、内存安装错误此类内存部件自身无法触发的错误信息;故障信息识别单元(1)可以通过监控通道获得错误信息数据库(2)中或者当前启动过程中是否存在内存错误信息。
错误信息数据库记录在内嵌主板上的管理芯片(BMC)内的Flash中,当系统遇到断电时,错误信息仍可保存在Flash中不会丢失。以供系统在下次开机的时候检测上次发现的内存故障。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210033268.6/2.html,转载请声明来源钻瓜专利网。