[发明专利]ARM架构服务器的内存CE错误上报方法、系统、装置及介质在审
| 申请号: | 202211049535.9 | 申请日: | 2022-08-30 |
| 公开(公告)号: | CN115391081A | 公开(公告)日: | 2022-11-25 |
| 发明(设计)人: | 刘宾 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
| 主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F9/48 |
| 代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 徐槐 |
| 地址: | 215100 江苏省苏州*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | arm 架构 服务器 内存 ce 错误 上报 方法 系统 装置 介质 | ||
本发明提出的一种ARM架构服务器的内存CE错误上报方法、系统、装置及介质,所述方法包括:在ARM架构服务器内准备MEI卡治具环境;通过ipmi协议打开BMC debug串口,并使用GPIO tool将SCP打开;通过MEI卡治具搭配预设脚本向内存槽位注入内存CE错误;介入SCP中断上报机制,以进行内存CE错误上报;检查操作系统和BMC,并查看BMC日志。本发明通过打开BMC Debug串口,在串口中通过GPIO工具设置SCP的高低电平,将SCP打开,之后使用MEI治具通过脚本模拟向内存短时间内注入大量CE错误,由于介入了SCP间隔中断上报机制,可以有效的过滤错误日志,阻止大量错误报出,从而保障操作系统和BMC的正常运行。不影响客户使用。
技术领域
本发明涉及计算机技术领域,更具体的说是涉及一种ARM架构服务器的内存CE错误上报方法、系统、装置及介质。
背景技术
目前,搭载ARM处理器的服务器在市场上逐渐兴起,相比较Intel和AMD而言,ARM架构由于指令集少,所以执行效率高,加之成本较低逐渐受到客户青睐。但是由于ARM发展历程较短,一些处理机制上还存在一些缺陷。
在服务器运行过程中,因为某些异常情况,在短时间内内存会产生大量CE错误。此时,ARM架构服务器就没有办法短时间内处理掉这么多error,导致服务器操作系统宕机或者BMC监控系统崩溃,严重影响客户使用。
由于目前搭载ARM架构处理器的服务器暂无应对此种现象的处理机制,只能通过更换全部内存来解决此问题,从而造成了资源浪费。
发明内容
针对以上问题,本发明的目的在于提供一种ARM架构服务器的内存CE错误上报方法、系统、装置及介质。
本发明为实现上述目的,通过以下技术方案实现:一种ARM架构服务器的内存CE错误上报方法,包括:
在ARM架构服务器内准备MEI卡治具环境;
通过ipmi协议打开BMC debug串口,并使用GPIO tool将SCP打开;
通过MEI卡治具搭配预设脚本向内存槽位注入内存CE错误;
介入SCP中断上报机制,以进行内存CE错误上报;
检查操作系统和BMC,并查看BMC日志。
进一步,所述在ARM架构服务器内准备MEI卡治具环境,包括:
对ARM架构服务器断电,将MEI卡治具安装在ARM架构服务器的DIMM SLOT中,将内存插到MEI卡治具插槽中,然后将MEI卡上电,使用USB线连接MEI卡和主机端。
进一步,所述通过ipmi协议打开BMC debug串口,并使用GPIO tool将SCP打开,包括:
ARM架构服务器上电开机,进入操作系统,并通过ipmi协议打开BMC debug串口;连接BMC串口登入BMC debug console开启功能,使用GPIO tool将SCP打开,并修改内存错误日志上报策略。
进一步,所述通过MEI卡治具搭配预设脚本向内存槽位注入内存CE错误,包括:
执行命令python.exe Error_inject_loop_DDR4_rev2.py single read_write10000 60,在60秒内向MEI卡治具所在内存槽位注入10000条内存CE错误。
进一步,所述检查操作系统和BMC,并查看BMC日志,包括:
检查操作系统和BMC,若未出现宕机或者挂死现象,通过查看BMC日志获取上报的内存CE错误日志。
进一步,所述内存错误日志上报策略,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211049535.9/2.html,转载请声明来源钻瓜专利网。





