[发明专利]一种linux系统下的故障内存位置定位方法在审
申请号: | 201310112243.X | 申请日: | 2013-04-02 |
公开(公告)号: | CN103198000A | 公开(公告)日: | 2013-07-10 |
发明(设计)人: | 李斌;任华进 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种linux系统下的故障内存位置定位方法,该方法不依赖于主板bmc对内存故障的判断和记录,利用系统产生的mcelog记录,配合实际物理槽位比对关系,快速判断故障内存错误类型和故障位置,快速解决由于内存故障导致的服务器死机、蓝屏等问题,相比目前的内存故障判断判断方法具有:1.不依赖于主板bmc对内存故障跟踪和定位功能。2.不需要现场重复压力测试,等待故障出现和交换内存测试定位故障内存位置,可以依据已经生成的mcelog日志,快速判断故障出现频率、故障原因和故障位置。3.实现方式简单,提高判断解决问题的效率。 | ||
搜索关键词: | 一种 linux 系统 故障 内存 位置 定位 方法 | ||
【主权项】:
一种linux系统下的故障内存位置定位方法, 其特征在于具体步骤如下:1)故障平台安装Linux系统,平台及软件安装配置要求:mcelog支持平台要求32 bit x86 Linux:Redhat 6.0版本以上支持,需使用源码,编译安装;64 bit x86_64 Linux:Redhat 5.0版本以上提供rpm包,默认不安装,需指定安装,从hardware monitoring 选项卡中查找;如果要随机器启动,请使用 chkconfig 命令;Chkconfig –‑add mcelogdChkconfig –‑level 5 mcelogd onService mcelogd restartMcelog 相关文件设备文件/dev/mcelog日志文件/var/log/mcelog配置文件/etc/mcelog/mcelog.conf2)客户系统应用或使用内存压力测试工具;3)MCA MCE MCELOG原理说明如下:在计算机中,机器校验架构MCA是指在操作系统中CPU报告硬件错误的一种机制,是cpu的一个ras特性;当一个ECC错误产生的时,位于cpu中的特定模型寄存器MSRs会检测到有错误产生,将会触发MCA机制;而后产生一个系统中断,并将由特定模型寄存器MSRs记录下当时各种状态信息,交给操作系统处理,使用MCElog软件解析错误出现的方式,位置以及状态的信息;MCA的错误报告类型:有简单错误和复杂错误两种错误类型,这些错误类型通过获取 IA32_Mci_Status MSR状态信息产生,并比对错误代码和具体信息对照表获得相应的错误信息:寄存器信息和具体表现含义对照表:MCE:机器校验异常MCE是一类由硬件错误触发的异常,是一种当计算机硬件错误时发生的由一台计算机的CPU检测的硬件问题,当 CPU 检测到总线,CHIPSET,内存,CACHE硬件出现致命错误时会触发这类异常,这些错误对系统的稳定性危害极大而且无法恢复,会触发系统的复位操作, MCA 架构,OS根据不同的错误源产生的错误类别,错误的严重程度,选择隔离错误,记录错误,甚至屏蔽错误源或重启系统,所以,利用新的MCA架构记录MCE信息,生成mcelog进行故障分析:MCELOG:MCELOG 是 x86 的 Linux 系统上用来检查硬件错误,特别是内存和CPU错误的工具,且产生日志位置:/var/log/mcelog;日志中记录内存故障发生时间、频率、故障类型及故障内存位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310112243.X/,转载请声明来源钻瓜专利网。