[发明专利]一种linux系统下的故障内存位置定位方法在审
申请号: | 201310112243.X | 申请日: | 2013-04-02 |
公开(公告)号: | CN103198000A | 公开(公告)日: | 2013-07-10 |
发明(设计)人: | 李斌;任华进 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 linux 系统 故障 内存 位置 定位 方法 | ||
1.一种linux系统下的故障内存位置定位方法, 其特征在于具体步骤如下:
1)故障平台安装Linux系统,平台及软件安装配置要求:
mcelog支持平台要求
32 bit x86 Linux:Redhat 6.0版本以上支持,需使用源码,编译安装;
64 bit x86_64 Linux:Redhat 5.0版本以上提供rpm包,默认不安装,需指定安装,从hardware monitoring 选项卡中查找;
如果要随机器启动,请使用 chkconfig 命令;
Chkconfig –-add mcelogd
Chkconfig –-level 5 mcelogd on
Service mcelogd restart
Mcelog 相关文件
设备文件/dev/mcelog
日志文件/var/log/mcelog
配置文件/etc/mcelog/mcelog.conf
2)客户系统应用或使用内存压力测试工具;
3)MCA MCE MCELOG原理说明如下:
在计算机中,机器校验架构MCA是指在操作系统中CPU报告硬件错误的一种机制,是cpu的一个ras特性;当一个ECC错误产生的时,位于cpu中的特定模型寄存器MSRs会检测到有错误产生,将会触发MCA机制;而后产生一个系统中断,并将由特定模型寄存器MSRs记录下当时各种状态信息,交给操作系统处理,使用MCElog软件解析错误出现的方式,位置以及状态的信息;
MCA的错误报告类型:
有简单错误和复杂错误两种错误类型,这些错误类型通过获取 IA32_Mci_Status MSR状态信息产生,并比对错误代码和具体信息对照表获得相应的错误信息:
寄存器信息和具体表现含义对照表:
MCE:
机器校验异常MCE是一类由硬件错误触发的异常,是一种当计算机硬件错误时发生的由一台计算机的CPU检测的硬件问题,当 CPU 检测到总线,CHIPSET,内存,CACHE硬件出现致命错误时会触发这类异常,这些错误对系统的稳定性危害极大而且无法恢复,会触发系统的复位操作, MCA 架构,OS根据不同的错误源产生的错误类别,错误的严重程度,选择隔离错误,记录错误,甚至屏蔽错误源或重启系统,所以,利用新的MCA架构记录MCE信息,生成mcelog进行故障分析:
MCELOG:
MCELOG 是 x86 的 Linux 系统上用来检查硬件错误,特别是内存和CPU错误的工具,且产生日志位置:/var/log/mcelog;日志中记录内存故障发生时间、频率、故障类型及故障内存位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310112243.X/1.html,转载请声明来源钻瓜专利网。