[发明专利]一种消除故障内存对系统影响的方法及装置在审
申请号: | 201811348057.5 | 申请日: | 2018-11-13 |
公开(公告)号: | CN109408273A | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 刘浩君 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 刘雪萍 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内存 故障日志 物理页面 系统影响 捕获 进程 服务器 维护服务器 保证系统 发生故障 故障信息 内存故障 容错能力 允许系统 自动运行 检测 宕机 操作系统 闲置 记录 纠正 恢复 维护 | ||
本发明公开一种消除故障内存对系统影响的方法及装置,当有内存发生故障时,启动MCA Recovery进程,生成故障日志,并捕获受影响的物理页面;MCA Recovery进程根据故障日志和所捕获受影响的物理页面,恢复操作系统正常执行。本发明在检测到内存故障时,自动运行MCA Recovery进程,该进程使服务器具备容错能力,允许系统在检测到未纠正错误时继续运行,保证系统不宕机,维护服务器业务的正常运行;同时,记录下故障信息,在在服务器闲置的时候,针对故障做更换和维护,提高产品的质量及稳定性。
技术领域
本发明涉及内存故障领域,具体涉及一种消除故障内存对系统影响的方法及装置。
背景技术
内存对服务器的稳定性及其重要,但内存在使用中经常会出现各种故障,造成系统宕机,通常需要重启服务器或更换内存才可解决问题,使系统恢复正常执行,这严重影响服务器运行,给业务操作带来不便。
发明内容
为解决上述问题,本发明提供一种消除故障内存对系统影响的方法及装置,允许系统不宕机,维护服务器业务的正常运行。
本发明的技术方案是:一种消除故障内存对系统影响的方法,包括:
初始化操作系统;
检测是否有内存发生故障;
当有内存发生故障时,启动MCA Recovery进程,生成故障日志,并捕获受影响的物理页面;
MCA Recovery进程根据故障日志和所捕获受影响的物理页面,恢复操作系统正常执行。
进一步地,所述MCA Recovery进程根据故障日志和所捕获受影响的物理页面映射,恢复操作系统正常执行,包括:
MCA Recovery进程将故障信息通知操作系统;
操作系统分析故障日志,并验证恢复是否可行;
若恢复可行,将受影响的物理页面做离线处理后,将此物理页面加载到新的物理页面,恢复操作系统正常执行。
进一步地,所述操作系统分析故障日志,并验证恢复是否可行,包括:
检查内存故障原因,判断故障原因是否满足恢复条件,若满足恢复条件,则恢复可行。
进一步地,所述初始化操作系统,包括:
开启操作系统Poison模式;
开启MCELOG守护进程;
初始化EIGN。
本发明还公开一种消除故障内存对系统影响的装置,包括:
初始化模块:用于初始化操作系统;
故障检测模块:用于检测是否有内存发生故障;
故障响应模块:用于当有内存发生故障时,启动MCA Recovery进程,生成故障日志,并捕获受影响的物理页面;
恢复操作系统模块:用于MCA Recovery进程根据故障日志和所捕获受影响的物理页面,恢复操作系统正常执行。
进一步地,所述恢复操作系统模块,包括:
故障信息通知子模块:用于MCA Recovery进程将故障信息通知操作系统;
故障日志分析子模块:用于操作系统分析故障日志,并验证恢复是否可行;
恢复执行子模块:用于恢复可行时,将受影响的物理页面做离线处理后,将此物理页面加载到新的物理页面,恢复系统正常执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811348057.5/2.html,转载请声明来源钻瓜专利网。