[发明专利]一种内存错误的处理方法、装置及介质在审
| 申请号: | 202211624996.4 | 申请日: | 2022-12-16 |
| 公开(公告)号: | CN116382948A | 公开(公告)日: | 2023-07-04 |
| 发明(设计)人: | 贾帅帅;李道童;艾山彬;陈衍东 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
| 主分类号: | G06F11/07 | 分类号: | G06F11/07 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张珊珊 |
| 地址: | 215100 江苏省苏州*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 内存 错误 处理 方法 装置 介质 | ||
本发明公开了一种内存错误的处理方法、装置及介质,适用于计算机技术领域。获取内存CE故障的内存数据,其中内存数据由内存CE故障开始后采集的故障数据,内存数据为CE数据;根据内存数据的数据特性设定对应的处理策略;当内存数据满足预设条件时,则根据预设条件对应的处理策略对满足预设条件的内存数据进行隔离处理。通过CE数据的内存数据满足预设条件时,则根据预设条件对应的处理策略对满足预设条件的内存数据进行隔离处理,并不是对所有CE数据进行处理,当满足预设条件时也就意味着CE数据将要产生UCE数据,对易产生UCE的内存数据采取故障隔离措施。在避免系统宕机的同时,也节省内存空间和系统资源,提高系统的性能。
技术领域
本发明涉及计算机技术领域,特别是涉及一种内存错误的处理方法、装置及介质。
背景技术
内存错误是系统错误中最常见的一种,大致分为两种:可纠正错误(CorrectableError,CE)和不可纠正错误(Uncorrectable Error,UCE)。当CE产生以后如果不做处理就会演变成UCE,若演变成UCE,则会导致系统宕机。
现有的为了避免系统宕机,会在生成CE时直接进行隔离处理,此时会减少内存空间,同时对系统的资源造成浪费,也会影响系统的性能问题。
因此,如何节省系统资源的同时减少CE的隔离处理是本领域技术人员亟需要解决的。
发明内容
本发明的目的是提供一种内存错误的处理方法、装置及介质,对易产生UCE的内存数据采取故障隔离措施。在避免系统宕机的同时,也节省内存空间和系统资源,提高系统的性能。
为解决上述技术问题,本发明提供一种内存错误的处理方法,包括:
获取内存CE故障的内存数据,其中所述内存数据由所述内存CE故障开始后采集的故障数据,所述内存数据为CE数据;
根据所述内存数据的数据特性设定对应的处理策略;
当所述内存数据满足预设条件时,则根据所述预设条件对应的所述处理策略对满足所述预设条件的所述内存数据进行隔离处理。
优选地,所述根据所述内存数据的数据特性设定对应的处理策略,包括:
当所述内存数据的数据特性存在一种变量因素时,则确定所述处理策略为最小二乘法策略;
当所述内存数据的数据特性存在多种变量因素且所述内存数据为连续数据时,则确定所述处理策略为所述最小二乘法策略与决策树策略;
当所述内存数据的数据特性存在多种变量因素且所述内存数据为离散数据时,则确定所述处理策略为所述决策树策略;
其中,所述内存数据的所述变量因素至少包括历史cell故障次数、故障cell所在内存ROW错误次数、故障cell所在内存cache line错误次数、故障cell相邻column cell故障次数、故障cell相邻Row的cell故障次数、内存寿命和cell演变成uce数据。
优选地,所述最小二乘法策略的确定过程,包括:
采集UCE故障发生的历史数据;
根据所述历史数据截取所述内存CE故障到所述UCE故障发生之前的故障数据;
根据所述故障数据划分目标故障数据和有效故障数据;
对所述有效故障数据进行最小二乘法处理得到预设拟合曲线。
优选地,所述预设条件为所述内存数据对应的实际拟合曲线均大于所述预设拟合曲线,所述根据所述预设条件对应的所述处理策略对满足所述预设条件的所述内存数据进行隔离处理,包括:
根据所述内存数据进行所述最小二乘法处理得到所述实际拟合曲线;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211624996.4/2.html,转载请声明来源钻瓜专利网。





