[发明专利]一种内存故障的预警方法及装置在审
申请号: | 202010767747.5 | 申请日: | 2020-08-03 |
公开(公告)号: | CN113297046A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 陈品安;张羽中;李昕;何诚;王式文;杜垠 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F11/34 | 分类号: | G06F11/34 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 任媛;刘铁生 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 内存 故障 预警 方法 装置 | ||
本发明公开了一种内存故障的预警方法及装置,涉及计算机技术领域,本发明的主要目的在于从多个维度描述内存工作状态所对应的特征,以此预测内存是否存在故障风险。本发明主要的技术方案为:获取设备的异常日志;基于所述异常日志中的内存异常日志按照预设时间段分析所述内存异常日志的时序变化特征;基于所述异常日志中内存错误的地址信息统计所述设备中内存的运行状态特征;将所述时序变化特征与运行状态特征融合为内存故障预警特征;利用预警模型处理所述内存故障预警特征,得到所述设备的内存预警信息。
技术领域
本发明涉及计算机技术领域,尤其涉及一种内存故障的预警方法及装置。
背景技术
在大规模数据中心中,维护服务器稳定性是至关重要的,其中,内存故障会导致服务器性能下降甚至引发宕机,极大影响服务器的可靠性。而主动容错技术是提高数据中心和系统稳定性的重要手段,故障预测作为主动容错技术的重要方面,研究通过监控服务器当前以及历史的状态判断其是否会在未来一定时间内发生失效,从而提高系统可靠性。
由于内存故障导致宕机的比例已经超过其他硬件故障比例,如CPU、硬盘等故障造成的宕机,因此,准确的预警内存故障,从而进行业务迁移,可有效的降低服务器不可用带来的损失同时提升系统可靠性。目前,内存故障预警主要是基于对机器的异常日志进行分析,预测内存在未来一段时间内的工作状态。但是,由于异常日志中并非是全部是内存异常的日志,同时,基于大量异常日志的解析对计算资源的要求较高,因此,现有的内存故障预警方案的预测准确性以及适用的场景都存在一定的缺陷,亟需一种更为高效准确的内存故障预警解决方案。
发明内容
鉴于上述问题,本发明提出了一种内存故障的预警方法及装置,主要目的在于从多个维度描述内存工作状态所对应的特征,以此预测内存是否存在故障风险。
为达到上述目的,本发明主要提供如下技术方案:
一方面,本发明提供一种内存故障的预警方法,具体包括:
获取设备的异常日志;
基于所述异常日志中的内存异常日志按照预设时间段分析所述内存异常日志的时序变化特征;
基于所述异常日志中内存错误的地址信息统计所述设备中内存的运行状态特征;
将所述时序变化特征与运行状态特征融合为内存故障预警特征;
利用预警模型处理所述内存故障预警特征,得到所述设备的内存预警信息。
另一方面,本发明提供一种内存故障的预警装置,具体包括:
获取单元,用于获取设备的异常日志;
第一确定单元,用于基于所述获取单元得到的异常日志中的内存异常日志按照预设时间段分析所述内存异常日志的时序变化特征;
第二确定单元,用于基于所述获取单元得到的异常日志中内存错误的地址信息统计所述设备中内存的运行状态特征;
融合单元,用于将所述第一确定单元得到的时序变化特征与第二确定单元得到的运行状态特征融合为内存故障预警特征;
预警单元,用于利用预警模型处理所述融合单元得到的内存故障预警特征,得到所述设备的内存预警信息。
另一方面,本发明提供一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述的内存故障的预警方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010767747.5/2.html,转载请声明来源钻瓜专利网。