[发明专利]一种基于深度学习的云主机故障智能预测方法有效
| 申请号: | 201910350560.2 | 申请日: | 2019-04-28 |
| 公开(公告)号: | CN111638988B | 公开(公告)日: | 2023-05-12 |
| 发明(设计)人: | 沙泉 | 申请(专利权)人: | 上海伽易信息技术有限公司 |
| 主分类号: | G06F11/07 | 分类号: | G06F11/07 |
| 代理公司: | 上海宏京知识产权代理事务所(普通合伙) 31297 | 代理人: | 邓文武 |
| 地址: | 200000 上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 主机 故障 智能 预测 方法 | ||
本发明提供一种基于深度学习的云主机故障智能预测方法,涉及电信领域,所述方法包括步骤1:采集多维度的数据源,所述数据源包括实时数据和历史数据;步骤2:对多维度的数据源进行降维分析,确定核心指标变量;步骤3:构建故障智能预测模型,进行历史数据的离线训练和实时数据的在线训练;步骤4:输出云主机智能预警信息,评估故障智能预测模型预测效果。本发明利用Keras框架深度学习构建基于云主机的智能故障预测模型,通过离线训练和在线训练结合,准确预测云主机可能发生的故障,提升云主机的智能化运维能力,实现云主机的运维从“事后”向“事前”发展,使得维护变得更加主动,能够满足实时性较高的业务需求。
技术领域
本发明涉及电信领域,尤其涉及一种基于深度学习的云主机故障智能预测方法。
背景技术
传统云主机的运维模式是网管系统发现主机告警后,通知维护人员进行维修,属于事后的人工修复,故障响应时间较长;并且维修人员需要耗费大量的人力进行故障查证,维护效率较低;此外,不具有故障智能预警功能,一旦出现严重故障,则会影响正常运行,维护较为被动,难以满足实时性较高的业务需求。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于深度学习的云主机故障智能预测方法,能够提升云主机的智能化运维能力,实现故障智能预警,使得维护变得更加主动,能够满足实时性较高的业务需求。
本发明提供一种基于深度学习的云主机故障智能预测方法,所述方法包括以下步骤:
步骤1:采集多维度的数据源,所述数据源包括实时数据和历史数据;
步骤2:对多维度的数据源进行降维分析,确定核心指标变量;
步骤3:构建故障智能预测模型,进行历史数据的离线训练和实时数据的在线训练;
步骤4:输出云主机智能预警信息,评估故障智能预测模型预测效果。
进一步的,通过在云主机部署Probe探针程序获取实时数据,包括云主机的CPU、内存、磁盘、进程、网络相关指标数据。
进一步的,通过在云桌面导出历史数据,包括云主机的CPU、内存、磁盘、进程、网络相关指标数据。
进一步的,所述步骤3具体步骤如下:
步骤3.1:将历史数据的核心指标变量的时序数据按照时间片段T进行划分,得到
其中,所述xm表示每个核心指标变量在时刻t的值,M表示核心指标变量维度的个数,n表示第n天,m表示第m个核心指标变量;
步骤3.2:计算每个时间片段T内,每个核心指标变量的均值方差Stdm=||{xm,t}-Avgm||2;
步骤3.3:计算一天内均值Avgm的方差,Stdm的均值;
步骤3.4:整合每个核心指标变量的Avgm、Stdm、Avgm的方差、Stdm的均值构成测试集;步骤3.5:将测试集中的特征输入到故障智能预测模型,结合网管系统输出的云主机真实告警信息作为标签进行训练;
步骤3.6:将实时数据的核心指标变量输入到故障智能预测模型,得到云主机故障标签。
进一步的,所述时间片段T为1小时。
进一步的,所述步骤4具体步骤如下:
步骤4.1:基于云主机故障标签输出云主机智能预警信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海伽易信息技术有限公司,未经上海伽易信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910350560.2/2.html,转载请声明来源钻瓜专利网。





