[发明专利]一种用于运维数据的无监督异常检测和鲁棒趋势预测方法有效
申请号: | 202010746722.7 | 申请日: | 2020-07-29 |
公开(公告)号: | CN111913849B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 赵万磊;陈润青;王菡子 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06N3/04;G06N3/08 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 数据 监督 异常 检测 趋势 预测 方法 | ||
1.一种用于运维数据的无监督异常检测和鲁棒趋势预测方法,其特征在于包括以下步骤:
1)模型设计:变分自编码器作为异常检测模块,为模型的前半部分;长短时记忆网络作为趋势预测模块,为模型的后半部分;
所述模型设计的具体方法为:
在变分自编码器中,编码器由三层全连接层构成,xt通过编码器表示出μz和σz,之后采样出z,最后通过解码器解码重构出x't,解码器是与编码器所对称的结构,损失函数如下:
在长短时记忆网络中,x't作为其输入,在最后通过一个全连接层映射到单实值yt,作为本时刻对下一时刻的状态预测值,损失函数如下:
在模型训练过程中,上述两个模块的损失函数需要进行平衡,所以总损失函数为:
2)数据预处理:原始运维时序数据经历数据补全,归一化处理,以及采用滑动窗口将数据分割成固定长度的时序段输入到模型;
所述数据预处理采用如下数据预处理步骤清洗原始时间序列R:
2.1给定原始的时间序列R={r1,…,rt,…,rn},对于缺失值,采用相邻周期的插值方法进行填充;具体地,对于缺失长度小于或等于M,采用相邻点的状态值进行一阶线性插值填充;对于缺失长度大于M,采用相邻周期的相同时刻的状态值进行一阶线性插值填充;
2.2对于填充后的时间序列,基于序列的均值和方差进行归一化;
2.3对于归一化后的时间序列,采用大小为w0,步幅为1的滑动窗口进行切分;每个分段表示为所有分段集合表示为w0为常数,分钟数据取值为120,小时数据取值为30;
2.4每L个连续分段被认为是一个分段序列送入所述模型进行训练;
3)异常检测:采用变分自编码器重构输入的时序段,从而分离出异常点,达到异常检测的目的;
所述异常检测的具体方法为:对于t时刻的分段xt,将其作为模型的输入,得到的异常检测模块的输出x't的最后状态值,与输入xt的最后状态值相比,若偏差的绝对值大于kσr,则被认为异常,否则被认为正常;其中,k为常数,而σr为这些偏差绝对值的标准差;
4)趋势预测:将自编码器重构的时序段输入到趋势预测模块,预测下一时刻的状态值;
所述趋势预测的具体方法为:变分自编码器的输出,x't作为长短时记忆网络的输入,在最后通过一个全连接层映射到单实值yt,作为本时刻对下一时刻的状态预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010746722.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置