[发明专利]一种多维时间序列异常检测方法及检测系统在审
| 申请号: | 202011060906.4 | 申请日: | 2020-09-30 |
| 公开(公告)号: | CN112163020A | 公开(公告)日: | 2021-01-01 |
| 发明(设计)人: | 金耀辉;何浩;李龙元;黄宗源 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62 |
| 代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 张宁展 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 多维 时间 序列 异常 检测 方法 系统 | ||
1.一种多维时间序列异常检测方法,其特征在于,包括:
将观测时间结合时间序列数据的观测频率,生成时间序列特征;对于受到外部影响的时间序列,将生成的时间序列特征结合额外采集的外部影响数据,生成外部变量;将生成的外部变量进行标准化统一数据尺度,完成对时间序列数据的增强;
根据时间序列数据切分规则,将时间序列数据切分为多个时间片段数据,将多个时间片段数据根据采集时间互相重叠,得到多个连续的多维时间序列片段数据,完成对时间序列数据的切分;
通过对时间序列数据的增强和/或切分,得到包含异常值的多个时间序列片段;
构建无监督时间序列异常检测模型,利用建立的所述模型从包含异常值的多个时间序列片段数据中,学习正常数据的特征,并根据学习的特征重构正常的时间序列数据,给出重构出正常时间序列数据的概率分布;给定学习到的模型,从重构的正常时间序列数据池中随机抽取训练样本,在时间序列平滑假设的正则约束下优化模型参数,使得模型能够重构出正常的时间序列数据,完成模型训练;
给定新观测数据,通过采样的方式得出重构出新正常时间序列数据的概率分布;
根据重构出新正常时间序列数据的概率分布,计算输入的时间序列数据的异常值,并提供异常检测阈值,进而根据异常检测阈值判断某段时间序列数据是否为异常片段。
2.根据权利要求1所述的多维时间序列异常检测方法,其特征在于,所述时间序列数据包括如下任意一种或任意多种:
-多维时间序列数据;
-含有缺失值的时间序列数据;
-长时间序列数据。
3.根据权利要求2所述的多维时间序列异常检测方法,其特征在于,所述长时间序列数据是指超过1万个时间点的序列数据。
4.根据权利要求1所述的多维时间序列异常检测方法,其特征在于,所述时间序列数据切分规则,包括:时间序列数据的维度和片段长度、切分采样是否具有重叠以及重叠的密度。
5.根据权利要求1所述的多维时间序列异常检测方法,其特征在于,所述时间片段数据的元数据信息包括:能够描述与观测时间序列对应的人类活动相关特征以及与待检测异常相关的时间相关特征。
6.根据权利要求1所述的多维时间序列异常检测方法,其特征在于,所述在时间序列平滑假设的正则约束下优化模型参数,包括:
根据输入时间序列数据的平滑度进行判断,给出对应的平滑参数,并根据平滑参数设定模型训练时采用的平滑正则进行优化。
7.根据权利要求1-6任一项所述的多维时间序列异常检测方法,其特征在于,所述构建无监督时间序列异常检测模型,采用基于变分自编码器的时间序列模型构建无监督时间序列异常检测模型。
8.根据权利要求7所述的多维时间序列异常检测方法,其特征在于,所述无监督时间序列异常检测模型采用循环神经网络编码器,将包含异常值的多个时间序列片段数据映射为低维随机特征向量,根据低维随机特征向量的重构出正常时间序列数据的概率分布随机采样出待解码的特征向量,解码待解码的特征向量输出并重构出原始的正常时间序列数据的概率分布,即为重构出正常时间序列数据的概率分布。
9.根据权利要求8所述的多维时间序列异常检测方法,其特征在于,所述通过采样的方式得出重构出新正常时间序列数据的概率分布,包括:
将输入的新观测数据的时间序列转变为重构的正常时间序列随机向量,然后通过对低维随机特征向量多次采样的方式得到多次重构的概率分布,获得稳定的重构概率分布,即为重构出新正常时间序列数据的概率分布,用于异常值打分。
10.一种多维时间序列异常检测系统,其特征在于,包括:
时间序列数据增强模块,所述时间序列数据增强模块将观测时间结合时间序列数据的观测频率,生成时间序列特征;对于受到外部影响的时间序列,将生成的时间序列特征结合额外采集的外部影响数据,生成外部变量;将生成的外部变量进行标准化统一数据尺度,完成对时间序列数据的增强;
时间序列数据切分模块,所述时间序列数据切分模块根据时间序列数据切分规则,将时间序列数据切分为多个时间片段数据,将多个时间片段数据根据采集时间互相重叠,得到多个连续的多维时间序列片段数据,形成包含异常值的多个时间序列片段数据;
无监督时间序列异常检测模型模块,所述无监督时间序列异常检测模型模块构建无监督时间序列异常检测模型,利用建立的所述模型从经过时间序列数据增强模块和/或时间序列数据切分模块后得到的包含异常值的多个时间序列片段数据中,学习正常数据的特征,并根据学习的特征重构正常的时间序列数据,给出重构出正常时间序列数据的概率分布;给定模型,从重构的正常时间序列数据池中随机抽取训练样本,在时间序列平滑假设的正则约束下优化模型参数,使得模型能够重构出正常的时间序列数据,完成模型训练;
观测数据重构模块,所述新观测数据重构模块,利用训练后的模型,给定新观测数据,通过采样的方式得出重构出新正常时间序列数据的概率分布;
异常检测模块,所述异常检测模块根据重构出新正常时间序列数据的概率分布,计算输入的时间序列数据的异常值,并提供异常检测阈值,进而根据异常检测阈值判断某段时间序列数据是否为异常片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011060906.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于深度学习和极值理论的数据异常判断方法及系统
- 下一篇:电机和压缩机





