[发明专利]基于时间序列的异常数据检测方法、装置、介质和设备有效
| 申请号: | 201911285902.3 | 申请日: | 2019-12-13 |
| 公开(公告)号: | CN111104736B | 公开(公告)日: | 2021-07-13 |
| 发明(设计)人: | 高嘉欣;胡文波;陈云天;田天 | 申请(专利权)人: | 北京瑞莱智慧科技有限公司 |
| 主分类号: | G06F30/20 | 分类号: | G06F30/20;G01D21/02 |
| 代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 韩雪梅 |
| 地址: | 100086 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 时间 序列 异常 数据 检测 方法 装置 介质 设备 | ||
1.一种基于时间序列的异常数据检测方法,其特征在于,所述方法包括:
获取至少一个第一监测量的监测数据和第二监测量的监测数据,其中,所述第一监测量为监测对象的一个维度的环境量,所述第二监测量为监测对象的一个维度的物理量,所述第一监测量和所述第二监测量是监测对象的不同监测指标,所述第一监测量的监测数据和第二监测量的监测数据在时序上对应,且分别通过不同的传感器在监测对象正常运行时采集得到;
基于特定的时序数据预测模型和至少一个所述第一监测量的监测数据得到对所述第二监测量的正常数据的预测,其中,所述时序数据预测模型包括至少一个拟合所述第一监测量和所述第二监测量的监测数据的特征信息的核函数;
若所述第二监测量的监测数据与预测出的所述正常数据不对应,则确定所述第二监测量的监测数据为异常数据。
2.如权利要求1所述的方法,其中,所述时序数据预测模型基于所述至少一个第一监测量的历史监测数据和所述第二监测量的历史监测数据训练得到。
3.如权利要求1或2所述的方法,其中,所述时序数据预测模型采用多种核函数分别拟合所述数据的多个维度的特征信息。
4.如权利要求3所述的方法,其中,所述多种核函数包括径向基核函数、正弦平方核函数、常数核函数、白噪声核函数之中的至少两项。
5.如权利要求4所述的方法,其中,所述数据的多个维度的特征信息至少包括以下之二:
数据的趋势信息;
数据的周期信息;
数据的噪声。
6.如权利要求5所述的方法,其中,所述时序数据预测模型在拟合所述数据的趋势信息时,采用径向基核函数;
在拟合所述数据的周期信息时,采用正弦平方核函数;
在拟合所述数据的噪声时,采用白噪声核函数。
7.如权利要求4-6任一所述的方法,其中,所述时序数据预测模型为高斯过程回归模型。
8.如权利要求7所述的方法,其中,所述时序数据预测模型被设置为:
y=f(X)+Σ,且f(X)~GP[0,k(X,X’)] ,P(Σ)~N(Σ|0,σn2);
其中,y为表示第二监测量的预测数据的变量,X为表示第一监测量的监测数据的变量,Σ表示噪声,k(X,X’)为核函数或多个核函数的组合,σn2为Σ的方差,n为X的维度。
9.如权利要求8所述的方法,其中,对所述第二监测量的预测至少包括预测值和预测区间。
10.如权利要求9所述的方法,其中,基于特定的时序数据预测模型和至少一个所述第一监测量的监测数据得到对所述第二监测量的预测值,具体包括:
将所述第一监测量的监测数据输入至所述时序数据预测模型,得到所述时序数据预测模型输出的所述第二监测量的预测分布,所述预测分布包含预测均值;
获取所述预测均值作为所述第二监测量的预测值。
11.如权利要求9所述的方法,其中,基于特定的时序数据预测模型和至少一个所述第一监测量的监测数据得到对所述第二监测量的预测区间,具体包括:
将所述第一监测量的监测数据输入至所述时序数据预测模型,得到所述时序数据预测模型输出的所述第二监测量的预测分布,所述预测分布包含预测均值与预测方差;
获取所述第二监测量的预设置信度;
根据所述预设置信度、预测均值以及预测方差确定所述第二监测量的预测区间。
12.如权利要求10或11所述的方法,其中,所述方法还包括:
统计预设时间段内第二监测量的异常数据总数;
若所述异常数据总数大于预设值,发送存在安全风险的提醒消息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京瑞莱智慧科技有限公司,未经北京瑞莱智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911285902.3/1.html,转载请声明来源钻瓜专利网。





