[发明专利]一种基于密度的时序数据异常检测方法及装置在审

专利信息
申请号: 201810114278.X 申请日: 2018-02-05
公开(公告)号: CN108319981A 公开(公告)日: 2018-07-24
发明(设计)人: 王建民;宋韶旭;张奥千;王昳晗 申请(专利权)人: 清华大学
主分类号: G06K9/62 分类号: G06K9/62;G06F17/30
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 王莹;吴欢燕
地址: 100084 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 时序数据 特征向量 异常检测 异常数据 异常因子 子序列 特征向量集 分布特点 检测结果 领域知识 判断数据 数据分段 特征提取 训练数据 预先获取 检测 多段 预设
【说明书】:

发明提供一种基于密度的时序数据异常检测方法及装置,所述方法包括将待检测时序数据分成多段,每段为一个子序列;计算每个子序列对应的特征向量;基于预先获取的训练数据特征向量集,计算所述特征向量的局部异常因子,若所述局部异常因子大于预设阈值,则所述特征向量对应的子序列为异常数据。本发明提供的基于密度的时序数据异常检测方法及装置,首先进行数据分段,然后进行特征提取,最后根据基于密度的局部异常因子判断数据段是否为异常数据段;本发明不依赖于领域知识,通用性好,并且只根据数据本身的分布特点进行异常数据的检测,提高了检测结果的准确性。

技术领域

本发明涉及计算机技术领域,尤其涉及一种基于密度的时序数据异常检测方法及装置。

背景技术

在工业领域中,无时无刻不在产生新的数据,例如设备运行指标数据、物理量检测数据等。这些数据通常是每隔一段时间进行一次采集,采集的数据值可以和采集时间一一对应,我们称这样的数据为时序数据,即按时间顺序记录的数据列。随着信息技术的不断发展,数据在工业领域中的应用价值逐渐受到人们的重视,例如从时序数据中我们可以分析设备运行状态、气候变化趋势等。随着对数据利用的增多,数据质量问题逐渐受到人们的重视。数据质量问题即数据在其生命周期(产生、储存、加工、使用)中由于某些原因产生偏差,导致最终数据的不一致、不精确、不完整等问题。造成数据质量问题的原因很多,如数据源故障、人为失误、储存介质受损等,诸多的因素导致数据质量在生产生活中普遍存在。异常数据会对分析、挖掘等实际任务造成巨大影响,因此如何能够准确的检测出时序数据中的异常数据显得尤为重要。

现有技术中,针对时序数据的异常检测方法大多基于领域专家给定的规则,例如规定某一指标的正常范围,在正常范围中的数据判定为正常数据,不在正常范围中的数据判定为异常数据。

这样的方法灵活性及准确性都不能得到保障,如果范围规定过大,可能无法检测到所有异常数据,如果范围规定过小,可能有很多正常数据被检测为异常。并且,时序数据中的异常数据通常成段出现、同一指标数据分布通常相似,造成采用现有技术中的方法对异常数据进行检测的结果,不确定性较大,检测结果不准确。

发明内容

本发明的目的是提供一种基于密度的时序数据异常检测方法及装置,解决了现有技术中时序数据异常检测结果不准确的技术问题。

为了解决上述技术问题,一方面,本发明提供一种基于密度的时序数据异常检测方法,包括:

将待检测时序数据分成多段,每段为一个子序列;

计算每个子序列对应的特征向量;

基于预先获取的训练数据特征向量集,计算所述特征向量的局部异常因子,若判断获知所述局部异常因子大于预设阈值,则所述特征向量对应的子序列为异常数据。

进一步地,所述计算每个子序列对应的特征向量,具体为:

计算每个子序列的特征值,所述特征值包括每个子序列中所有数据点的数据值的平均值、标准差、最大值和最小值;

以所述特征值为向量元素构建每个子序列对应的特征向量。

进一步地,所述将待检测时序数据分成多个子序列,具体为:

计算所述待检测时序数据中每个数据点的速度,其中,当前数据点的速度为当前数据点和前一个数据点的数据值之差,与当前数据点和前一个数据点的时间戳之差的比值;

基于每个数据点的速度和预先获取的分段阈值,将所述待检测时序数据分成多个子序列。

进一步地,获取所述训练数据特征向量集的具体步骤如下:

将获取的样本时序数据分成多个样本子序列,所述样本时序数据中不包含异常数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810114278.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top