[发明专利]一种基于时间序列数据的异常值检测方法和系统在审
| 申请号: | 202011314322.5 | 申请日: | 2020-11-20 |
| 公开(公告)号: | CN112445842A | 公开(公告)日: | 2021-03-05 |
| 发明(设计)人: | 赵乔乔 | 申请(专利权)人: | 北京思特奇信息技术股份有限公司 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28 |
| 代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 尉保芳 |
| 地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 时间 序列 数据 异常 检测 方法 系统 | ||
本发明公开了一种基于时间序列数据的异常值检测方法和系统,涉及异常检测领域。该方法包括:读取时间序列数据,根据预设方法将时间序列数据进行划分,将划分后获得的多个数据集分别设置对应的异常值阈值,根据异常值阈值来判断出时间序列数据中的异常值,根据时间区间的类别将数据划分为对应的数据集合,得到不同时间区间对应的阈值,相对于构造概率函数得到唯一的阈值提高了精确度。
技术领域
本发明涉及异常检测领域,尤其涉及一种基于时间序列数据的异常值检测方法和系统。
背景技术
传统的异常值检测通过构造概率模型,构造概率函数得到唯一的阈值,根据唯一的阈值将置信区间以外的数据视为异常值,这样获得的异常值的方法精度低下。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种基于时间序列数据的异常值检测方法和系统。
本发明解决上述技术问题的技术方案如下:
一种基于时间序列数据的异常值检测方法,包括:
S1,读取时间序列数据;
S2,根据预设方法将所述时间序列数据进行划分;
S3,将划分后获得的多个数据集分别设置对应的异常值阈值;
S4,根据所述异常值阈值来判断出所述时间序列数据中的异常值。
本发明的有益效果是:本发明方案通过根据预设方法将时间序列数据进行划分,将划分后获得的多个数据集分别设置对应的异常值阈值,根据异常值阈值来判断出时间序列数据中的异常值;对于检测时间序列上下文异常的数据,根据多数投票原则将时间区间进行分类,根据时间区间的类别将数据划分为对应的数据集合,得到不同时间区间对应的阈值,相对于构造概率函数得到唯一的阈值提高了精确度。
相比较拟合数据构造模型的算法都需要设置参数,每次面对新数据时都要重新设置参数,调参工程量大并且对参数值的选取直接影响模型的好坏。这样会导致模型鲁棒性不强,模型的预测结果准确性不高;本发明方案避免反复调参提高了检测的准确率。
进一步地,所述S1具体包括:
判断采集的时间序列数据是否存在概念漂移点,如果不存在,则读取所述时间序列数据。
采用上述进一步方案的有益效果是:本发明方案通过在读取时间序列数据时判断是否存在概念漂移点,实现了读取的时间序列数据具有原始时间序列的共有特征,应用的过程中无需考虑原始数据的特性,具有普遍适用性。
进一步地,所述S2具体包括:
通过差分法处理所述时间序列数据;
根据第一预设阈值将处理后的所述时间序列数据划分出第一时间区间的数据集;
根据第二预设阈值将处理后的所述时间序列数据划分出第二时间区间的数据集。
将第一时间区间的数据集和第二时间区间的数据集的补集作为第三时间区间的数据集。
采用上述进一步方案的有益效果是:本发明方案通过根据时间区间的类别将数据划分为对应的数据集合,根据不同时间区间对应的阈值来对相应数据集合进行异常值检测,能够更好的适应不同时间区间之间的特异性,有效提高数据整体的异常值检测准确率。
进一步地,所述S3具体包括:
获取第一时间区间的数据集的预设分位值作为第一异常值阈值;
获取第二时间区间的数据集的预设分位值作为第二异常值阈值;
获取第三时间区间的数据集的预设分位值作为第三异常值阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京思特奇信息技术股份有限公司,未经北京思特奇信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011314322.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





