[发明专利]一种时间序列异常检测方法及装置在审
| 申请号: | 202211135619.4 | 申请日: | 2022-09-19 |
| 公开(公告)号: | CN115563566A | 公开(公告)日: | 2023-01-03 |
| 发明(设计)人: | 孙红军 | 申请(专利权)人: | 郑州时空隧道信息技术有限公司 |
| 主分类号: | G06F18/2433 | 分类号: | G06F18/2433;G06F18/15;G06F18/214 |
| 代理公司: | 北京中创云知识产权代理事务所(普通合伙) 11837 | 代理人: | 肖佳 |
| 地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 时间 序列 异常 检测 方法 装置 | ||
本发明实施例涉及一种时间序列异常检测方法及装置,所述方法包括:获取待处理的时间序列数据集合,所述时间序列数据集合中的每条时间序列数据至少包括时间点和与其对应的数值;对所述时间序列数据集合中的数据进行预处理,所述预处理包括数据重采样、缺失值处理、数据标注、数据格式化和异常注入;基于经过预处理的时间序列数据集合,构建异常检测模型;采用所述异常检测模型进行异常检测。本发明实施例提供的技术方案,通过对时间序列数据集合进行合理的数据预处理环节,提高了数据质量;通过提供不同的序列异常检测模型,并在线上实时监测时更灵活地将其联动,保障精确度的同时也使其执行效率提高。
技术领域
本发明实施例涉及数据检测技术领域,尤其涉及一种时间序列异常检测方法及装置。
背景技术
时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列,而时间序列异常检测则是旨在发现时间序列中的异常点,如突增或突降等,目的是为了保障时间序列的稳定性,及时发现异常。
传统的时间序列异常检测通常是以设置阈值的方式为主,因大多数的时间序列具有很强的周期性,所以对不同时段的数据需设置的阈值也不同,故检测的准确度往往很低,且模型的鲁棒性较差。随着机器学习的快速发展,也出现了基于机器学习的时间序列异常检测方法,该方法虽好于传统的时间序列异常检测方法,但训练模型需要大量的标注数据,且预测时耗时较久。因此,亟待提供一种高准确度、高效率、高鲁棒性的时间序列异常检测方法。
发明内容
基于现有技术的上述情况,本发明实施例的目的在于提供一种时间序列异常检测方法及装置,以解决现有技术时间序列异常检测过程中存在的准确率低、效率低、鲁棒性差、灵活性低等问题。
为达到上述目的,根据本发明的一个方面,提供了一种时间序列异常检测方法,所述方法包括:
S102、获取待处理的时间序列数据集合,所述时间序列数据集合中的每条时间序列数据至少包括时间点和与其对应的数值;
S104、对所述时间序列数据集合中的数据进行预处理,所述预处理包括数据重采样、缺失值处理、数据标注、数据格式化和异常注入;
S106、基于经过预处理的时间序列数据集合,构建异常检测模型;
S108、采用所述异常检测模型进行异常检测。
进一步的,所述数据重采样包括:
根据预设的检测频度,对时间序列数据集合进行重采样,重采样后的数值为其在检测频度范围内的原数值之和。
进一步的,所述缺失值处理包括,对缺失值采用以下公式计算的数值填充:
其中,i,i∈[1,N′]为某条时间序列数据在时间序列数据集合中的下标,N′为时间序列数据集合的长度,Vi,i∈[1,N′]为下标i对应时间序列数据的数值,n,n∈[1,N′]为缺失值在时间序列数据集合中的下标,r,r∈[0,+∞]为自定义邻域范围,函数为计算列表x中非零值的个数。
进一步的,所述数据标注包括人工标注,标注后的每条时间序列数据至少包括时间点、与其对应的数值和标签。
进一步的,所述数据格式化包括:
S10441、生成下标n对应的当前序列csn:
csn=[Vn_w,Vn_w+1,…,Vn];
S10442、生成下标n对应的第一参考序列fsn:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州时空隧道信息技术有限公司,未经郑州时空隧道信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211135619.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能燃气表壳体制造加工方法
- 下一篇:一种即付即用设备的管理方法





