[发明专利]一种时间序列异常检测方法及装置有效
申请号: | 201811603934.9 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109871401B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 张顺龙;王占一 | 申请(专利权)人: | 北京奇安信科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 100015 北京市朝阳区酒仙*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时间 序列 异常 检测 方法 装置 | ||
1.一种时间序列异常检测方法,其特征在于,包括:
获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;
获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;
在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;
根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测;
所述根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据,包括:
获取每种标注类型对应的各目标标注数据;
对数据集中的数据进行初筛选,以获取需保留的备选数据;
根据所述预设特征组合匹配所有备选数据分别对应的待匹配特征组合集合;
根据所有待匹配特征组合集合、所有特征组合集合和预设相似度度量函数,计算所有备选数据与各目标标注数据之间的第一相似度;
将第一相似度数值大于第一预设数值的备选数据作为所述候选数据;
所述在所有候选数据中提取可用于优化预设模型的目标数据,包括:
获取各候选数据的检测类型;
在第一预设时间窗口内获取检测类型为正常点的各第一候选数据;
分别计算各标注数据与各第一候选数据之间的第二相似度;
将第二相似度数值大于第二预设数值的第一候选数据作为所述目标数据;
获取检测类型为告警点或异常点的各第二候选数据;
根据预设时段内的告警点或异常点统计量,确定第二预设时间窗口;其中,所述第二预设时间窗口是在各候选数据中选取的大于所述告警点或异常点统计量的告警点数或异常点数对应的时间段;
根据所述第二预设时间窗口、所述确定时刻和所述检测类型,确定所述目标数据;
其中,所述第一候选数据还包括检测类型为漏检点的候选数据;所述第二候选数据还包括检测类型为漏报点或误报点的候选数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所有目标数据,确定对所述预设模型的优化处理策略,包括:
获取各目标数据分别对应的标注类型;
若判断获知至少一个目标数据对应的标注类型为误报,则根据第一处理策略更新所述第一预设模型的误报过滤规则;
若判断获知至少一个目标数据对应的标注类型为漏报,则确定所有漏报点是否全部存在于异常点中,若确定为是,则根据第二处理策略更新所述第一预设模型的误报过滤规则。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若确定为否,则统计不存在异常点中的全部漏报点;
若全部漏报点的数量大于预设数量,则重新训练所述第二预设模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇安信科技有限公司,未经北京奇安信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811603934.9/1.html,转载请声明来源钻瓜专利网。