[发明专利]一种时间序列异常检测方法及装置有效
| 申请号: | 201811019950.3 | 申请日: | 2018-09-03 |
| 公开(公告)号: | CN109902703B | 公开(公告)日: | 2021-09-21 |
| 发明(设计)人: | 杨思晓;秦臻;田光见 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
| 代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 时间 序列 异常 检测 方法 装置 | ||
本申请实施例公开了一种时间序列异常检测方法及装置,涉及数据分析技术领域。能够提高多状态模式时间序列异常检测的准确率。该方法可以包括:接收一组时间序列形式的信号;将信号按照预设规则划分为至少两个子序列;分别对每个子序列提取特征向量,获得特征向量样本集,特征向量样本集为每个子序列对应的特征向量构成的;在特征向量样本集中采用聚类算法获得聚类结果,聚类结果包括至少一个簇以及每个特征向量样本与簇的隶属关系,其中,每个簇为特征向量样本集的子集;在每个簇中应用机器学习算法建立异常行为模型;在每个簇中根据对应的异常行为模型进行异常检测获得异常点。
技术领域
本申请涉及数据分析技术领域,尤其涉及一种时间序列异常检测方法及装置。
背景技术
时间序列异常检测在许多领域都有应用。例如,计算机网络中的异常流量可能意味着被黑客攻击的计算机将敏感数据发送到未经授权的目标,心电图数据中的异常点对应着患者的心脏异常状况,网络监控数据的异常点表明网络中部分设备即将或已经失效。
准确的检测出时间序列数据异常,在实际应用中具有重要意义。然而,现有的时间序列异常检测算法通常基于数据的平稳性假设和周期性假设,对平稳时间序列或周期性时间序列进行异常检测的效果较好,对多状态模式的时间序列进行异常检测时通常存在假阳性率高、检出率低等问题,准确率有待提高。
发明内容
本申请实施例提供一种时间序列异常检测方法及装置,对多状态模式时间序列的不同状态分别建立异常模型,能够提高多状态模式时间序列异常检测的准确率。
为达到上述目的,本申请的实施例采用如下技术方案:
第一方面,本申请提供了一种时间序列异常检测方法。该方法可以包括:接收一组时间序列形式的信号;将信号按照预设规则划分为至少两个子序列;分别对每个子序列提取特征向量,获得特征向量样本集,其中,特征向量样本集为每个子序列对应的特征向量构成的;在特征向量样本集中采用聚类算法获得聚类结果,聚类结果包括至少一个簇以及每个特征向量样本与簇的隶属关系,其中,每个簇为特征向量样本集的子集;在每个簇中应用机器学习算法建立异常行为模型;在每个簇中根据对应的异常行为模型进行异常检测获得异常点。在该方法中,接收到信号后,根据每个子序列的特征向量进行聚类,获得至少一个簇,使得每个簇对应时间序列的一种状态,这样,针对不同的状态可以建立不同的异常行为模型,能够提高多状态模式时间序列异常检测的准确率。
在一种可能的设计中,特征向量包括:子序列的基本统计量和频率特征;其中,基本统计量包括均值、标准差、最大值和最小值;频率特征为对子序列进行快速傅里叶变换的结果向量的前W个分量的幅值,W为正整数。
在一种可能的设计中,预设规则包括:基于数据的划分方式或基于规则的划分方式。
在一种可能的设计中,基于数据的划分方式可以包括:采用变点分析算法获得信号的变点;根据变点的位置将信号划分为至少两个子序列。通常时间序列的行为模式在变点的前后出现显著变化,所以采用这种方法可以有效的划分出时间序列的不同状态。
在一种可能的设计中,基于规则的划分方式,包括:按照预设周期将信号划分为至少两个子序列。
在一种可能的设计中,在每个簇中应用机器学习算法建立异常行为模型,包括:分别将特征向量对应同一个簇的子序列合并为一个子序列集合,其中,每个子序列集合对应一个簇;分别计算每个子序列集合中所有样本值的均值和标准差;分别根据每个子序列集合对应的均值和标准差计算子序列集合的正常值上界和正常值下界;根据正常值上界和正常值下界获得每个子序列集合的异常行为模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811019950.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:目标检测的方法和装置
- 下一篇:一种异常样本的识别方法、装置及存储介质





