[发明专利]一种基于特征点符号聚集近似的时间序列异常挖掘方法有效
申请号: | 201210337740.5 | 申请日: | 2012-09-13 |
公开(公告)号: | CN102867052A | 公开(公告)日: | 2013-01-09 |
发明(设计)人: | 朱跃龙;刘千;张鹏程 | 申请(专利权)人: | 河海大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 符号 聚集 似的 时间 序列 异常 挖掘 方法 | ||
1.一种基于特征点符号聚集近似的时间序列异常挖掘方法,其特征在于:包括特征点符号聚集近似方法和符号串间距离的度量方法;
所述特征点符号聚集近似方法为:通过提取时间序列的特征点来表征所述时间序列,依据符号聚集近似方法,将时间序列划分到若干个等概率空间,得到一个可以表示时间序列的符号串;
所述符号串间距离的度量方法为:根据动态时间弯曲方法,定义两个符号串之间的动态弯曲距离,从而得到符号串之间的距离。
2.如权利要求1所述的基于特征点符号聚集近似的时间序列异常挖掘方法,其特征在于:特征点符号聚集近似方法包括降维和符号化;
所述降维为:选取保持时间段与时间序列长度之比大于等于阈值L的极值点,以及包含N个极值点的分段子序列平均值作为该序列的特征点,达到降维的目的;其中,L的取值根据原始时间序列的长度、不同领域知识以及关注角度而定,一般情况下为0.01~0.1;N的取值最小为1,最大为该序列的所有极值特征点个数;
所述符号化:采用符号化聚集近似方法划分若干个等概率空间,根据特征点的大小映射到不同的概率区间,处于同一概率区间的序列值用相同的符号表示,最后得到一个长度与特征点个数相同的符号串。
3.如权利要求1所述的基于特征点符号聚集近似的时间序列异常挖掘方法,其特征在于:符号串间距离的度量方法包括,定义符号之间的距离代替动态时间弯曲中的欧氏距离,以欧氏距离为基础得到两个符号串之间的距离,进而得到任意一个符号串与其余符号串之间的距离之和,称其为累积距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210337740.5/1.html,转载请声明来源钻瓜专利网。