[发明专利]基于目标特征的时间序列相似性计算方法在审
| 申请号: | 202010212867.9 | 申请日: | 2020-03-24 |
| 公开(公告)号: | CN113449006A | 公开(公告)日: | 2021-09-28 |
| 发明(设计)人: | 鄢越时 | 申请(专利权)人: | 中南大学 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06K9/62 |
| 代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 曾志鹏 |
| 地址: | 410012 *** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 目标 特征 时间 序列 相似性 计算方法 | ||
1.一种基于目标特征的时间序列相似性计算方法,其特征在于,包括以下步骤:
S1.对一元时间序列训练集中的数据进行归一化处理;
S2.定义时间序列的目标特征及其计算方式,并求出目标特征时序,将一元时序转换为目标特征时序组成的多元时序;
S3.根据不同种类目标特征时序,将训练集中时间序列依次与其他时序数据的对应特征时序进行DTW距离计算,再根据距离进行1-NN分类,计算各种特征进行分类时的准确度,同时记录这个过程中各类目标特征距离的中位数,依据分类准度和中位数算出各目标特征的权重W;
S4.对于待求距的两个时间序列归一化处理后,分别求出其目标特征时序,计算同类目标特征间的距离,再以S3求出的权重W进行加权累加,得到目标特征动态时间弯曲距离。
2.根据权利要求1所述的基于目标特征的时间序列相似性计算方法,其特征在于,步骤S1中:对有k条数据的训练集数据D进行扫描,首先归一化到区间[0,1]中,归一方式如公式(1)所示:
其中si为时序原始数据,smin、smax分别为时序中的最大值和最小值。
3.根据权利要求1所述的基于目标特征的时间序列相似性计算方法,其特征在于,步骤S2中:定义目标特征,即定义使用者关注或关心的特征,例如针对金融数据,可以定义以下目标特征:时间序列中相隔5点价格变动最大的10%的位置、价格变动最小的10%的位置,时间序列中相隔10点价格变动最大的5%的位置、价格变动最小的5%的位置,对时间序列进行100分段PAA均值处理后最大的40各位置、最小的40个位置,对时间序列进行50分段PAA均值处理后最大的20个位置、最小的20个位置等;根据使用者定义的目标特征,再定义各目标特征计算公式,用以生成目标特征序列。
4.根据权利要求2所述的基于目标特征的时间序列相似性计算方法,其特征在于,步骤S2中:将所有归一化后的原始一元时序数据分解为多元时序,每个序列代表一个目标特征的分布描述,分解方式由使用者自定义,如定义了k个目标特征,一个时间序列就分解为k个特征序列。
5.根据权利要求4所述的基于目标特征的时间序列相似性计算方法,其特征在于,步骤S3中:将每条分解得到的k种目标特征时序,分别在训练集上和其他时序的同类目标特征时序进行DTW距离计算,根据DTW距离进行m次同类目标时时序间的1-NN分类,最终计算各类目标特征时序进行单独1-NN分类时的准确度pi以及各类目标距离分布的中位数mi,其中i表示第i类目标特征,根据pi与mi计算i特征的权重wi。
6.根据权利要求5所述的基于目标特征的时间序列相似性计算方法,其特征在于,步骤S3中:根据各目标特征的分类准确度和分布区间大小确定各特征的权重,权重计算公式为wi=pi/mi,最终由wi组成权重向量。
7.根据权利要求6所述的基于目标特征的时间序列相似性计算方法,其特征在于,步骤S4中:将待测距的两条时序分解为目标特征序列后,采用多元时序的距离度量思路进行加权距离计算,即计算两时序各目标特征时序的DTW距离Disti,得到距离后利用各特征权重wi进行加权累加,得到最终的目标特征动态时间弯曲距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010212867.9/1.html,转载请声明来源钻瓜专利网。





