[发明专利]基于重要点双重评价因子时间序列趋势特征提取方法有效
申请号: | 201710818994.1 | 申请日: | 2017-09-12 |
公开(公告)号: | CN108804731B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 徐德刚;谢婷玉;罗聪;苏志芳;阳春华;桂卫华;谢永芳 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/00;G06F119/12 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 欧阳迪奇 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 要点 双重 评价 因子 时间 序列 趋势 特征 提取 方法 | ||
1.一种基于重要点双重评价因子的时间序列趋势特征提取方法,其特征在于,包括以下步骤:
步骤1:初始化,为待处理初始时间序列确定分段数、设置距离因子阈值和权值;
步骤2:根据时间序列重要点定义选取重要点作为时间序列分段点的备选集;
步骤3:计算重要点距离因子,用距离因子度量重要点相对差异程度;根据给定距离因子阈值滤除伪重要点,更新分段点备选集,并判断是否满足分段数要求,若不满足则需返回步骤1重新设定分段数;
步骤4:计算重要点趋势因子,用趋势因子在全局上度量重要点对整体趋势的影响程度,建立综合评价模型评价每个重要点对整体趋势的重要程度;
步骤5:将重要点按照重要程度大小进行排序并选取所需分段点,将相邻分段点连接得到时间序列的分段趋势表示;
所述步骤1包括:为待处理时间序列设置初始分段数N,距离因子阈值ε,距离因子权值β,0<β<1;时间序列为一个由n项与时间先后顺序相关的数据记录组成的序列,其中x(ti)为在ti时刻的数据记录,t1<t2<...<tn;每一数据记录包含了所考察对象发生时间及属性,X(ti)=(ti,x1(ti));
所述初始分段数N根据用户对数据压缩率的要求确定,初始值:N=n×s,n为待处理数据个数,s为数据压缩率;然后设置距离因子阈值ε和距离因子权值β以计算分段拟合误差E,并采用粒子群寻优算法结合十折交叉算法验证来确定使分段拟合误差E最小的一组ε和β参数值作为最终模型参数,其中分段拟合误差E计算如下:
给定时间序列设分段后经过线性插值得到的时间序列为XC={xc(t1),...,xc(ti),...,xc(tn)},那么该分段表示与原始时间序列之间的拟合误差为:
2.根据权利要求1所述的基于重要点双重评价因子的时间序列趋势特征提取方法,其特征在于,采用粒子群寻优算法确定ε和β包括以下步骤:
(1)初始化:初始化粒子群个体,设置种群大小m=20,最大更新代数Nmax=300,设置ε和β的取值范围,β∈(0,1),迭代速度Vi∈[-0.2,0.2],初始迭代次数n=0,位置向量Wi=(ε,β),其中i表示第i个粒子;
(2)使用公共数据集作为训练数据集,执行步骤3-5,得到最终分段点序列,对其进行线性插值,得到序列XC={xc(t1),...,xc(ti),...,xc(tn)};
(3)按照公式(1)计算拟合误差E,作为评价标准,E越小越好;
(4)找到每个个体自己在所有迭代过程中的最优解WiPbest=(ε1,β1);
(5)找到所有个体在所有迭代过程中的最优解WZbest=(ε2,β2);
(6)根据速度公式更新速度,其中速度公式如下:
Vi(n+1)=Vi(n)+c1r1(n)(WiPbest(n)-Wi(n))+c2r2(n)(WZbest(n)-Wi(n))
其中,c1和c2为学习因子,c1=1为飞向自身最好位置的步长,c2=2为飞向全局最好位置的步长,r1,r2为相互独立伪随机变量的向量,在[0,1]区间的均匀分布生成;
(7)根据位置公式更新位置,迭代次数t=t+1,其中位置公式如下;
Wi(n+1)=Wi(n)+Vi(n+1)
(8)判断n≤Nmax是否成立,若是则重复步骤(2)~(7),否则迭代完毕,转到步骤(9);
(9)输出最优解(ε,β)和E。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710818994.1/1.html,转载请声明来源钻瓜专利网。