[发明专利]一种基于稀疏化方法的核最小均方时间序列在线预测模型在审
| 申请号: | 202010195943.X | 申请日: | 2020-03-19 |
| 公开(公告)号: | CN111369072A | 公开(公告)日: | 2020-07-03 |
| 发明(设计)人: | 赵超超;任伟杰;韩敏 | 申请(专利权)人: | 大连理工大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F17/18 |
| 代理公司: | 大连理工大学专利中心 21200 | 代理人: | 李晓亮;潘迅 |
| 地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 稀疏 方法 最小 时间 序列 在线 预测 模型 | ||
1.一种基于稀疏化方法的核最小均方时间序列在线预测模型,其特征在于,包括如下步骤:
步骤1:从实际数据中获取时间序列预测问题的样本数据,包括输入数据x(n)=[x1(n);x2(n);...x;m(n)]和预测目标y(n),其中xi(n)为第i个特征序列;
步骤2:运用归一化方法处理实验数据,采用归一化方法公式为:
其中,xi和分别代表样本数据归一化前后的值,xmax和xmin分别代表样本数据的最大值和最小值;
步骤3:划分训练集和测试集,并设置模型参数;
随机选取样本数据90%作为训练集,其余作为测试集;依据经验设置模型参数,包括模型学习率η,顺序异常值准则的用户定义系数λd和λv,量化阈值参数ε以及自适应调整参数初始化模型参数,预测误差e(n)=y(1),权重向量α1=η·e(1),模型字典D(1)=x(1);
步骤4:训练集数据按顺序进入预测模型进行训练;利用顺序异常值准则,剔除实验数据中的异常数据;所述的顺序异常值准则是依据历史数据,为新到达的数据建立预期区域,如果新数据超出预期区域,则将其标记为离群值;所述的预期区域由预期邻居距离和预期邻居方向向量组成;
4.1)在给定现有数据的信息的情况下,根据预期邻居距离推断顺序邻居数据之间的预期距离;根据预期邻居距离判断数据是否是异常值,预期邻居距离定义为:
其中,NDe(n)表示第n次迭代时的预期邻居距离;dxi,xi+1=||x(i+1)-x(i)||为相邻距离;系数2i/(n-2)(n-1)用于将更高的权重分配给更接近新数据的相邻距离;
第n次迭代的预期邻居距离的上边界和下边界被定义为:
其中,B_Dupper(n)和B_Dlower(n)分别表示第n次迭代中预期邻居距离的上边界和下边界;λd表示用户定义的系数;σd(n)表示{dxi,xi+1,i=1,2,...,n-2}的标准差;
计算相邻距离dxn-1,xn;如果超出预期邻居距离的既定范围,则第n个数据将被怀疑为异常值;所述预期邻居距离的既定范围为[NDe(n)-λdσd,NDe(n)+λdσd];
4.2)在给定所有现有数据的信息的情况下,预期邻居方向向量描述在顺序邻居数据之间的预期方向向量,进而推断出数据可能朝向的方向;预期邻居方向向量定义为:
其中,NVe(n)表示第n次迭代时的预期邻居方向向量;采用系数2i/(n-2)(n-1)是为更接近新数据的方向矢量分配更高的权重;
在第n次迭代中预期的邻居方向矢量的上边界和下边界被定义为:
其中,B_Vupper(n)和B_Vlower(n)分别表示第n次迭代时预期邻居方向向量的上边界和下边界;λv表示用户定义的系数;σv(n)表示{[x(i+1)-x(i)]/dxi,xi+1,i=1,2,...,n-2}的标准差;
计算相邻方向向量[x(n)-x(n-1)]/dxn-1,xn,如果超出预期邻居方向向量的既定范围,则第n个数据将被怀疑为异常值;所述的预期邻居方向向量的既定范围为[NVe(n)-λvσv,NVe(n)+λvσv];
4.3)第n次迭代时,预期邻居距离和预期邻居方向向量的既定范围构成新到达数据的预期区域;如果当前相邻距离dxn-1,xn不在[NDe(n)-λdσd,NDe(n)+λdσd]区间内,同时当前相邻方向向量[x(n)-x(n-1)]/dxn-1,xn不在[NVe(n)-λvσv,NVe(n)+λvσv]区间内,则新到达的数据被标记为异常值;此时该数据将被剔除,开始迭代下一个训练集数据;
步骤5:当迭代次数为n时,当前的输入为{x(n),y(n)};依据之前迭代所训练的临时预测模型计算预测目标并得到预测误差e(n);
所述的预测目标其中,αn-1表示权重向量;κn-1表示核矩阵,对κn-1进行说明如下:κn-1=κ(D(n-1),x(n-1)),κ(xi,xj)=exp(-||xi-xj||/2σ2),这里采用高斯核,σ为核宽度;xi,xj表示任意的两个输入向量;D(n-1)表示第n次迭代时字典未更新前的状态,它包含被纳入字典的输入向量;
所述的预测误差
步骤6:运用量化方法减小模型字典大小并更新权值系数;首先,计算x(n)与字典D(n-1)之间的距离:dis(x(n),D(n-1))=min1≤j≤n-1||x(n)-Dj(n-1)||,其中,j表示字典D(n-1)的第j个成员,||·||表示Euclidean范数;如果计算的距离dis(x(n),D(n-1))小于设置的量化参数ε,则不更新字典:D(n)=D(n-1);输入数据将被量化到Dj(n-1),此时系数αn更新为αn=αj+η·e(n);否则,将更新字典:D(n)=D(n-1)∪x(n),x(n)将成为现有字典中的新中心,此时系数αn=[αn;η·e(n)];
步骤7:采用自适应调整方法更新权值系数;权值更新为:
其中,是用户定义的参数,其目的是避免分母为零;
步骤8:利用训练好的模型对测试集数据进行测试,然后对预测值和测试集中的目标值进行反归一化计算;最后,计算预测值与测试集中目标值之间的均方根误差RMSE和对称平均绝对百分比误差SMAPE;
其中,y(n)为目标值,为预测值,n是时间步数,N为样本总数;
步骤9:调整模型用户设定参数,并执行步骤4-8,得到多个训练好的模型和对应的评价指标RMSE和SMAPE;选取RMSE和SMAPE最小的模型作为预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010195943.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全固态层叠体电池
- 下一篇:超大功率光阻玻璃芯片生产工艺
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





