[发明专利]基于自适应降噪和集成LSTM的多变量时间序列预测方法在审
申请号: | 201910123563.2 | 申请日: | 2019-02-18 |
公开(公告)号: | CN109919364A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 刘发贵;蔡木庆 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多变量 自适应 本征模函数 降噪 时间序列预测 时间序列 预测器 经验模式分解 时间序列分解 自动编码器 集成算法 强预测器 神经网络 提取特征 预测误差 阈值函数 验证集 混沌 堆叠 噪声 集合 预测 | ||
本发明公开了基于自适应降噪和集成LSTM的多变量时间序列预测方法,用以解决现有方法对具有非平稳、非线性和含噪特点的多变量时间序列预测时性能不稳定以及预测精度低的问题。所述方法包括:采用具有自适应噪声的完全集合经验模式分解方法对含噪混沌多变量时间序列分解得到一系列频率由高到底的本征模函数;采用排列熵的思想区分含噪高频本征模函数和低频不含噪本征模函数;构造自适应阈值和自适应阈值函数对含噪本征模函数降噪;构造堆叠自动编码器对降噪后的多变量时间序列提取特征;基于LSTM神经网络构造多变量时间序列弱预测器;构造考虑验证集预测误差的集成算法组合多个LSTM弱预测器得到强预测器。
技术领域
本发明属于计算机应用技术领域,尤其涉及一种基于自适应降噪和集成LSTM的多变量时间序列预测方法。
背景技术
在实际生产和科学研究中,通过对某一个或一组指标进行观察测量得到按照时间先后序列排列的观察值称为时间序列数据,时间序列模型能够拟合并学习时间序列数据的时间变化规律,例如随机性变化、周期性变化或者趋势性变化。多变量时间序列预测模型是针对多个变量时间序列,充分考虑各个变量时间序列之间的关系,并且对某一个或多个目标时间序列进行预测。多变量时间序列预测已广泛应用于许多领域,例如金融市场预测、能源预测和环境污染预测等。根据历史观察预测未来的新趋势或潜在的危险事件具有重要意义,然而,如何预处理复杂的混沌多变量时间序列,捕获这些变量之间的特征,并做出准确的预测仍然是主要的挑战。
针对多变量时间序列预测的问题,很多研究提出了相关的预测模型,主要分为两类,第一类是基于随机过程理论和数理统计的传统模型,例如自回归移动平均模型(ARIMA)、向量自回归模型(VAR)和高斯过程(GP)等,这类模型通常使用预定义的线性或非线性模型,然后根据输入数据动态调整模型的参数,难以发掘非线性时间序列中的复杂模式以及多变量之间的依赖关系。第二类是神经网络模型,这类结构不固定,可以根据输入数据灵活地探索线性或非线性特征,并学习相应的函数映射,例如循环神经网络(RNN)、卷积神经网络(CNN)和长短期记忆(LSTM)等。在处理复杂的多变量时间序列时,神经网络尤其是循环神经网络及其变种具有明显的优越性。
发明内容
本发明的目的在于提供一种基于自适应降噪和集成LSTM的多变量时间序列预测方法,用以解决现有方法对具有非平稳、非线性和含噪特点的多变量时间序列预测时性能不稳定以及预测精度低的问题。
本发明通过如下技术方案实现。
基于自适应降噪和集成LSTM的多变量时间序列预测方法分为降噪阶段、特征提取阶段以及集成预测三个阶段。降噪阶段对多变量时间序列里的目标序列进行降噪,以去除目标序列里的噪声因素,提高后续分析的效率和有效性;特征提取阶段对所有变量时间序列进行特征提取,充分考虑每个变量序列之间的相互依赖关系,以寻找更为合理的数据输入格式,提高模型训练时间和收敛速度;集成预测阶段,基于神经网络构造预测器,并使用改进的集成算法组合多个集成预测器得到强预测器,提高预测精度的同时防止过拟合。
进一步地,降噪阶段,采用具有自适应噪声的完全集合经验模式分解方法(CEEMDAN)分解目标时间序列的层次结构,得到一系列频率由高到底的本征模函数(IMF)。然后采用排列熵的思想得到每一个本征模函数排列熵,排列熵高的IMF含噪高,反之含噪少,通过确定排列熵的阈值,从而区分含噪的高频IMF和不含噪的低频IMF。最后构造自适应阈值来划分每一个含噪的高频本征模函数中的含噪数据点和不含噪数据点,并且构造自适应阈值函数来对含噪的高频本征模函数降噪。
进一步地,特征提取阶段,采用堆叠自动编码器神经网络对多变量时间序列进行无监督的特征提取,在每一层自动编码器中,输入的是整个多变量时间序列,先对多变量时间序列编码,映射到隐藏层,然后再解码为原多变量时间序列,隐藏层即为多变量时间序列的特征。通过堆叠多层自动编码器,逐层提取更深层次的特征,并且充分考虑各个变量序列之间的关系和降低维度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910123563.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理