[发明专利]一种融合EMD和LSTM的城市PM2.5浓度预测方法在审
申请号: | 201911359480.X | 申请日: | 2019-12-25 |
公开(公告)号: | CN111144286A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 李永;李辩 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 emd lstm 城市 pm2 浓度 预测 方法 | ||
1.一种融合EMD和LSTM的城市PM2.5浓度预测方法,其特征在于,包括以下的步骤:
步骤S1:获取每小时时间序列数据,对获取的数据进行数据清洗;
步骤S2:使用经验模态分解EMD对PM2.5浓度数据进行平稳化处理,得到多个分量;
步骤S3:确定滑动时间窗口T,对每个分量进行数据序列段切分处理,并归一化统一量纲,得到多个数据集;
步骤S4:将数据集划分为训练集和测试集,分别构建LSTM网络模型进行训练;
步骤S5:使用训练好的模型对各个分量进行预测,并对其进行反归一化处理,得到最终的城市PM2.5浓度预测结果。
2.根据权利要求1所述的一种融合EMD和LSTM的城市PM2.5浓度预测方法,其特征在于,步骤S1所述的数据清洗包括删除异常值,通过线性插值方法填充缺失值,公式如下:
其中,t表示缺失数据的时刻,m表示大于t时刻的最近有值的时刻,n表示小于t时刻的最近有值时刻,Xm表示m时刻的数据,Xn表示n时刻的数据,Xt表示待填充的数据。
3.根据权利要求1所述的一种融合EMD和LSTM的城市PM2.5浓度预测方法,其特征在于,步骤S2所述的经验模态分解EMD方法,将非线性、非平稳性的PM2.5时间序列数据分解为12个具有不同尺度、平稳性和周期波动性特点的本征模函数(IMF)和一个代表原始信号总体趋势的残余量(RES):
4.根据权利要求1所述的一种融合EMD和LSTM的城市PM2.5浓度预测方法,其特征在于,步骤S3所述的滑动时间窗口T设置为3,LSTM模型的输入是一个滑动时间窗口为T的序列段,即预测T+1时刻的PM2.5浓度值需要将前T时刻的空气污染物历史数据和气象数据作为输入,因此需要对时间序列段进行切分处理,采用时间窗口为3,移动步长step为1的滑动窗口切分法;
步骤S3所述的数据标准化将不同量级的数据统一转化为同一个量级,计算公式为:
其中,x_ori表示待处理的数据,μ表示样本数据的平均值,σ表示样本数据的标准差,x表示经过z-score标准化后的输出数据。
5.根据权利要求1所述的一种融合EMD和LSTM的城市PM2.5浓度预测方法,其特征在于,步骤S4采用LSTM对分解后的各IMF分量和残余量RES分别进行建模,将数据集按照80%,10%,10%的比例划分为训练集、验证集和测试集,将前3小时的空气污染物数据、气象数据作为输入数据来预测未来1小时的PM2.5浓度,设置模型的输入层神经元个数为13,隐藏层神经元个数为7,输出层神经元个数为1,模型的损失函数为MSE损失函数,优化器选择为Adam优化器,学习率为0.001,模型的评价指标为均方根误差函数RMSE和平均绝对百分误差函数MAPE。
6.根据权利要求1所述的一种融合EMD和LSTM的城市PM2.5浓度预测方法,其特征在于,步骤S5所述的反归一化计算公式为:
xout=σ×xpred+μ
其中,xpred表示经过步骤S4网络模型输出的数据,μ表示样本的平均值,σ表示样本的标准差,xout表示经过反归一化后的PM2.5浓度预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911359480.X/1.html,转载请声明来源钻瓜专利网。