[发明专利]一种基于多特征选择算法的污染物浓度反演方法在审
申请号: | 202110703108.7 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113379146A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 胡俊涛;陈一源;方勇 | 申请(专利权)人: | 合肥工业大学智能制造技术研究院 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/26;G06N3/04 |
代理公司: | 安徽合肥华信知识产权代理有限公司 34112 | 代理人: | 余成俊 |
地址: | 230000 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 选择 算法 污染物 浓度 反演 方法 | ||
本发明公开了一种基于多特征选择算法的污染物浓度反演方法,先对数据集进行归一化,再基于SVD分解协方差矩阵的PCA方法,实现数据集的降维处理,减少冗余数据,将降维后的数据作为带有弹性网络惩罚的自适应多项式回归学习机的输入,该学习机可以自适应调整不同的权重进行特征学习,且该自适应多项式回归学习机具有群组选择能力,结合群组选择结果和He方法初始化长短期记忆神经网络的权重,从而更好的解决梯度消失和梯度爆炸问题,将降维后的数据作为长短期记忆神经网络的的输入,在长短期记忆神经网络中使用TBPTT算法得到更精确的污染物浓度反演值。本发明可以提升数据处理的速度并且提高污染物浓度反演的精度。
技术领域
本发明涉及基于机器学习的浓度反演方法领域,具体是一种基于多特征选择算法的污染物浓度反演方法。
背景技术
国家目前用来评价环境空气质量的指标主要是基于六种污染物的浓度,分别是臭氧(O3)、二氧化氮(NO2)、二氧化硫(SO2)、一氧化碳(CO)、细颗粒物(PM2.5)、可吸入颗粒物(PM10)。
近年来,空气污染问题愈发严重,已经成为全球性问题。空气质量监测是应对空气污染的重要手段。国家建立了多个空气监测站点来实时监测空气污染状况,其数据准确度较高,但成本高昂,由政府部门统筹规划,部署较为稀疏。因此,通常使用较低成本的微型监测传感器设备构建大型传感器网络,实现密集化的区域监测。然而,由于受到温湿度、交叉干扰和传感器老化等因素的影响,微型传感器设备读数会和标准浓度之间存在一定的偏差。为确保网络中传感器的数据质量,需要对这些微型传感器数据进行浓度反演,目前反演任务面临较大挑战。
发明内容
,,,,本发明的目的是提供一种基于多特征选择算法的污染物浓度反演方法,应用于微型空气监测站中,空气微站中测得的数据包括六种空气污染物浓度值、以及温度、湿度、风速风向、气压值,将影响每一污染物浓度的因素分类并进行群组选择,结合群组选择结果和He方法,初始化长短期记忆神经网络的权重,并将通过主成分分析方法得到的数据集送入长短期记忆神经网络中进行浓度反演,进一步提升反演精度。
为了达到上述目的,本发明所采用的技术方案为:
一种多特征选择算法的污染物浓度反演方法包括以下步骤:
S10、获取数据集并进行预处理,所述数据集中包含多种空气污染物各自的多个参数;
S20、对步骤S10预处理后的数据集进行主成分分析,得到降维后的特征向量;
S30、生成带有弹性网络惩罚函数的自适应多项式回归学习机,将S20得到的降维后的特征向量作为所述自适应多项式回归学习机的输入,并向所述自适应多项式回归学习机引入每种空气污染物的各个参数对浓度反演结果影响的贡献率,然后令所述自适应多项式回归学习机自适应学习和迭代,获得输出群组选择结果;
S40、设定长短期记忆神经网络的超参数包括输入层节点数、输出节点数、隐含层及每层节点数、学习率、迭代次数等,生成长短期记忆神经网络LSTM模型,将S20得到的降维后的特征向量作为所述长短期记忆神经网络LSTM模型的输入,并通过S30得到的自适应多项式回归学习机的群组选择结果结合He方法对所述长短期记忆神经网络LSTM模型进行权重初始化;
然后基于TBPTT算法和Adam算法对长短期记忆神经网络LSTM模型进行正、反向传播计算和梯度下降计算,计算误差以更新长短期记忆神经网络LSTM模型的权重,并确定所述长短期记忆神经网络LSTM模型的权重值,得到对应的长短期记忆神经网络LSTM模型;
S50、获取训练集数据样本,采用训练集数据样本对S40最终得到的长短期记忆神经网络LSTM模型进行训练,直至满足预设的训练条件,由训练后的长短期记忆神经网络LSTM模型作为浓度反演模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学智能制造技术研究院,未经合肥工业大学智能制造技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110703108.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理