[发明专利]一种基于多特征选择算法的污染物浓度反演方法在审
申请号: | 202110703108.7 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113379146A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 胡俊涛;陈一源;方勇 | 申请(专利权)人: | 合肥工业大学智能制造技术研究院 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/26;G06N3/04 |
代理公司: | 安徽合肥华信知识产权代理有限公司 34112 | 代理人: | 余成俊 |
地址: | 230000 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 选择 算法 污染物 浓度 反演 方法 | ||
1.一种基于多特征选择算法的污染物浓度反演方法,其特征在于,包括以下步骤:
步骤1、获取数据集并进行预处理,所述数据集中包含多种空气污染物各自的多个参数;
步骤2、对步骤1预处理后的数据集进行主成分分析,得到降维后的特征向量;
步骤3、生成带有弹性网络惩罚函数的自适应多项式回归学习机,将步骤2得到的降维后的特征向量作为所述自适应多项式回归学习机的输入,并向所述自适应多项式回归学习机引入每种空气污染物的各个参数对浓度反演结果影响的贡献率,然后令所述自适应多项式回归学习机自适应学习和迭代,获得输出群组选择结果;
步骤4、设定长短期记忆神经网络的超参数,包括输入层节点数、输出节点数、隐含层及每层节点数、学习率、迭代次数等,生成长短期记忆神经网络LSTM模型,将步骤2得到的降维后的特征向量作为所述长短期记忆神经网络LSTM模型的输入,并通过步骤3得到的自适应多项式回归学习机的群组选择结果结合He方法对所述长短期记忆神经网络LSTM模型进行权重初始化;
然后基于TBPTT算法和Adam算法对长短期记忆神经网络LSTM模型进行正、反向传播计算和梯度下降计算,计算误差以更新长短期记忆神经网络LSTM模型的权重,并确定所述长短期记忆神经网络LSTM模型的权重值,得到对应的长短期记忆神经网络LSTM模型;
步骤5、获取训练集数据样本,采用训练集数据样本对步骤4最终得到的长短期记忆神经网络LSTM模型进行训练,直至满足预设的训练条件,由训练后的长短期记忆神经网络LSTM模型作为浓度反演模型;
步骤6、获取测试集数据样本,将测试集数据样本输入至步骤5得到的浓度反演模型,由浓度反演模型输出浓度反演测试结果。
2.根据权利要求1所述的一种基于多特征选择算法的污染物浓度反演方法,其特征在于,步骤1中进行数据预处理前,每个污染物浓度的数据集是一个m×n的矩阵,n个维度表示n个特征,即n个输入参数,每个数据集由m个特征向量构成;首先将数据集中的缺失值通过均值填补,然后将不同量纲、大小、性质的数据进行归一化处理,使得归一化处理后的数据均匀分布在[0,1]之间。
3.根据权利要求1所述的一种基于多特征选择算法的污染物浓度反演方法,其特征在于,步骤2中进行主成分分析处理时,先将数据集中m个n维特征向量去平均值,再通过SVD奇异值分解计算数据集的协方差矩阵,得到协方差矩阵的特征值,协方差矩阵的计算公式为:XXT,X为归一化后的数据集构成的矩阵,然后根据维度公式得出降维后的维度k,将数据转换到构建的m×k新空间中;维度的计算公式为:其中,为协方差矩阵的特征值,x(i)为矩阵X的特征值,t的大小根据要保留的信息进行选择,t为0.1时,保留90%的信息。
4.根据权利要求1所述的一种基于多特征选择算法的污染物浓度反演方法,其特征在于,步骤3中,向所述自适应多项式回归学习机引入指标矩阵V,所述贡献率矩阵表征每种空气污染物的各个参数对浓度反演结果影响的贡献率,贡献率矩阵ω的元素计算公式如下:
贡献率矩阵ω=(wki)k×j,其中k=1,2,…,j=1,2,…J,i为大于或等于1的自然数;K为污染物浓度种类数,J为影响该浓度反演的参数个数,m为数据集的行数,xi为步骤2中得到的数据集元素,wkj是参数j对k污染物浓度反演结果的贡献率;由此,通过引入指标矩阵V,得到所述自适应多项式回归学习机引入每种空气污染物的j个参数对浓度反演结果影响的贡献率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学智能制造技术研究院,未经合肥工业大学智能制造技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110703108.7/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理