[发明专利]基于粒子群参数优化和随机森林的PM2.5浓度预测方法有效
申请号: | 201911004338.3 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110766222B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 谢珺;谢新林;何秋生;李松洲;谢刚 | 申请(专利权)人: | 太原科技大学;太原理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/26;G06N3/006 |
代理公司: | 太原科卫专利事务所(普通合伙) 14100 | 代理人: | 朱源;曹一杰 |
地址: | 030024 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 粒子 参数 优化 随机 森林 pm2 浓度 预测 方法 | ||
本发明公开一种基于粒子群参数优化和随机森林的PM2.5浓度预测方法,包括如下步骤:步骤1、获取需要进行预测分析的空气质量数据,并且划分为训练数据集与验证数据集;步骤2、对获取的数据进行预处理;步骤3、初始化粒子群算法(PSO)的各参数,设置参数如下:群体规模m,粒子的位置和速度的取值范围,适应度函数等;步骤4、输入训练集数据和粒子的位置,用随机森林算法训练预测模型;步骤5、以验证集数据在训练模型的均方根误差为适应度值,通过粒子群不断优化随机森林的子树的个数t和特征数f,得到最终的最优预测模型。采用本发明的技术方案,提高了数据质量,实现了预测模型参数的自适应选择,能够对未来一段时间内空气中的PM2.5浓度进行有效预测。
技术领域
本发明涉及空气质量预测技术领域,尤其涉及一种参与空气质量评价的PM2.5污染物浓度预测方法。
背景技术
空气污染问题近些年来已经成为全球的热点问题,伴随着雾霾等重污染天气的频频出现,以及人们环保意识与健康意识的提高,PM2.5浓度已经成为人们日常生活中常常关注的一个重要信息。为了能及时、准确地做好PM2.5浓度预警工作,国内外的众多学者和研究机构开始将研究重点转移到空气质量预测上来。
目前,已有多种算法模型被成功应用到空气质量预测上,并且取得了较好的结果。这些预测方法大致可以分为三种:基于统计模型的预测方法、基于物理化学机理模型的预测方法以及基于机器学习的预测方法。
基于机器学习的预测方法,是利用特定的学习算法从空气污染物浓度、气象参数以及其他相关联的历史数据中寻找相互之间的转化规律,简化了空气质量的预测流程。同时由于大数据时代的到来,各行各业都储备了海量的数据为机器学习提供了充足的学习样本,极大的促进了机器学习方法与应用的发展。近年来,很多学者都开始使用机器学习算法来进行空气污染物浓度预测。由于随机森林算法具有预测准确性能高、可以防止过度拟合、抗噪能力强等优点,并且杜续等人(基于随机森林回归分析的PM2.5浓度预测模型)和杨思琪等人(随机森林算法在城市空气质量预测中的应用)的研究实验中分别证明了随机森林算法要优于神经网络、支持向量机等算法,因此,本发明设计了一种粒子群算法对随机森林参数优化的PM2.5浓度预测方法。
发明内容
本发明要解决的技术问题是,提供了一种基于粒子群参数优化和随机森林的PM2.5浓度预测方法,通过对大量历史数据进行分析,得出PM2.5在大气中的演变规律,从而对未来一段时间内空气中的PM2.5质量浓度进行及时而准确预测。本发明通过采集空气质量监测站点的历史数据,包括气象数据、污染物浓度、时间及关联站点等信息,然后对收集的数据进行预处理,根据处理好的数据用随机森林算法建立预测模型,并用粒子群算法对随机森林的参数进行优化,得到最终预测结果。整个过程在大数据平台上进行,实现了对未来一段时间空气中的PM2.5浓度进行了高精度、快速且智能化的预测。
本发明是通过以下技术方案达到上述目的:基于粒子群参数优化和随机森林的PM2.5浓度预测方法,如图1所示,包括如下步骤:
步骤1、获取需要进行预测分析的空气质量数据,并且划分为训练数据集与验证数据集;
步骤2、对获取的数据进行预处理,其中包括缺失值填补、平衡采样等;
步骤3、初始化粒子群算法(PSO)的各参数,设置参数如下:群体规模m,每个粒子的位置和速度的取值范围,迭代次数k,设置适应度函数等;
步骤4、输入训练集数据和粒子的位置(子树的个数t和特征数f),训练随机森林预测模型;
步骤5、以验证集数据在训练模型的均方根误差为适应度值,通过粒子群算法不断优化随机森林的子树的个数t和特征数f,使模型的均方根误差为适应度值最小,得到最终的最优预测模型。
本发明方法的有益效果如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原科技大学;太原理工大学,未经太原科技大学;太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911004338.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理