[发明专利]一种基于深度学习的PM2.5 在审
申请号: | 202011041190.3 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112183625A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 焦利民;毛文婧;王卫林;刘安宝;张威 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06F16/28 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 齐晨涵 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 pm base sub 2.5 | ||
本发明公开了一种基于深度学习PM2.5浓度时空预测的方法,首先对地面监测站点的PM2.5数据和多源数据进行数据预处理以及时空匹配,并对气象数据、空间相关数据以及物理特征数据等多源数据进行影响因素分析选取相关特征因素作为模型的辅助输入数据;基于地面监测站点的PM2.5数据的时空相关性分析获取合适的时间滞后变量,并对监测站点进行聚类;基于历史序列和邻近格网的PM2.5浓度值,再结合相关辅助数据,利用改进的LSTM模型输出未来时刻该格网的PM2.5浓度值并进行精细PM2.5时空分布制图,该方法不仅可以提高长期时空预测的精度,而且可用于预测空间连续大范围未来时刻的PM2.5浓度,满足实际应用中的需求。
技术领域
本发明属于人工智能和信息应用技术领域,具体涉及一种基于深度学习PM2.5浓度时空预测的方法。
背景技术
PM2.5浓度高精度时空预测对大气污染管理和防治、公众环境信息服务等具有重要的现实意义。随着人工智能的发展,基于深度学习的模型特别是长短期记忆模型由于其优秀的长时间序列依赖性能被广泛应用于PM2.5浓度预测。诸多学者建立了基于常短期记忆网络模型,又名LSTM模型,对不同地区的PM2.5浓度进行预测研究,并对模型进行评价,验证了基于LSTM模型在PM2.5浓度时空预测的适用性。此外基于LSTM模型与多元线性回归模型、支持向量回归模型和简单人工神经网络模型的对比研究,也说明了相对于其他研究方法LSTM模型在适用度、模型精度、评估效果等多方面均有不错的表现。
但目前基于LSTM模型的相关研究没有将时间依赖性特征与污染物颗粒浓度的空间相关性特征有效地整合在一起,没有长期任务高精度的预报结果,并且目前的研究预测PM2.5浓度很少有全国尺度高精度时空预报结果。目前相关技术仅仅利用考虑了站点的预测,但已有监测站点数量较少且分布稀疏不均匀,仅仅站点的预测无法满足应用的需求,实现PM2.5时空连续预测在各个应用中发挥重要的作用。目前大多数模型都忽略了PM2.5监测站之间的地理距离以及Tobler提出的《第一地理定律》空间相关性的影响。此外,各种研究表明,PM2.5浓度的分布显示出显著的空间自相关,并且也会受到气象因素、土地使用、源排放和相关地理因素的影响。
发明内容
本发明的目的在于,针对现有技术的上述不足,提供一种基于深度学习方法,并结合多源数据的PM2.5高精度时空预测的方法。
本发明的技术方案:一种结合多源数据的PM2.5深度学习时空预测方法,包括以下步骤:
步骤1:选取影响PM2.5的多源数据进行预处理和影响因素分析,所述多源数据包括地面监测站点PM2.5数据、气象数据、空间相关数据以及物理特征数据;
步骤2:对所述多源数据进行时空匹配;
步骤3:基于时空相关性将PM2.5数据进行聚类并找到合适的时间滞后值;
步骤4:利用递归的LSTM模型,对各个聚类站点的PM2.5值进行训练;
步骤5:对预报结果进行精细PM2.5时空分布制图。
进一步地,所述步骤1中对多源数据进行预处理的过程具体为:对数据进行异常值剔除和缺失值填补,其中缺失值填补采用前置填补法、后置填补法以及周围站点均值填补法。通过数据预处理过程从而提高数据的质量,包括数据的准确性、完整性、一致性、时效性、可信性和可解释性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011041190.3/2.html,转载请声明来源钻瓜专利网。