[发明专利]一种基于ST-CCN-PM2.5的PM2.5浓度细粒度预测方法在审
申请号: | 202111428869.2 | 申请日: | 2021-11-27 |
公开(公告)号: | CN113962489A | 公开(公告)日: | 2022-01-21 |
发明(设计)人: | 林绍福;赵俊杰;张羽民;李建强;刘希亮 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/04;G06N3/06;G06N3/08;G06Q50/26 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 st ccn pm2 浓度 细粒度 预测 方法 | ||
1.一种基于ST-CCN-PM2.5的PM2.5浓度细粒度预测方法,其特征在于:步骤如下:
(1)获取各个空气监测站的空气污染物及气象的小时级监测数据,并对数据进行存储和预处理;
(2)从与目标站点空间强相关的站点数据中挖掘时空依赖特征,构建ST-CCN-PM2.5模型;
(3)调整相关性阈值、数据归一化、数据划分以及滑动窗口参数,进行多组对比实验,完成超参数调优;
(4)对参数调优后的ST-CCN-PM2.5模型进行训练,并与基准模型进行性能比较;
(5)输出目标站点未来一小时PM2.5浓度预测值。
2.根据权利要求1所述的一种基于ST-CCN-PM2.5的PM2.5浓度细粒度预测方法,其特征在于,所述步骤(1)中,进行数据预处理包括:
(1)对采集到的空气污染物与气象数据中的缺失值进行填充;对于时间跨度较小的缺失值,采用线性插值或者二次插值来填充缺失值;对于长时间跨度的缺失值的情况,使用临近日期内相同时间段的数据进行填充;
(2)计算NO2、风向、风速、PM10、CO、相对湿度、大气压力、温度、SO2、O3特征序列与PM2.5浓度序列的相关性,选择与PM2.5相关性小的因素作为输入ST-CCN-PM2.5模型的特征;
(3)由筛选得到的特征序列构建特征矩阵,将95个站点的特征矩阵扩充至初始矩阵的五倍规模。
3.根据权利要求1所述的一种基于ST-CCN-PM2.5的PM2.5浓度细粒度预测方法,其特征在于,所述步骤(2)中,构建ST-CCN-PM2.5模型包括:
(1)利用相关性分析及空间注意力机制提取、融合空间强相关站点信息,具体步骤包括:
(a)计算目标站点和其他站点PM2.5历史数据之间相关性系数,使用皮尔森相关性系数衡量两个站点的相互影响程度;计算公式如下所示:
其中Y*代表目标站点PM2.5浓度历史数据,Yi代表其他站点PM2.5浓度历史数据;cov()是协方差函数,和分别是两个站点数据的方差;由上述公式计算得到目标站点和全部站点的相关性系数ρ_list,如下所示:
ρ_list=[ρ(Y*,Y1),ρ(Y*,Y2),...,ρ(Y*,YM)] (2)
在(2)式中获取了全部M个站点和目标站点的相关性系数;将相关性系数和阈值比较,最终得到与目标站点相关性系数大于ρth的站点数据的集合如下:
X={Xi|ρ(Y*,Yi)>ρth,i∈1,...,N} (3)
在(3)式中,Xi∈RT×L为第i个与目标站点空间强相关站点的特征矩阵,X∈RM×T×L代表与目标站点空间强相关的三维特征矩阵,其中M<=N,M代表与目标站点空间强相关的站点数量;
(b)利用1×1卷积核,对X∈RM×T×L这个特征矩阵中M个通道的特征值进行线性组合来完成升维操作,经过升维处理后三维矩阵变为其中Mnew表示升维后的通道数量;
在升维过程中,采用的1×1卷积核数量大于特征矩阵的通道数量,经过卷积运算使不同通道信息得以交互和融合,从而增大输入矩阵通道数量,提升模型对非线性特征的提取能力;
(c)基于空间注意力机制实现降维操作,提取各通道第i项特征序列与目标站点第i项特征序列的相关性系数,基于相关性信息计算权重分布,各通道第i项特征序列依据权重值线性组合为该特征的序列;循环进行此过程将三维特征矩阵聚合至二维矩阵;
首先对目标站点的第i个特征序列与Mnew个特征矩阵中的第i个特征序列进行相关性分析,计算皮尔逊相关性系数;计算公式如下所示:
在(4)式中表示第m个通道第i个特征序列与目标序列的相关性,表示目标站点的第i个特征序列,表示第m个通道的第i个特征序列,Pearson()表示皮尔逊相关性系数的计算方法;
其次引入SoftMax的计算方法对第一阶段的相关性系数进行数值转换,将原始相关性系数整理成所有元素权重之和为1的概率分布,这样做也能更加突出重要特征序列的权重;计算公式如下:
其中表示第m个通道的第i个特征序列的注意力权重;
最后,将各通道的第i项特征序列乘以对应的权重值再求和,使第i项特征序列聚合为最终序列,由聚合后的各项特征序列构成最终特征矩阵;因此最终降维聚合后的特征序列及特征矩阵应如以下公式所示:
(2)利用膨胀卷积从特征矩阵中提取有效的时间依赖关系,具体步骤包括;
(a)使用步骤(1)最终形成的二位特征矩阵作为时序数据输入膨胀卷积;
(b)膨胀卷积允许卷积时的输入存在间隔采样,采样率受到膨胀因子d的控制;最下面一层d=1,表示输入时每个点都采样,中间层d=2,表示输入时每两个点采样一个作为输入;随着层数的升高,膨胀因子呈指数型增长;在不同网络层次中提取到不同周期的时间依赖关系,提升数据预测的准确性;在xt处的膨胀因子为d的膨胀卷积如下所示:
如公式(7)所示,滤波器F=(f1,f2,…,fK),序列X=(x1,x2,…,xT),*d为膨胀卷积运算符;K表示膨胀卷积内核大小,T代表历史数据时长;在低网络层中,滤波器fk与t-(K-k)d时刻的数据进行卷积,最后求和,得到高一级层次中t时刻的数据;设置滤波器大小k=3,网络深度为4,且使用d=2i的膨胀因子,以此来保证预测结果覆盖到长期历史数据,避免引入噪声数据,i是网络深度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111428869.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理