[发明专利]一种基于DSTGCN的交通预测方法在审
申请号: | 202210832861.0 | 申请日: | 2022-07-14 |
公开(公告)号: | CN115578852A | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 胡佳;蔺想红;王楚;张振;周莎莎 | 申请(专利权)人: | 西北师范大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G06N3/04;G06N3/08 |
代理公司: | 北京盛凡佳华专利代理事务所(普通合伙) 11947 | 代理人: | 蔡浩 |
地址: | 730030 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 dstgcn 交通 预测 方法 | ||
1.一种基于DSTGCN的交通预测方法,其特征在于包括下述步骤:
定义:DSTGCN全称为Dynamic Spatial-Temporal Graph Convolutional Network,即动态时空图卷积网络,是一种动态交通预测方法,它的核心目标是通过获取的历史交通数据来预测未来时间段的交通数据,DSTGCN主要包括四个部分,时空嵌入、动态图生成器模块,图卷积模块、门控融合单元模块以及转换注意力机制模块,具体来说,本发明提出了一种动态图生成算法,动态邻接矩阵在不同的时间步自适应融合近邻性和空间异质性信息,可以有效的描述交通路网的动态特性,提高预测性能,随后设计了一个基于图卷积和门控融合单元的动态时空图卷积网络,以及一个门控单元来自适应融合空间和时间特征,并在编码器和解码器之间添加转化层以降低误差传播,最后在两类交通任务上进行了充分的实验,结果表明,DSTGCN模型在长期预测上取得了优秀的预测结果,并且拥有足够的泛化性能力,其具体的步骤如下:
步骤1:以交通流量数据集为例,为解决长时程时间序列预测问题,本发明设计了一种基于动态时空图卷积的预测模型DSTGCN;首先确定模型的输入和输出,以及预测目标,随后选择合适的数据集,并对数据集进行合适的划分,模型是由Pytorch 1.8.0在一个拥有24G内存的Nvidia GeForce RTX 3090GPU的虚拟工作站上实现的,通过Adam优化器对模型进行训练,初始学习率设置为0.01,批量大小设置为64,模型维度dmodel设置为64,注意力个数h设置为8,使用早停机制避免过拟合,同时保存在验证集上表现最佳的模型,按照通用的划分标准,70%的数据用于训练,10%的数据用于验证,其余20%的数据用于测试,通过给定交通网络中N个传感器在Th个时间步的历史交通数据学习一个函数f,它能够预测所有传感器在未来Th个时间步的交通状况,具体可表示为:
步骤2:数据预处理;从传感器提取的流量数据通常存在异常值和一些噪音,采用标准化处理可以间接通过中心化避免异常值和极端值的影响,本发明中对整体数据集进行Z-Score规范化处理;
步骤3:定义交通路网信息;本发明将交通路网定义为一个加权有向图G=(V,E,A),其中V是一个N=|V|的节点集合,每个节点对应道路网络中的传感器,E是一组M=|E|的边的集合,每条边都表示节点之间具有连通性,是一个加权邻接矩阵,表示节点vi和节点vj的距离;
步骤4:时空嵌入模块;首先,使用one-hot编码方法对序列的时间进行编码,将一天划分为T个时间步长,将一周中的天和一天中的小时进行编码,分别用和表示,并且将它们连接变成向量表示其次,通过node2Vec算法学习交通网络节点的空间结构表示,得到全局向量表示是时空嵌入矩阵表示,其中向量是节点vi在tj时间步的时空嵌入表示;
步骤5:动态图生成模块;道路的交通状况随时间动态变化,在长期范围内呈现周期变化,短期范围内受人口密度、车辆密度和突发事故等因素影响表现出高度的波动性,因此,从动态的角度描述交通网络是很有必要的,本发明中的动态图生成模块主要通过门控融合单元在不同的时间步自适应融合地理近邻性信息和空间异质性信息;
步骤5.1:构建基于距离的静态图;发明中使用阈值高斯核函数距离度量不同的道路对之间的近邻性,具体表示如下:
其中表示路网中节点vi到节点vj的距离,μ是标准差,ε是控制邻接矩阵A稀疏度的阈值,指定为0.1;
步骤5.2:构建基于空间异构的静态图;建模交通网络的空间异质性是困难的,比如路网中传感器A和传感器C所处于两个不同区域的中学附近,地点性质相同,但是距离较远,传感器A和传感器B的性质不同,但是距离较近,而相对于传感器B,传感器A和传感器C有更相似的变化趋势。这意味着交通网络中存在空间异质性,如何描述这种现象是需要考虑的,首先通过node2Vec算法得到交通路网中节点的向量表示:
S=node2Vec(A);
其中,A是邻接矩阵,是交通网络中所有节点的空间向量表示,是节点vi的空间向量表示,为了度量节点对之间的相似性,本发明利用余弦相似度算法来求得两两节点对之间的相似度:
其中,表示节点vi和vj之间的相似度,的值越大说明节点vi和vj的地点性质趋近于一致,θ代表两个向量的夹角,为了能更清楚的表示节点间的相似程度,随后对相似度进行归一化处理:
其中,表示节点vi和vj的相关性分数;
步骤5.3:具体动态图生成器的过程;本发明设计了一个动态图生成模块,它由基于距离的图A和基于空间异质的图M和门控融合单元三部分构成,具体地,将门控融合单元的操作表示为:
zt+1=sigmoid(WDDt+UMM);
Dt+1=zt+1⊙M+(1-zt+1)⊙Dt;
其中zt+1是t+1时间步控制M和Dt的门,⊙表示数组元素依次相乘,Dt+1是t+1时间步生成的动态邻接矩阵,在得到t时间步的邻接矩阵Dt之后,通过节点的消息传递效应来表示节点的交通状况:
其中,将Xt和Ut连接作为t时间步图信号的输入,表示t时间步图信号的输出,和都是学习参数,σ(·)是ReLU(·)激活函数;
步骤5.4:图卷积循环模块;本发明将图卷积运算应用于门控融合单元的输入表示,利用邻域信息来表示节点的交通状况:
接着,给定t时间步的输入和t-1时间步的隐藏表示门控融合单元的操作可以被表示为:
其中,是t时刻的输出,和都是可学习的参数,最后将Q个时间步的输出进行连接:
YT=concat(Yt,Yt+1…,Yt+Q-1);
其中表示编码器在Q个时间步上的图信号输出;
步骤5.5:转换注意力机制;注意力机制通过未来时间步对历史时间步的关注度进行建模,从而得到未来时间序列表示,具体表示为:
其中是未来时间步ti对历史时间步tj的注意力得分,分别是ti时间步和时间步tj所有节点的时空嵌入表示,在得到注意力得分后,未来时间步自适应选择过去时间步的相关特征,将历史时间序列转换为未来时间序列表示:
X是编码器的输出,是节点vi在tm时间步的交通流量表示,是节点vi在未来ti时间步的交通流量表示,是可学习的参数,k是注意力头的个数;
步骤6:训练并优化DSTGCN预测模型;本发明为验证模型的合理性和有效性,在两类交通数据集上进行了广泛的实验,一类是关于公路交通速度的,另一类是关于公路交通流量的,为了进行评估,使用所有基线的默认设置来进行实验,所有方法的性能通过三种广泛使用的评估指标来进行评估,即MAE、RMSE和MAPE,其具体定义如下:
其中x=xi,…,xm表示真实值,表示预测结果,M是待预测时间序列的长度,设置为12;
为了进一步评价DSTGCN中各个组件的有效性,本发明在PeMSD8数据集上进行了消融实验,消融实验中DSTGCN的各个变体命名为:
DSTGCN-NS:它去除了空间模块,以研究空间模块的重要性;
DSTGCN-NT:它去除了时间模块,以研究时间模块的重要性;
DSTGCN-NDA:动态邻接矩阵被基于距离的邻接矩阵替换,以研究动态图对于性能的影响;
DSTGCN-NG:将时空自适应融合组件替换为简单的加法,以研究自适应融合的有效性;
DSTGCN与四种变体在相同的条件下进行了三次实验,结果取平均值,实验结果证明DSTGCN在30min-60min内的预测结果始终优于其他变体,表明空间模块、时间模块和门控融合在建模复杂时空相关性方面的有效性;
为了进一步研究超参数设置对模型性能的影响,本发明在PEMSD8数据集上对DSTGCN的模型维度d、层数L以及激活函数和相似性度量方法的敏感性展开研究,除了变化的参数,所有设置均相同,本发明将每个实验重复三次,并报告测试集指标的平均值,实验结果表明,增加隐藏单元的当隐藏单元的数量维持在64时,模型性能最好,随着隐藏单元数量不断增加,性能逐渐下降,这可能是由于产生了过拟合;当模型层数为1层时,模型性能最好,层数越深不仅会降低运行速度,还会产生过拟合;与其他激活函数相比,ReLU解决了梯度消失问题,并且计算速度、收敛速度更快,它将负值输出为0的特性在一定程度上缓解了过拟合问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北师范大学,未经西北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210832861.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于MGCN的交通预测方法
- 下一篇:一种可智能操作的磁吸式风扇组