[发明专利]一种基于深度学习的长期及短期交通流预测模型构建方法在审
| 申请号: | 201910855977.4 | 申请日: | 2019-09-11 |
| 公开(公告)号: | CN110610232A | 公开(公告)日: | 2019-12-24 |
| 发明(设计)人: | 沈强儒;施佺;曹阳;曹慧;葛文璇;汤天培;刘志杰;邱礼平 | 申请(专利权)人: | 南通大学 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/10 |
| 代理公司: | 32249 南京瑞弘专利商标事务所(普通合伙) | 代理人: | 许洁 |
| 地址: | 226000*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 递归神经网络 时间序列 卷积神经网络 模型体系结构 时间序列预测 非线性模型 交通流预测 基准数据 模型构建 实证研究 线性模型 重复模式 最新结果 鲁棒性 自回归 卷积 捕捉 预测 改进 展示 网络 分析 发现 成功 学习 | ||
1.一种基于深度学习的长期及短期交通流预测模型构建方法,其特征在于:包括如下:
1、问题制定:
制定多变量时间序列预测的任务:
给出一系列完全观察到的时间系列信号:Y={y1,y2,...yT}其中yt∈Rn,n是可变维度;为了预测yT+h,其中h是当前时间戳之前的理想地平线,假设{y1,y2,...yT}可用;同样,为了预测下一个时间戳yT+h+1的值,假设{y1,y2,...yT,yT+1}可用;在时间戳T处制定输入矩阵XT={y1,y2,...yT}∈Rn×T;根据环境设置的要求选择预测任务的范围;
2、卷积分量:
LSTNet架构是一个深度学习框架,专门针对多变量时间序列预测任务而设计,混合了长期和短期模式;LSTNet架构的第一层是一个没有池的卷积网络,提取时间维度中的短期模式以及变量之间的本地依赖性,卷积层由宽度ω和高度n的多个滤波器组成,高度设置为与变量的数量相同;第k个滤波器扫描输入矩阵X并产生:hk=RELU(Wk*X+bk),其中:*表示卷积运算,输出hk是矢量,RELU函数是RELU(x)=max(0,x);通过输入矩阵X左边的零填充来使长度为T的每个向量hk,卷积层的输出矩阵的大小为dc×T,其中
dc表示滤波器的数量;
3、经常性组件:
卷积层的输出同时馈入Recurrent组件和Recurrent-skip组件,Recurrent组件是具有门控循环单元GRU的循环层,并使用RELU功能作为隐藏更新激活功能,时间t处的重复单位的隐藏状态计算为:
rt=σ(xtWxr+ht-1Wxr+br);
ut=σ(xtWxr+ht-1Wxr+bu);
ct=RELU(xtWxc+rt⊙(ht-1Wxr)+br);
ht=(1-ut)⊙ht-1+ut⊙ct;
其中⊙是元素乘积,σ是sigmoid函数,xt是该层在时间t的输入;该层的输出是每个时间戳的隐藏状态;
4、递归跳过组件:
开发一个具有时间跳跃连接的循环结构,以扩展信息流的时间跨度,从而简化优化过程,具体的,跳过链接是在当前隐藏单元格和相邻期间处于同一阶段的隐藏单元格之间添加的;更新过程可以表述为:
rt=σ(xtWxr+ht-pWhr+br)
ut=σ(xtWxu+ht-pWhu+bu)
ct=RELU(xtWxc+rt⊙(ht-pWhc)+bc)
ht=(1-ut)⊙ht-p+ut⊙ct
这一层的输入是卷积层的输出;p是跳过的隐藏单元数,对于周期模式清晰的数据集,p的值可以很容易地确定,否则就得调;良好的调优p能显著提高模型的性能,此外,LSTNet可以很容易地扩展到包含跳跃长度p的变量;
使用一个密集的层组合的输出的经常性和经常性的跳过组分;对密集层的输入包括在时间戳t处的递归分量的隐藏状态(以表示),以及反复跳过组件从时间戳t-p+1到t的递归跳过分量p的隐藏状态,表示为密集层的输出计算公式为:
其中,表示神经网络(上)部分在时间戳t上的预测结果;
5、时间注意层:
加入注意机制,它在输入矩阵的每个窗口位置上学习隐式表示的加权组合,具体而言,在当前时间戳t处的注意权重αt∈Rq计算为:
其中,为RNN列隐表示的矩阵叠加,AttnScore是一些相似的函数,如点积、余弦或由一个简单的多层感知器进行参数化;
时间注意层的最终输出是加权上下文向量ct=Htαt和最后一个窗口隐藏表示的连接,以及一个线性投影操作:
6、自回归分量:
将LSTNet的最终预测分解成一个线性部分,它主要关注局部缩放问题,以及包含反复出现的模式的非线性部分;在LSTNet体系结构中,采用经典的自回归(AR)模型作为线性分量;所有维度都有相同的线性参数集,AR模型如下:
然后,通过集成神经网络部分和AR组件的输出,得到LSTNet的最终预测:
其中,代表模型在时间戳t时的最终预测;
7、建立目标函数:
平方误差是许多预测任务的默认损失函数,相应的优化目标被表示为:
其中,Θ表示模型的参数集;ΩTRAIN;||·||F是Frobenius范数;
线性支持向量回归的目标函数为:
ξt,i≥0;
其中,C和ε是超参数,受线性支持向量机模型显著性能的激励,将它的目标函数作为平方损失的一种替代方法纳入LSTNET模型;假定ε=01,上述目标函数降为如下绝对损失函数:
绝对损失函数的优点是它对实时序列数据中的异常更为灵敏,在实验部分,使用验证集来决定使用哪个目标函数,平方损失Eq.7还是绝对损失Eq.9。
2.根据权利要求1所述的基于深度学习的长期及短期交通流预测模型构建方法,其特征在于:优化策略:假设输入的时间序列是Yt={y1,y2,...,yt},定义一个可调窗口大小q并且在时间戳处重新表示输入t作为Xt={yt-q+1,yt-q+2,...yt},然后,这个问题变成了一个带有一组特征值对{Xt,Yt+h}的回归任务,可以用随机梯度体面法或者它的变量求解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910855977.4/1.html,转载请声明来源钻瓜专利网。





