[发明专利]一种强化递阶学习驱动的时空交通流预测方法有效
申请号: | 201910920367.8 | 申请日: | 2019-09-26 |
公开(公告)号: | CN110634294B | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 刘秀萍 | 申请(专利权)人: | 盐田港国际资讯有限公司 |
主分类号: | G08G1/01 | 分类号: | G08G1/01 |
代理公司: | 东莞市创益专利事务所 44249 | 代理人: | 李卫平 |
地址: | 518000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 强化 学习 驱动 时空 通流 预测 方法 | ||
1.一种强化递阶学习驱动的时空交通流预测方法,其特征在于:包括抽取录入数据、受限玻尔兹曼机模型驱动提取交通流特征、基于SVM模型的道路交通流预测,抽取录入数据包括高关连道路选择抽取和基于主分量分析的原数据压缩,具体步骤为:
第一步,高关连道路选择抽取;
第二步,基于主分量分析的原数据压缩;
第三步,受限玻尔兹曼机模型驱动提取交通流特征;
第四步,基于SVM模型的道路交通流预测;
通过一种相关性度量方式评测不同道路在不同时间对于预测道路的影响,高关连道路选择抽取选取皮尔逊积矩相关系数来衡量每条道路在不同时刻的交通流与待预测道路在预测时间点的交通流的相关度,由于皮尔逊积矩相关系数绝对值越接近于1,表示两条道路交通流的相关度越高,所以通过比较计算结果,对计算结果进行相关度高低排序,由高到低,最后选取前h个高关联的道路以及相应时间点,也就是在那个时间点的那条相关道路上的交通流和待预测道路在预测时间点的交通流关联性很高,在挑取了高关联的前h条相关道路及时间点后,得到相应参数,包括该道路和待预测道路的距离,该道路在该时间点的交通流量以及状态,该道路的长度和宽度,用主分量分析方法对这些信息进行进一步的压缩,主分量分析从一系列相互包含、有冗余的信息中,提取出最主要的那些成分,代表所有的信息,利用主分量分析法,只提取前r个主分量,则这些信息可以代表整个h条相关道路及相应时间点的所有相关信息,经过压缩后的数据更加有效的训练强化递阶学习网络,将其输入到限制玻尔兹曼机,得到和录入数据包含相同主要特征的隐藏层特征,通过受限玻尔兹曼机的网络迭代,提取出道路交通流的本质特征,最后将提取出的交通流本质特征经过SVM分类,SVM将低维的数据映射到高层特征空间,找到最优间隔的超平面,对数据进行分类,得到最后的交通流预测结果;
抽取录入数据先后包括高关连道路选择抽取和基于主分量分析的原数据压缩两个步骤,在录入层数据选择上,首先根据计算出的关连道路与预测道路的皮尔逊积矩相关系数,选择抽取出相关度最高的前h条道路,然后从这h条道路的相关信息中,包括交通流的平均流量、时间间隔、地理距离和第h条道路在f时间点的交通流量状况、道路宽度和长度,利用主分量分析方法提取出能够反映全部信息的主分量,完成对原始录入数据的提取;
第一步,高关连道路选择抽取中,交通路网中预测一条道路在未来某个时间段的交通流量,该道路在该时间点的交通流量是由其相邻道路在之前不同时间点的交通流量汇合而成的,与待预测道路相距越近的道路,在较短的时间内交通流就能汇合到待预测道路上,与待预测道路相距越远的道路,交通流汇合到待预测道路上所需要的时间越长,利用皮尔逊积矩相关系数作为衡量指标挑选出和待预测道路高关联的道路以及时段作为录入变量:
其中C表示道路流量之间的相关系数,其中Ai和Bi分别是相邻道路A和待预测道路B的交通流量观测值,和分别为两个变量的均值,C描述的是相邻道路A和待预测道路B之间线性相关强弱的程度,C的取值在-1与+1之间,若C>0,相邻道路A和待预测道路B之间为正相关,即相邻道路的流量值越大,待预测道路的流量值也相应越大,如果C<0,相邻道路和待预测道路之间为负相关,即相邻道路的流量值越大,待预测道路的流量值反而越小,C的绝对值越大表明相邻道路和待预测道路之间的相关度越高;
设当前时间点为f,首先找出所有在时间范围FΔf内可到达待预测道路B的道路集合A,Δf为时间间隔,总共按照e天计,每条道路在记录里第g天的交通流采样数据集为:
{Ag(f),Ag(f-Δf),Ag(f-2Δf),…,Ag(f-nΔf)}(g=1,2,…,e),
其中,道路Ai在记录里第g天的交通流采样数据集为:
{Aig(f),Aig(f-Δf),Aig(f-2Δf),…,Aig(f-nΔf)},
待预测道路B在记录里第g天的交通流采样数据集为Bg(f+FΔf),道路Ai在时间点f之后k(j=1,2,…,n)个时间间隔的交通流量与待预测道路B在待预测时间点f+FΔf的交通流量的相关度由以下公式计算:
其中当对值越接近于1,表示相关度越高;
每条道路在每个采样时间点的交通流和待预测道路在预测时间点的交通流的相关度通过皮尔逊积矩相关系数计算得到,将计算结果相比较,从中选取高关联的前h个道路、相关时间点及信息作为交通流原始录入数据,其中Ffh表示选出的第h条相关道路在相关时间f时的交通流流量、Δfh表示距离预测时间的时间间隔、ΔehA表示距离待预测道路A的地理距离、表示第h条道路在f时间点的交通流量状况, Lh表示第h条相关道路的长度,Mh表示道路的宽度,MA表示待预测道路的位置,则第h条关连道路和待预测道路之间的地理距离通过以下公式计算:
ΔehA=Geo_Distance(MA,Mh);
第二步,基于主分量分析的原数据压缩中,高关连道路选择抽取中选取出的h条高关联道路的信息构成6×h的原始矩阵:
K=[k(1)k(2)…k(6)]F∈R6×h
其中k(i)=[k1(i)k2(i),...,kh(i)]∈Rh表示h条关连道路的第i个(i=1,2...,6)信息,将原数据正则化得到:
A=[a(1)a(2)…a(6)]F∈R6×h
其中是第j条相关路段的第i个信息的方差,是第j条关连道路的第i个信息的平均值,道路交通流的协方差矩阵为:
其中协方差矩阵的所有特征值可以通过矩阵计算得到,序列为λ1≥λ2≥...≥λ6≥0;
由于主分量包含最主要的信息,只需要提取出部分主分量,则可反映出所有分量中包含的信息,每一个特征值的贡献率为:
前r个主分量的累积贡献率为∑αr,当贡献率超过一个常量ψ时,仅需要提取出前r个主分量代表所有的分量信息:
第三步,受限玻尔兹曼机模型驱动提取交通流特征中,利用受限玻尔兹曼机的深层模型对交通网络建模,从交通流中提取出抽象特征,有利于后续的分类;
将经过主分量分析方法提取后的r个主分量的h个交通流特征作为限制玻尔兹曼机模型的交通流特征参数录入向量v=(v1,v2,...,vrh)F,输出的是q个隐藏特征向量s=(s1,s2,...,sq)F,其中每个交通流特征录入节点只和q个隐藏特征节点相关;
受限玻尔兹曼机网络中包含几个参数,一是交通流特征录入层与隐藏特征层之间的权重Mij,二是交通流特征录入节点的偏移向量a=(a1,a2,...,ars)F,三是隐藏特征节点的偏移向量b=(b1,b2,...,bq)F,Mij、a、b决定受限玻尔兹曼机网络将一个rh维交通流特征录入样本编码成的q维隐藏特征样本,对于给定参数θ=(Mij,ai,bj)的受限玻尔兹曼机模型,交通流特征录入向量v和隐藏特征层输出向量s之间的能量函数值为:
由能量函数来决定一个交通流特征录入节点的一组交通流特征取值和一个隐藏特征节点的一组交通流状态特征取值发生的联合概率P(v,s),两者之间的联合概率为:
其中是归一化因子,用来正则化概率函数;
在受限玻尔兹曼机模型中,给定可以得到下面的概率值公式:
关于交通流特征录入v的概率分布函数为:
将交通流特征录入v改成函数的自变量x,则关于x的概率分布函数为:
将一个中间变量F(x)定义为:
所以关于x的概率分布写为:
对x的概率分布的偏导函数取负:
从上面公式中可以看出,当系统的能量值最小时,受限玻尔兹曼机网络达到稳定,而要使能量U最小,则需使F(v)最小,也就是要使P(v)最大:
参数θ=(Mij,ai,bj)通过对比发散算法学习得到:
第四步,基于SVM模型的道路交通流预测中,由受限玻尔兹曼机提取得到交通流特征后作为SVM的录入,将该录入映射成为一个特征空间上的训练数据集:
F={(A1,B1),(A2,B2),...,(AN,BN)}
其中Ai=(A11,A12,...,A1q),i=1,2,...,N,Ai为第i个由交通流数据录入映射而成的特征向量,Bi为Ai的类标记,即交通流状态标记;
SVM学习的目标是在由交通流数据录入映射而成的特征空间中找到最优分离超平面将特征向量分类到不同的五种交通流状态中,分离超平面对应的方程为f(A)=wFA+b,由法向量w和截距b决定,当(A,B)这个实例在超平面上时,w*A+b=0,|w*A+b|能够表示特征向量A到超平面的距离,通过观察w*A+b的符号和交通流状态标记B的符号是否一致可判断分类是否正确;
其中最大间隔分类超平面的间隔用几何间隔表示为:
则最大间隔分类器的目标就是要找到max J,该目标在相应的约束条Bi(wFAi+b)≥1,i=1,2,...,n下,进一步转化为:
因为求的最大值相当于求的最小值,上述目标函数等价为:
由于该问题的特殊结构,还可通过拉格朗日对偶性变换到对偶变量的优化问题,即通过求解与原问题等价的对偶问题得到原始问题的最优解,即线性可分条件下SVM的对偶算法;
通过线性SVM分类,最后可以得到在时间戳f时交通流5种状态的概率向量:
P(f)=[p(state=拥堵),p(state=缓慢),p(state=正常),p(state=较畅通),p(state=畅通)]
SVM分类后,根据时间戳f时交通流的概率向量,得到最后的道路交通流预测结果。
2.根据权利要求1所述的一种强化递阶学习驱动的时空交通流预测方法,其特征在于:高关连道路选择抽取中,设当前时间为fa,fa为上午10点,F=5,在10分钟内能到达待预测道路B的道路集合为{A1,A2,A3,A4,A5,A6},规定每Δf=2分钟采一次样,选取每条关连道路在过去10天中上午10点到9点30分每隔2分钟的交通流数据,其中A2道路在第一天的交通流采样数据集为{A21(fa),A21(fa-Δf),A21(fa-2Δf),A21(fa-3Δf),A21(fa-4Δf),...,A21(fa-15Δf)},还有待预测道路在点过去的10天中上午10点10分的采样数据,其中待预测路段B在第一天的采样数据为B1(fa+5Δf),通过10天内上午9点58分A2路段的采样数据集{A21(fa-Δf),A22(fa-Δf),A23(fa-Δf),...,A210(fa-Δf)}和待预测路段B在10天中上午10点10分的采样数据集{B1(fa+5Δf),B2(fa+5Δf),...,B10(fa+5Δf)},计算得到A2道路在上午9点58分(某采样时间点)的交通流和待预测道路在上午10点10分(预测时间点)的交通流之间的相关度:
其中C表示道路流量之间的相关系数,其中Ai和Bi分别是相邻道路A和待预测道路B的交通流量观测值,和分别为两个变量的均值,C描述的是相邻道路A和待预测道路B之间线性相关强弱的程度,C的取值在-1与+1之间,若C>0,相邻道路A和待预测道路B之间为正相关,即相邻道路的流量值越大,待预测道路的流量值也相应越大,如果C<0,相邻道路和待预测道路之间为负相关,即相邻道路的流量值越大,待预测道路的流量值反而越小,C的绝对值越大表明相邻道路和待预测道路之间的相关度越高,设当前时间点为f,首先找出所有在时间范围FΔf内可到达待预测道路B的道路集合A,Δf为时间间隔,总共按照e天计,待预测道路B在记录里第g天的交通流采样数据集为Bg(f+FΔf)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盐田港国际资讯有限公司,未经盐田港国际资讯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910920367.8/1.html,转载请声明来源钻瓜专利网。