[发明专利]一种基于复杂网络理论的城市交通异常识别方法有效

专利信息
申请号: 201911308389.5 申请日: 2019-12-18
公开(公告)号: CN111081016B 公开(公告)日: 2021-07-06
发明(设计)人: 李大庆;郑参 申请(专利权)人: 北京航空航天大学
主分类号: G08G1/01 分类号: G08G1/01;G08G1/065
代理公司: 北京慧泉知识产权代理有限公司 11232 代理人: 王顺荣;唐爱华
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 复杂 网络 理论 城市交通 异常 识别 方法
【权利要求书】:

1.一种基于复杂网络理论的城市交通异常识别方法,其特征在于:

步骤1,基于交通数据构建城市交通网络

在建立城市交通网络过程中,将每个交叉路口抽象为节点;将任意两交叉路口之间的路段抽象为连边;将路段上车载的平均速度作为连边的权重;同时由于不同级别的道路其畅通状况评价标准不同,因此需要采用相对速度表示道路的速度水平,将其作为边权;以交叉路口作为节点、以路段作为边和以路段的相对速度作为边权建立城市交通网络;

步骤2,基于复杂网络理论的特征提取及筛选

在城市交通系统中运用复杂网络的渗流理论对每个时刻的交通网络选定渗流阈值qc进行渗流分析,计算交通网络中的弱连通子团作为研究对象,即拥堵子团,同时对每个时刻的拥堵子团计算其度、聚类系数、介数、寿命、地理位置的特征,运用机器学习进行特征选择,筛选包含拥堵子团拥堵信息丰富的特征,从而提高拥堵异常识别及预测的准确率及可靠性;

步骤3,交通系统的异常识别及预测

为了准确地对城市交通系统中的拥堵异常进行识别及预测,并对其进行有效地控制;首先构建孤立森林模型即iForest模型,并将步骤2中提取筛选好的拥堵子团特征集分为训练集和测试集,运用训练集数据训练iForest模型,然后,运用已训练好的iForest模型对当前时刻的城市交通系统进行异常拥堵子团的识别及预测;

步骤4,模型评价及验证

在对城市交通网络进行拥堵子团异常险识别及预测过程中,为了评估模型的性能运用静态评价指标进行评价,根据混淆矩阵Confusion Matrix进行计算;将静态与动态两种评价指标同时运用到模型评价当中,同时,将对模型进行交叉验证,进一步提高对模型评价的科学性及可靠性;

其中,在步骤1中所述的“基于交通数据构建城市交通网络”,其具体做法如下:

在构建城市交通网络模型过程中,首先根据城市交通系统的结构信息,即道路路口交叉信息,将城市交通系统的交叉路口抽象为城市交通网络的节点,节点从0开始顺序编号0~N,并且每个节点具有唯一的非重复编号;其次,将任意两个交叉路口之间的路段抽象为连边,对城市交通网络中的所有连边进行编号,即对M条连边按照从0开始顺序编号0~M,由于城市交通系统具有方向性,因此连边为有向连边;最后,针对每个时刻将每条路段上的浮动车的平均车载速度作为有向连边的权重,建立城市交通网络模型,此模型为加权有向网络模型;由于城市交通系统中每条道路的级别不同,不能用绝对速度当做城市交通网络的边权来进行拥堵异常的识别及预测分析,因此,计算每条道路的相对速度来作为其边权进行研究;在城市交通网络中每条道路在某一天都有表征其限定车辆行驶速度的限速值,针对各个时刻该条道路的运行速度,采用该条道路的实时速度与该条路段的限速值的比值作为该条道路的相对速度,描述该条道路的速度水平;公式如下所示:

上式中,rij(t)代表某条道路Lij在t时刻的相对速度水平,i表示某条道路Lij的起点,j表示某条道路Lij的终点,Vij代表该条道路在t时刻的实测平均速度值,表示该条道路在当天的最大限速值;某一条道路的限速值为该道路一天中所有时刻的速度数据进行统计并将其按照从大到小的顺序进行排序,选取a%分位点处的速度值作为该条道路在当天的限速值;

其中,在步骤2中所述的“基于复杂网络理论的特征提取及筛选,包括城市交通网络的渗流分析、拥堵子团的特征提取及筛选”,其具体做法如下:

步骤2-1,运用渗流理论对城市交通网络进行研究分析,首先,在每个时刻根据城市交通网络中连边的相对速度rij(t)选定初始速度阈值q0,当速度阈值q0为当前时刻最大相对速度max(rij(t))时,此时城市交通网络处于全畅通状态;为了将城市交通系统的拥堵抽象为交通网络的拥堵状态,定义拥堵速度水平q,当两节点的之间的连边大于等于给定的速度水平q时,则删除其连边及剥离节点,则原始城市交通网络中剩余的有向连边及连通子团为拥堵状态;具体而言,即在每一个时刻下,给定某一特定的速度水平q,对于网络中的每一条有向连边,若其相对速度值小于q,则视其处于拥堵状态,则将该条连边出现在该时刻的动态网络中;若其相对速度值大于等于q,则视其处于畅通状态,则将其从原始网络中删除,即该条有向连边不出现在该时刻的动态网络中;即采用如下公式对网络中的连边进行保留或删除,从而构建动态交通拥堵网络:

其中状态1表示在t时刻该条有向连边处于拥堵状态,即在构建动态交通拥堵网络时将该条有向连边保留;状态0表示在t时刻该条有向连边处于畅通状态,即在构建动态交通拥堵网络时将该条有向连边从原始拓扑网络中删除;在t时刻用公式(2)对网络中每一条有向连边进行遍历处理后,即得到t时刻网络在给定速度水平q下的动态交通拥堵网络;

在每个时刻,利用上述公式在给定的速度水平q下建立交通拥堵网络,随着q的变化,城市交通网络出现最大连通子团Gq和次大连通子团SGq,其中Gq代表最大连通子团中节点的数量,SGq代表次大连通子团中节点的数量,在此步骤中选定渗流阈值qc对城市交通网络进行渗流分析,并计算每个时刻下的弱连通子团,将其作为研究对象对城市交通系统进行拥堵异常进行识别及预测;

步骤2-2,在每个时刻选定的渗流阈值qc下求城市交通网络中的弱连通子团,从而在每个时刻找到其城市交通网络中的每个拥堵子团;在对整个城市交通网络在一定的渗流阈值qc进行渗流后,每个时刻下交通网络的拥堵子团则会呈现出来,在不同的时刻产生的拥堵子团的数量和规模都具有很大的不同,同时城市交通网络中的拥堵子团在时间和空间上都具有动态演化的特性,即时空特性;从复杂网络及统计物理的角度出发,以每个时刻下交通网络的拥堵子团为研究对象,将每个拥堵子团视为研究的样本,并运用复杂网络理论的相关知识对拥堵子团进行特征提取,具体特征的提取如表1所示;

表1 交通网络拥堵子团提取特征汇总表

特征特征描述
Cluster平均度Cluster中每个节点度的平均值;
Cluster平均介数Cluster中每个节点介数的平均值;
Cluster规模Cluster中节点的个数;
Cluster直径Cluster中每两个节点之间最短路径的最大值;
Cluster半径Cluster中每两个节点之间最短路径的最小值;
Cluster平均距离Cluster中每两个节点之间最短路径的平均值;
Cluster平均聚类系数Cluster中每个节点聚类系数的平均值;

在一定时间区间下,每个拥堵子团都具有不同的寿命,具体公式如下:

T=t1-t0 (3)

在上式中,t1为拥堵子团消散的时刻,t0为拥堵子团形成的时刻;由于拥堵子团在不同的时刻会出现增长或消散的趋势,在不同时刻拥堵子团内连边的重合达到一定的比例Pe则判定为同一个拥堵子团;相应的动态指标还有拥堵子团的出入速度、中心经纬度;

其中,在步骤3中所述的“交通系统的异常识别及预测主要包括构建iForest模型和运用iForest模型进行异常识别及预测两个步骤”,其具体做法如下:

步骤3-1,构建iForest模型

iForest孤立森林是一个基于Ensemble的快速异常检测方法,具有线性时间复杂度和高精准度,是符合大数据处理要求的模型方法;iForest由t个孤立树组成,即IsolationTree,简称iTree,每个iTree是一个二叉树结构,其实现步骤如下:

(1)从训练数据中随机选择ψ个样本点作为子样本集,放入树的根节点;

(2)随机指定一个维度attribute,在当前节点数据中随机产生一个切割点P,切割点产生于当前节点数据中指定维度的最大值和最小值之间;

(3)以此切割点生成一个超平面,然后将当前节点数据空间划分为2个子空间,即把指定维度里小于p的数据放在当前节点的左子节点,把大于等于p的数据放在当前节点的右子节点;

(4)在子节点中递归步骤(2)和(3),不断构造新的子节点,直到子节点中只有一个数据,即无法再继续切割或子节点已到达限定高度;

当基于训练集获得t个iTree之后,iForest模型的训练结束,然后用已生成的iForest模型在测试集上进行评估;在评估过程中iForest模型针对每个样本会给出异常分数,其公式如下:

上式中,s(x,n)就是样本x在由n个样本的训练数据构成的iTree中的异常分数,其取值范围为[0,1],当其值越接近1表示是异常点的概率越高,越接近0表示是正常点的概率越高;h(x)为叶子节点到根节点的路径长度;c(n)为平均路径长度,其中H(k)为调和数H(k)=ln(k)+ξ,为欧拉常数,取值为0.5772156649;

当运用已训练好的iForest模型对城市交通系统的拥堵异常进行识别及预测过程中,设定判定异常的阈值qa,当样本的异常分数s(x,n)≥qa时,则判定此样本为异常;当s(x,n)<qa时,则判定此样本为正常;随着异常阈值qa的变化,iForest模型的效果不同,得到当异常阈值qa为何值时,从而确定异常阈值qa

步骤3-2,运用iForest模型进行异常识别及预测

基于步骤2中已提取筛选好的拥堵子团特征,运用步骤3-1构建的iForest模型对城市交通系统中的拥堵异常进行识别及预测;首先,对步骤2中已筛选好的高质量拥堵子团特征集进行归一化处理,消除高维度特征向量之间量纲不同对模型精度的影响和提高模型的收敛速度;运用标准化方法对样本进行归一化处理,特征标准化使每个特征的值有零均值zero-mean和单位方差unit-variance,其公式如下所示:

上式中,i表示第i个拥堵子团,j表示第i个拥堵子团的第j个特征,yij和分别表示归一化前后第i个拥堵子团第j个特征的值,mean(yj)和std(yj)分别表示拥堵子团的第j个特征向量的均值和标准差;

在运用iForest模型对异常拥堵子团进行识别和预测过程中,需要对模型进行训练,让模型学习异常拥堵子团的特征,以用于未来拥堵子团的识别及预测中,将上述已筛选和归一化的拥堵子团特征集分为训练集和测试集,比例为7:3,训练集用于训练iForest模型,测试集用于测试已训练好模型的效果;在此过程中,将城市交通系统中的每个拥堵子团表示成特征向量的形式:

xi表示城市交通系统中第i个拥堵子团,表示xi的第j个特征,m表示拥堵子团的特征个数;在城市交通系统中特征是拥堵子团的度、介数、规模、寿命及速度差;异常检测是特殊的二分类问题,因此异常与非异常类别标签yi表示为:

上式中,1代表拥堵子团异常,0代表拥堵子团正常;构建能准确描述和表示数据集中拥堵异常的iForest模型模型,并利用已训练好的模型对给定的数据集xk预测其拥堵子团是否为异常;

其中,在步骤4中所述的“运用静态指标和动态指标对建立的iForest模型进行评价,同时对其进行交叉验证”,其具体做法如下:

步骤4-1,模型的分析与评价

基于混淆矩阵对上述拥堵子团异常的识别及预测结果进行评价,如表2所示;

表2 分类模型混淆矩阵表

对于准确率不能很好的评价异常模型,引入精准率precision、召回率recall、F1值F1score的静态评价指标,其中精准率是预测为正例的数据中预测正确的数据个数,召回率是真实为正例的数据里预测正确的数据个数;其公式如下:

上式中precision表示精准率,recall表示召回率,F1代表是precision和recall加权调和平均,综合两者的结果;TP是正确预测到的正例的数量,TN是正确预测到的负例的数量,FP是把负例预测成正例的数量,FN是把正例预测成负例的数量;

对于拥堵异常识别及预测此类样本不平衡的模型中预测的是一个概率值Pr,同时设置阈值Th,当Pr≥Th则预测为其中一类,当Pr<Th定义为另外一类;于是,不同的阈值就对应了不同的假正率FPR和真正率TPR,其公式如下所示:

以FPR为横坐标,TPR为纵坐标随着阈值Th的变化绘制曲线,此曲线为ROC曲线,ROC曲线下的面积就是AUC,此评价指标为动态评价指标,进一步确定模型中的关键概率阈值Thpr;ROC曲线越靠拢(0,1)点,即阈值Th,越偏离45度对角线越好,并且AUC值越大表示算法或者模型的效果越好;

步骤4-2,模型的交叉验证

为了有效的评估模型的质量及避免模型出现过拟合和欠拟合现象,运用机器学习中经典的交叉验证方法对模型进行评价;运用K折交叉验证法对模型进行评估,具体步骤如下:

(1)不重复抽样将原始数据随机分为K份;

(2)每一次挑选其中1份作为测试集,剩余K-1份作为训练集用于模型训练;

(3)重复第二步K次,保证每个数据子集都有一次机会作为测试集,其余机会作为训练集,在每个训练集上训练后将得到一个模型,运用此模型在相应的测试集上测试,计算并保存模型的评估指标;

(4)计算K组测试结果的评价指标平均值作为模型精度的估计,并作为当前K折交叉验证下模型的性能指标。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911308389.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top