[发明专利]一种基于支持向量机的公交站间运行时间区间预测方法有效
申请号: | 201710840901.5 | 申请日: | 2017-09-18 |
公开(公告)号: | CN107563566B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 季彦婕;刘阳;石庄彬;马新卫;刘攀 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06N20/10 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210096*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 支持 向量 公交 运行 时间 区间 预测 方法 | ||
1.一种基于支持向量机的公交站间运行时间区间预测方法,其特征在于:所述的预测方法包括以下步骤:
(1)公交车GPS轨迹数据预处理:首先采集公交车的GPS轨迹数据,所述公交车GPS轨迹数据包括公交车的车辆编号、线路编号和数据采集的时间点以及该时间点公交车经纬度坐标、公交车速度、行驶方向角,然后进行初步处理,剔除数据中的异常数据,所述的异常数据包括漂移数据和冗余重复数据,最后对数据中缺失的数据进行估计;
(2)公交到站时刻提取:根据步骤(1)预处理后的样本数据,按照线路编号筛选出目标线路的数据,并与目标线路的站点经纬度坐标信息进行比对,确定公交车辆到达各站点的时刻其中i表示目标线路站点编号,n表示当前车辆在该行驶方向上已运行车辆中的序号,所述序号按照公交车从起始站点的发车时间依次排序;
(3)公交站间运行时间计算:根据由步骤(2)获取的公交车辆到达各站点的时刻,计算得到公交的站间运行时间为:
其中:分别表示公交车在站点j、站点i的时刻,表示公交车n从站点i到站点j的运行时间,且满足站点j位于站点i目标线路的同一个行驶方向的下游;
(4)建立公交站运行时间区间预测模型输入数据集:选取与预测目标区域公交运行时间相关的信息作为特征数据,并以此建立公交站运行时间区间预测模型输入数据集,所述特征数据包括预测车辆之前k辆车经过目标区域的运行时间、预测车辆之前k辆车与预测车辆之间的车头时距、预测时段类型、预测车辆经过上一区域的运行时间;
(5)建立公交站运行时间区间预测模型参数优化目标函数:以预测区间有效覆盖率PICP和标准化预测区间平均宽度NPIAW作为主要参数,建立公交站运行时间区间预测模型参数优化目标函数为:
f=NPIAW+φ(PICP)EXP(-ω(PICP-μ)) (2)
其中:ω和μ为给定参数,μ为预测区间的名义置信水平,ω作为对有效覆盖率误差的惩罚系数,φ(PICP)是关于预测区间有效覆盖率的指示函数,表达式为:
预测区间有效覆盖率PICP和标准化预测区间平均宽度NPIAW的计算方法分别为:
其中
其中,N为样本总体数量,ti表示第i个样本运行时间的实际值,Li,Ui分别表示第i个样本运行时间区间预测的上界和下界,通过构建两个以径向基RBF作为核函数的支持向量回归机SVR,根据步骤(4)所建立的公交站运行时间区间预测模型输入数据集分别预测公交站间运行时间预测区间的上界和下界,D表示所有样本中实际运行时间最大值与最小值的差值;
(6)建立公交站间运行时间区间预测模型:构建支持向量回归机SVR时,每个支持向量回归机SVR均包含三个模型参数,分别为惩罚系数C、不敏感损失系数ε和RBF核参数γ;两个支持向量回归机SVR均以步骤(4)所得数据集作为模型训练数据输入部分,其中上界预测模型的训练数据输出部分为预测目标实际运行时间的(2-μ)倍,下界预测模型的训练数据输出部分为预测目标实际运行时间的μ倍;
(7)公交站间运行时间区间预测模型参数寻优:采用粒子群算法对两个SVR模型中的参数进行寻优;具体步骤如下:
a、初始化粒子群:设置粒子群算法的参数,包括粒子的总个数、算法的最大和最小权重因子值、算法的最大迭代次数、适应度终止值,每个粒子对应具有一组具有不同模型参数的上、下界SVR预测模型,并给定模型参数C、ε、γ的限定范围,每个粒子由一组上、下界SVR预测模型中的6个模型参数决定其位置和速度;
b、计算每个粒子的适应度:使用模型训练数据对SVR预测模型进行训练,并对该模型进行交叉验证,以步骤(5)建立的参数优化目标函数作为适应度函数,以验证数据计算每个粒子的适应度;
c、最优适应度更新:每次迭代过程中,比较每个粒子当前适应度和该粒子最优适应度,若当前适应度小于该粒子最优适应度,则将该粒子最优适应度替换为当前适应度,否则保留原值;将更新后的粒子最优适应度与全局最优适应度进行比较,若某粒子最优适应度小于全局最优适应度,则将全局最优适应度替换为该粒子最优适应度,否则保留原值;同时记录粒子最优适应度和全局最优适应度以及其所处的位置,同时对粒子的位置和速度进行更新;
d、验证是否满足终止条件:比较次数是否达到最大迭代次数或适应度值是否达到步骤a中设置的要求;若满足预设条件,算法收敛,最后一次迭代的全局最优值对应的模型参数即为所求的最优值;否则返回步骤b,算法继续迭代;
(8)公交站运行时间区间预测模型应用:所述公交站运行时间区间预测模型是以采用步骤(7)所得最优模型参数建立的一组上、下界SVR预测模型,并采用模型训练数据对预测模型进行训练得到最终公交站间运行区间预测模型;以公交车辆GPS历史数据和实时上传数据提取预测目标特征数据,并输入到该区间预测模型,模型输出结果即为预测车辆从预测区域上游站点运行到下游站点运行时间区间的上、下界预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710840901.5/1.html,转载请声明来源钻瓜专利网。