[发明专利]一种基于众包轨迹数据的交通数据质量控制方法有效
| 申请号: | 201811227001.4 | 申请日: | 2018-10-22 |
| 公开(公告)号: | CN109215347B | 公开(公告)日: | 2020-10-09 |
| 发明(设计)人: | 于海洋;杨阳;任毅龙;王飞;张力;王子睿 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G08G1/01 | 分类号: | G08G1/01 |
| 代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 轨迹 数据 交通 质量 控制 方法 | ||
1.一种众包轨迹数据的质量控制方法,其特征在于,所述方法包括:
步骤一、数据清洗步骤
将众包轨迹数据进行关键信息提取,按照约定的格式录入到数据库中,进行数据标准时间点校正并检测所获取的数据属性格式、字段内容、数据集大小;
步骤二、异常轨迹数据识别与处理步骤
剔除超出参数阈值的数据,对缺失数据进行填补修复,从而形成完整的数据集,包括:
S201阈值判断子步骤,进行速度阈值和车辆行驶路径阈值判断,对超过阈值的数据进行剔除;
对速度阈值采用修正系数f进行修正,最终确定速度合理的阈值范围为:0≤v≤fVmax;式中:v表示速度,f表示修正系数,Vmax表示道路限制速度;若众包轨迹数据速度值超过给定的速度阈值,将该数据标记为0,判断其为数据故障,对故障数据进行剔除;对于车辆行驶路径阈值采用拓宽因子对路网限界进行适度拓宽,车辆行驶路径阈值的允许范围为:[x,y]∈{xlimit+ε,ylimit+ε},式中[x,y]为车辆所处位置的经纬度,ε表示拓宽因子,{xlimit,ylimit}表示公路路网限界经纬度数据集合,{xlimit+ε,ylimit+ε}表示拓宽后公路路网限界经纬度数据集合;针对众包轨迹数据,若车辆所处地理位置不在行驶路径允许的阈值范围内,则将该数据标记为0,判断其为数据故障;
S202对缺失数据进行填补修复,针对众包轨迹数据中时间点缺失的数据及经过阈值判断处理剔除后导致的缺失数据进行填补,两种方式如下:
首先根据离线历史数据库进行匹配,选取缺失数据点相邻的数据点作为轨迹的起点与终点,在离线历史数据库中选取相同的起点与终点从而得到k条轨迹,根据中间时间差确定缺失的轨迹段:minT=|Δt-Δti'|;i=(1,2,...,k);x(t)=x(ti)式中:Δt表示缺失数据相邻数据点之间的时间差;Δt′i表示从离线历史数据库中获取的第i条轨迹起终点时间差;若历史数据不足,则利用缺失点前后相邻时间点的数据进行插值拟合,选取相邻时间点前后各k个已知数据点,利用局部多项式法构造多项式,根据2k个已知点计算出待定系数值,再计算缺失时间点的相应位置值即可恢复轨迹,从而得到理想的车辆地理位置信息,将该理想数据与其所处路网限界的经纬度数据集进行比较,若该理想数据不属于其所处路网限界的经纬度数据集则将其匹配到垂直于缺失点相邻两点连线处与车道中心线相交的位置式中:j=0,1,2,…,2k-1;aj为待定系数;t表示缺失数据点的时间;tj表示选取的第j个已知数据点的时间;
步骤三、数据集轨迹预生成与调整步骤
将处理后得到的完整众包轨迹数据与路网进行匹配;提取表示相同的车辆ID的相同随机数字,按照时间先后进行排序,将经纬度与路网位置精确匹配,连接相邻的数据点形成完整运行轨迹;对初步生成的轨迹再调整,进行纠偏、去噪,最终生成完整的平滑轨迹,具体步骤如下:
S301对初步生成的轨迹进行分析,对于跳跃的数据点,分析该点前后若干数据形成的轨迹,若前后两段轨迹的运行方向一致,则该点被判定为噪点,剔除该点并利用插值法填补数据,修正该段轨迹;若跳跃的数据点与相邻数据点构成的运行方向夹角大于90°,且该跳跃的数据点前后段多点构成的轨迹运行方向相反或夹角小于90°,则说明该点为轨迹分段点,保留该数据点;
S302对轨迹中部分偏差数据进行纠正,如处于道路限界与拓宽后的道路限界之间的数据点,将其匹配到经过该点垂直于车辆运行方向与路段中心线相交的位置;
S303采用三次B样条曲线对各个估计数据点进行轨迹平滑处理得到新的众包轨迹;
步骤四、完整轨迹呈现并更新历史数据库。
2.根据权利要求1所述的一种众包轨迹数据的质量控制方法,其特征在于,在所述步骤一和步骤二之间还包括:数据隐私化处理步骤,对已经具备规范数据格式和标准时间点的众包轨迹数据集中的隐私数据,生成一组随机数字替代原始数据。
3.根据权利要求1所述的一种众包轨迹数据的质量控制方法,其特征在于,在所述步骤一包括:
S101将获取的数据进行关键特征提取,剔除冗余字段,并根据约定设定数据录入格式,检验数据的属性完整性;数据录入数据库前设置好各字段的标准录入格式,若格式不匹配,则将该数据标注为0,判断其为数据故障;
S102对数据各关键字段依次进行判别,检测是否存在某字段内容为空或者格式匹配的情况下字段内容为乱码无法识别,将字段内容不完整的数据标记为0,判断其为数据故障;
S103标准时间点校正并检测数据集大小;将一天24小时按照设备检测周期T为时间间隔划分成标准时间周期,设定标准时间点为t',预先设定的设备检测周期为T,允许采集时间延迟为t0,统计采集数据时段为(t’+t0-T,t’+t0)内的数据进行时间点修正;若落入该时段的检测数据记录为0,则此标准时间点数据缺失,将该点数据标记为0,判断其为数据缺失;若落入该时段的检测数据记录为1,则此标准时间点的数值为唯一检测数据记录的数值;若落入该时段的检测数据记录有多条,则此标准时间点的数值为该时段范围内所有检测数据记录的平均值;
进行时间点修正后,由数据标记是否有0值存在可确定数据组是否存在数据缺失点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811227001.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





