[发明专利]一种基于协同过滤的公交乘客刷卡站点信息提取方法有效
申请号: | 201611114197.7 | 申请日: | 2016-12-07 |
公开(公告)号: | CN106781467B | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 陆璐;郭洋 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 陈宏升 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于协同过滤的公交乘客刷卡站点信息提取方法,融合车站地理信息、乘客刷卡记录、线路表与车辆运行轨迹记录的数据资源,结合信息协同过滤方法,提出了一种借助乘客刷卡时间分布特征,对车辆轨迹记录信息进行过滤并快速提取刷卡站点的方法。该方法可快速处理海量公交刷卡数据,实现刷卡数据的地理空间匹配,有利于后续公共交通系统性能分析。 | ||
搜索关键词: | 一种 基于 协同 过滤 公交 乘客 刷卡 站点 信息 提取 方法 | ||
【主权项】:
1.一种基于协同过滤的公交乘客刷卡站点信息提取方法,其特征在于,包括以下步骤:(1)扫描公交IC卡刷卡记录,分别提取出每一辆车的刷卡记录与GPS轨迹记录,并将每一辆车的刷卡记录与GPS轨迹记录按照时间先后排序;同时将该车辆运营线路所对应的线路表读入内存;(2)给定一个时间差τ,对每一辆车按时间排序后的刷卡记录,从第1条刷卡记录开始遍历,分别判断第k条与第k+1条刷卡记录间的时间差,若时间差小于或等于τ,则认为这两次刷卡行为由同一个站点上车刷卡的不同乘客产生,将其合并到同一个簇中,直到第k条与第k+1条刷卡记录间的时间差大于τ,则认为第k条刷卡记录为该簇最后一条刷卡记录;定义Ci的数据结构为
其中
表示开始时刻,
表示结束时刻,
为中心时刻,ts为第一条刷卡记录所在行号,te为最后一条刷卡记录所在行号;将Ci保存到刷卡簇队列C={C1,C2,…,Ci}中;其中Ci为第i个站点刷卡乘客的信息压缩表示;(3)从第一个轨迹点开始扫描与步骤(2)所对应车辆的轨迹记录,若该轨迹点不在Ci的时间范围
内,则跳过,并扫描下一条轨迹记录,直到找到第k条至k+n条轨迹记录,所对应的采集时间属于
这些轨迹点构成集合,记为Pi;(4)对Pi中所有点进行聚类,得到一系列簇,并计算包含轨迹点最多的簇的中心坐标;(5)将步骤(4)计算得到的中心坐标与该线路上的停靠站点坐标进行逐个比较,选择最接近簇中心坐标且距离小于设定值M的站点作为C1中所对应的刷卡记录的上车站点,在所述运营线路的站点列表中标记此站点,从C中移除C1及其对应时间范围内的轨迹点;(6)重复运行步骤(3)至(5),直到C为空,或者所有轨迹记录都被移除;(7)若所有轨迹记录均被移除,而C不为空,则查找运营线路站点列表中未被标记的站点;如果未被标记的站点数等于C中剩余簇的数量,则按先后顺序将未标记的站点与剩余的簇匹配。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611114197.7/,转载请声明来源钻瓜专利网。