[发明专利]一种基于协同过滤的公交乘客刷卡站点信息提取方法有效
申请号: | 201611114197.7 | 申请日: | 2016-12-07 |
公开(公告)号: | CN106781467B | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 陆璐;郭洋 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 陈宏升 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 协同 过滤 公交 乘客 刷卡 站点 信息 提取 方法 | ||
本发明提供了一种基于协同过滤的公交乘客刷卡站点信息提取方法,融合车站地理信息、乘客刷卡记录、线路表与车辆运行轨迹记录的数据资源,结合信息协同过滤方法,提出了一种借助乘客刷卡时间分布特征,对车辆轨迹记录信息进行过滤并快速提取刷卡站点的方法。该方法可快速处理海量公交刷卡数据,实现刷卡数据的地理空间匹配,有利于后续公共交通系统性能分析。
技术领域
本发明涉及智能化公共交通技术领域,特别涉及一种基于协同过滤的公交乘客刷卡站点信息提取方法。
背景技术
公交IC卡的广泛应用,提高了乘客乘车的便捷性,已成为公交乘客的主要支付方式,刷卡记录成为低成本提取客流信息的新途径,但是,现阶段广泛使用的刷卡系统主要用于收费,产生的数据不能直接提供给交通业务系统进行分析使用。例如,目前使用最为广泛的一票制公交,只能记录乘客的上车时刻与车号、线路号,缺乏上、下车站点信息;两票制公交,也仅仅增加了下车时间记录,无法知道乘客的上、下车站点。因此,通过IC卡刷卡记录对公交线网客流态势进行分析,需要先要将刷卡记录与GPS行车记录系统产生的车辆运行轨迹进行时间匹配,从而获取乘客的刷卡空间位置信息。
现阶段,GPS行车记录系统多为每秒产生一次位置记录,平均每辆车每天将产生超过8万条位置信息,为IC卡刷卡位置匹配带来巨大的计算开销。现有的解决方案,利用站点位置信息,对GPS轨迹记录进行过滤后再与IC卡刷卡记录进行时间匹配,一定程度上降低了计算量。但该方法无可避免的,会对大量无效轨迹(无乘客刷卡事件)进行聚类处理,从而降低了运算效率。
另一方面,在城市道路中,存在大量高大建筑物,对GPS接收机信号造成衰减与多径干扰,导致轨迹记录中存在大量异常点,非常容易导致站点位置判断出现误差。
发明内容
本发明的目的在于克服现有技术中的缺点与不足,提供一种基于协同过滤的公交乘客刷卡站点信息提取方法,该方法可充分利用海量刷卡数据中隐含的乘客个体活动规律,提升从GPS轨迹数据中提取公交乘客刷卡站点的处理效率,有利于后续公交线网断面流量统计和数据挖掘。
为了达到上述目的,本发明通过下述技术方案予以实现:
一种基于协同过滤的公交乘客刷卡站点信息提取方法,在进行刷卡站点推断时,输入的IC卡刷卡数据包含以下信息:a)IC卡卡号;b)刷卡时刻(格式:hh:mm:ss);c)车牌号;d)线路号。
此外,本发明进行刷卡站点推断时,还需要GPS轨迹记录数据,包含以下信息:a)车牌号;轨迹点(经纬度);轨迹采集时刻(格式:hh:mm:ss)。
本发明进行刷卡站点推断时,需要用户提供准确详尽的公交线路及其站点列表。
同时,需要提供各公交站点的地理坐标信息。
算法实施包括以下步骤:
第一步,扫描公交IC卡刷卡记录,分别提取出每一辆车的刷卡记录与GPS轨迹记录,并将每一辆车的刷卡记录与GPS轨迹记录按照时间先后排序。同时将该车辆运营线路所对应的线路表读入内存。
第二步,给定一个时间差τ,对每一辆车按时间排序后的刷卡记录,从第1条刷卡记录开始遍历,分别判断第k条与第k+1条刷卡记录间的时间差,若时间差小于或等于τ,则可认为这两次刷卡行为由同一个站点上车刷卡的不同乘客产生,将其合并到同一个簇Ci中,直到第k条与第k+1条刷卡记录间的时间差大于τ,则认为第k条刷卡记录为该簇最后一条刷卡记录。将Ci保存到刷卡簇队列C={C1,C2,…,Ci}中。
对于Ci,本发明定义的数据结构为其中表示开始时刻,表示结束时刻,为中心时刻,ts为第一条刷卡记录所在行号,te为最后一条刷卡记录所在行号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611114197.7/2.html,转载请声明来源钻瓜专利网。