[发明专利]一种基于协同过滤的公交乘客刷卡站点信息提取方法有效
申请号: | 201611114197.7 | 申请日: | 2016-12-07 |
公开(公告)号: | CN106781467B | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 陆璐;郭洋 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 陈宏升 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 协同 过滤 公交 乘客 刷卡 站点 信息 提取 方法 | ||
1.一种基于协同过滤的公交乘客刷卡站点信息提取方法,其特征在于,包括以下步骤:
(1)扫描公交IC卡刷卡记录,分别提取出每一辆车的刷卡记录与GPS轨迹记录,并将每一辆车的刷卡记录与GPS轨迹记录按照时间先后排序;同时将该车辆运营线路所对应的线路表读入内存;
(2)给定一个时间差τ,对每一辆车按时间排序后的刷卡记录,从第1条刷卡记录开始遍历,分别判断第k条与第k+1条刷卡记录间的时间差,若时间差小于或等于τ,则认为这两次刷卡行为由同一个站点上车刷卡的不同乘客产生,将其合并到同一个簇中,直到第k条与第k+1条刷卡记录间的时间差大于τ,则认为第k条刷卡记录为该簇最后一条刷卡记录;
定义Ci的数据结构为其中表示开始时刻,表示结束时刻,为中心时刻,ts为第一条刷卡记录所在行号,te为最后一条刷卡记录所在行号;将Ci保存到刷卡簇队列C={C1,C2,…,Ci}中;其中Ci为第i个站点刷卡乘客的信息压缩表示;
(3)从第一个轨迹点开始扫描与步骤(2)所对应车辆的轨迹记录,若该轨迹点不在Ci的时间范围内,则跳过,并扫描下一条轨迹记录,直到找到第k条至k+n条轨迹记录,所对应的采集时间属于这些轨迹点构成集合,记为Pi;
(4)对Pi中所有点进行聚类,得到一系列簇,并计算包含轨迹点最多的簇的中心坐标;
(5)将步骤(4)计算得到的中心坐标与该线路上的停靠站点坐标进行逐个比较,选择最接近簇中心坐标且距离小于设定值M的站点作为C1中所对应的刷卡记录的上车站点,在所述运营线路的站点列表中标记此站点,从C中移除C1及其对应时间范围内的轨迹点;
(6)重复运行步骤(3)至(5),直到C为空,或者所有轨迹记录都被移除;
(7)若所有轨迹记录均被移除,而C不为空,则查找运营线路站点列表中未被标记的站点;如果未被标记的站点数等于C中剩余簇的数量,则按先后顺序将未标记的站点与剩余的簇匹配。
2.根据权利要求1所述基于协同过滤的公交乘客刷卡站点信息提取方法,其特征在于,步骤(1)中,所述公交IC卡刷卡记录包含以下信息:IC卡卡号、刷卡时刻、车牌号、线路号;
所述GPS轨迹记录包含以下信息:车牌号、轨迹点、轨迹采集时刻。
3.根据权利要求1所述基于协同过滤的公交乘客刷卡站点信息提取方法,其特征在于,所述步骤(2)还包括:
提取IC卡刷卡记录中蕴含的乘客活动信息,过滤掉GPS轨迹记录中的无效轨迹点。
4.根据权利要求1所述基于协同过滤的公交乘客刷卡站点信息提取方法,其特征在于,所述步骤(2)还包括:采用局部聚类的方法处理GPS轨迹记录。
5.根据权利要求1所述基于协同过滤的公交乘客刷卡站点信息提取方法,其特征在于,对每一辆车,均只扫描一次IC卡刷卡记录与GPS轨迹记录。
6.据权利要求1所述基于协同过滤的公交乘客刷卡站点信息提取方法,其特征在于,所述步骤(7)采用了关联推断的方法,推断无法匹配的刷卡簇对应的刷卡站点。
7.据权利要求1所述基于协同过滤的公交乘客刷卡站点信息提取方法,其特征在于,所述设定值M优选为50米。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611114197.7/1.html,转载请声明来源钻瓜专利网。