[发明专利]一种基于不完全轨迹片段的公交乘客闭合出行链挖掘方法有效
| 申请号: | 201810941450.9 | 申请日: | 2018-08-17 |
| 公开(公告)号: | CN108960684B | 公开(公告)日: | 2021-11-23 |
| 发明(设计)人: | 翁小雄;吕攀龙;刘永鑫 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/30 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 不完全 轨迹 片段 公交 乘客 闭合 出行 挖掘 方法 | ||
1.一种基于不完全轨迹片段的公交乘客出行链挖掘方法,其特征在于,包括下述步骤:
S1、采用聚类的方法合并乘客的等价出行,所述等价出行是指乘客出行记录在出行空间上相似但首末站名不相同的出行站点轨迹,所述空间上相似是指起点间、终点间均具有非常近的地理距离,具体为:
对于每一名乘客任意两条出行站点轨迹记录T1、T2,计算起点间的距离δO与终点间的距离δD,若δO+δD小于预先设定的距离ε,则认为T1、T2为等价出行,将其归入一个簇u中,所述u={T1,T2,...,Tk},并用簇中被使用频次最高的出行作为代表元素,替换掉其它出行记录,所述ε为500-800米,即成年人以步行速度1.2m/s,20分钟步行的距离;
S2、扫描每一名乘客合并等价出行后的站点轨迹集合,考察出行站点轨迹间两两的时空可连接性,构建出行拓扑关系图数据结构以及拓扑关系图局部的特征如下:
(i)以乘客的每一段出行为节点,所述每一段出行包含起点、换乘和终点,出行拓扑关系图中各节点的连边由节点间的时空关联性决定;
(ii)出行拓扑关系图节点空间可连接定义为:对于出行拓扑关系图中任两个节点轨迹记录T1、轨迹记录T2,所述任两个节点代表一次完整的出行,若T1的终点与T2起点间距离小于ε,或者T1的起点与T2终点间距离小于ε,则T1、T2空间上可连接;
(iii)出行拓扑关系图节点时间可连接定义为:对于该乘客至少能在k个独立出行日观察到Ti在Tj后发生;
(iiii)出行拓扑关系图中任两个T1,T2,若时空可连接,则T1、T2可连接;
S3、借助深度优先搜索算法,从出行拓扑关系图中提取乘客闭合出行链,具体为:
S31、计算步骤S2中生成的乘客出行拓扑关系图中各节点被使用的频数,生成节点的可访问次数表;
S32、从第一个节点vo开始,依次选定出行拓扑关系图中任一节点vk,将vk加入链表ODL,利用深度优先法则寻找下一个可连接的节点vk+1;
S33、若vk+1与ODL中所有元素均无法构成闭合出行链,则将vk+1加入ODL,继续利用深度优先搜索算法寻找下一个可连接的节点vk+2;
S34、若vk+n与ODL中任一元素可连接且构成闭合出行链TCk,则提取该闭出行合链并输出,同时,TCk中所有涉及的节点可访问次数减1;
S35、若某节点vm可访问次数为零,则从拓扑关系图与ODL中移除该节点;
S36、若ODL无法再获取到新节点且仍不闭合,则将最后一个进入链表的节点移出再次利用深度优先搜索算法获取新节点;
S37、若ODL中所有元素均被移出,则重新选择开始点,直到拓扑关系图中所有可访问的节点都被当作过开始点用过为止,保证搜索到乘客OTD出行拓扑关系图HTGp中所有的连通分量;
S4、将每天无法形成闭合出行链的出行站点轨迹记录与步骤S3得到的闭合出行链进行关联,具体为:
S41、对每一个闭合出行链TCi,与出行日d非闭合出行记录集Tnc,定义其支持度为TCi与Tnc共有的等价出行个数比上TCi中所有的出行;
S42、对每一个闭合出行链TCi,与出行日d非闭合出行记录集Tnc,定义其覆盖度为TCi与Tnc共有的等价出行个数比上Tnc中所有的出行个数;
S43、将关联问题转化为:寻找尽量少的闭合出行链TCx,将Tnc所包含的非闭合出行全部覆盖,同时要求每个TCx拥有尽量高的支持度,并借助贪婪算法求解所述关联问题;
所述借助贪婪算法求解所述关联问题,具体步骤为:
S431、计算该乘客每个闭合出行链在Tnc中的支持度与覆盖度,取出支持度与覆盖度乘积最大的闭合出行链TCm,与从Tnc中移出相应被覆盖的记录同时将TCm与建立关联;
S432、重复第S431步,直到Tnc中所有的出行均已被关联。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810941450.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





