[发明专利]基于倒排序索引及前缀树的轨迹索引和查询方法及系统有效
| 申请号: | 202011489554.4 | 申请日: | 2020-12-16 |
| 公开(公告)号: | CN112579921B | 公开(公告)日: | 2023-03-10 |
| 发明(设计)人: | 康军;何昊健;段宗涛;马浩森;李宜修;黄山 | 申请(专利权)人: | 长安大学 |
| 主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/22;G06F16/23;G06F16/215;G06F16/2455;G06F18/22 |
| 代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 王芳 |
| 地址: | 710064 陕西省*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 排序 索引 前缀 轨迹 查询 方法 系统 | ||
1.一种基于倒排序索引及前缀树的轨迹索引方法,其特征在于,包括如下步骤:
步骤1:获取车辆所在城市的路网数据和车辆的原始轨迹数据,所述路网数据包括多个路段和每个路段的路段id,所述原始轨迹数据包括多条原始轨迹和每条原始轨迹的原始轨迹id,并对原始轨迹数据进行预处理;
步骤2:将路网数据匹配到步骤1进行预处理后得到的原始轨迹数据上,获得原子轨迹数据,所述每条原子轨迹包括路段id、原始轨迹id和属性特征;
所述的属性特征包括以下几种情况:1.针对出租车轨迹数据选取载客/空载作为特征;2.针对高速路车辆轨迹数据选取收费站出入口作为特征;3.针对城市普通车辆轨迹数据选取出发地/ 目的地作为特征;
步骤3:将原始轨迹id相同的原子轨迹作为一组,获得多组原子轨迹;
对每组原子轨迹进行判断,若该组中连续三个及以上的原子轨迹的属性特征相同,则将该组原子轨迹作为一个轨迹段,获得轨迹段数据,所述每个轨迹段包含一个原始轨迹id和一个路段id序列,每个轨迹段的路段id序列为该轨迹段所包含的所有原子轨迹对应的路段id的集合;
步骤4:根据步骤1得到的每个路段生成一棵前缀树;获取步骤3得到的所有轨迹段的原始轨迹id、所有路段id序列中的路段和所有路段id序列中每个路段在其所在路段id序列中的序号,将每个路段所对应的原始轨迹id和该路段在其所在路段id序列中的序号插入该路段的前缀树中得到有序前缀树,获得每个路段对应的有序前缀树,将全部有序前缀树作为轨迹索引库;
步骤4中将每个路段所对应的原始轨迹id和该路段在其所在路段id序列中的序号插入该路段的前缀树中得到有序前缀树,包含如下步骤:
步骤a1:取前缀树的根节点为当前节点;
步骤a2:获取每个路段所对应的原始轨迹id的年月日、时、秒、车牌号和该路段在其所在路段id序列中的序号分别作为字符P1,P2,P3,P4,P5;
步骤a3:获取新节点Pi并令Pi=P1,将Pi与当前节点的所有子节点进行比较,如果有与Pi相同的子节点则将该子节点设为当前节点并执行步骤a4;如果没有与Pi相同的子节点则将Pi与当前节点的所有子节点一起排序,按序将Pi插入为新子节点,并将Pi设为当前节点并执行步骤a4;
步骤a4:如果i=5,则生成完成,获得有序前缀树;否则Pi=Pi+1,返回步骤a3。
2.如权利要求1所述的基于倒排序索引及前缀树的轨迹索引方法,其特征在于,步骤2中采用基于HMM模型的地图匹配方法将路网数据匹配到步骤1进行预处理后得到的原始轨迹数据上。
3.如权利要求1所述的基于倒排序索引及前缀树的轨迹索引方法,其特征在于,轨迹索引库更新时采用如下方法:
步骤b1:获取新产生的轨迹数据,对新产生的轨迹数据执行步骤1至步骤3,最后得到更新轨迹段数据;
步骤b2:对更新轨迹段数据经过的路段生成更新前缀树;获取更新轨迹段数据中包含的路段id,从数据库中查询相同路段对应的有序前缀树,将该有序前缀树与生成的更新前缀树做并集运算,得到更新后的有序前缀树,随后将更新后的有序前缀树覆盖掉数据库中与其路段id相同的有序前缀树,索引更新完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长安大学,未经长安大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011489554.4/1.html,转载请声明来源钻瓜专利网。





