[发明专利]基于轨迹编码的轨迹查询方法有效

申请号：	201710402212.6	申请日：	2017-06-01
公开（公告）号：	CN107291842B	公开（公告）日：	2021-11-19
发明（设计）人：	刘克中;周悦淇;张蕊;徐宁	申请（专利权）人：	武汉理工大学
主分类号：	G06F16/2455	分类号：	G06F16/2455;G06F16/22
代理公司：	武汉瀛卓知识产权代理事务所(特殊普通合伙) 42255	代理人：	朱诗恩
地址：	430070 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于轨迹编码查询方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于位图的轨迹编码的轨迹查询方法，包括基于轨迹的位图编码生成轨迹的索引结构，并持久化存储到磁盘等步骤：本发明的轨迹查询达到了缩小搜索空间的效果，来实现快速轨迹查询。

技术领域

本发明涉及计算机大数据处理领域，具体为一种基于位图的轨迹编码的轨迹查询方法。

背景技术

范围查询是分析轨迹数据的基础方法，因为应用场景不同，解决范围查询问题的要求和目标也不同，例如实时监控环境下，必须实时跟踪、监测某个地点的移动对象，就要求方案能够快速更新并同时支持查询，而例如LUGrid、RUM-tree的解决方案，主要采取缓存实现延迟更新、降低磁盘读写频率来提升性能的策略。但是随着轨迹记录技术的成熟和轨迹数据积累的持续增长，范围查询常被用作在海量的历史轨迹数据中提取信息、缩小分析范围的基本方法，其他挖掘方法比如轨迹聚类、轨迹模式都需要范围查询提取挖掘范围的信息，如何找到合适的查询方案对面向轨迹的海量数据分析有重要意义。

传统时空数据查询采用R-tree索引方案，虽然R-tree结构的索引不仅适合存储点而且适合拓展的空间类型数据(线段、多边形)，但是R-tree结构的索引的性能瓶颈是其内部的最小外包矩形(MBR)随着数据的增长重叠的概率越来越高，导致索引失去了筛选数据范围的效率，而且，R-tree结构的索引存储的数据维度越高，这个问题越突出明显。因此，优化索引的最有效策略是减少MBR的重叠，即改善索引对数据的分区策略，在众多的优化方案中，R*-tree是被广泛接受的效率最好索引版本，即使如此，随着维度的提升其效率下跌非常明显。

一般的时空数据数据索引，将相邻数据放置在同一个数据分片中，最朴素的设计的方法是网格索引，时空数据都存入划分出的固定大小的子空间；Quad-tree增加了划分的空间区域的层次，可以根据数据动态调整划分区域的大小，提升了索引的查询效率。其他优化时空数据索引的常见方案还有：减小索引更新代价、降低更新频率、使用预测模型等方法。但是主流的时空数据索引对轨迹数据支持不佳，一般的时空数据索引以空间点作为索引管理的对象，缺少面向轨迹查询问题的优化，而且轨迹数据具有海量的数据规模，轨迹点在数十亿的数量级，一般的空间索引查询方案维护代价很高，整体查询代价很大，表现为查询方案的磁盘占用高、查询速度不理想。

发明内容

本发明的目的是为了克服上述不足提供一种基于轨迹编码的轨迹查询方法。

本发明基于轨迹编码的查询方法，包括以下步骤：

第1步：基于轨迹的位图编码生成轨迹的索引结构，并持久化存储到磁盘；

第2步：基于轨迹的位图编码将范围查询条件转换为位图数据；

第3步：遍历轨迹的索引结构，基于轨迹的位图编码的重叠关系运算找出符合条件的候选结果；

第4步：根据查询条件具体需求，对候选结果使用不同的校准方法对候选集进行筛选，最终获得符合条件的查询结果。

所述第4步具体包括以下步骤：

第41步：对候选结果中所有轨迹的轨迹点，当查询问题是范围查询时，根据查询条件的空间范围校验每个轨迹点是否符合查询条件；当查询问题是拓扑关系查询时，根据位图编码计算每个候选轨迹是否符合查询条件；

第42步：对于范围查询，将第1步中的符合条件的结果直接作为查询返回；对于拓扑关系查询，将第1步中的符合条件的结果临时存储，将第1步中不符合条件的结果以时空关系计算算法进行二次计算，得到新的符合查询条件的结果，合并两次符合条件的结果作为查询返回。

所述范围查询包括以下步骤：

第21步：对轨迹数据统一建立基于位图的轨迹编码索引；