[发明专利]一种索引构建及查询方法有效
| 申请号: | 202110950796.7 | 申请日: | 2021-08-18 |
| 公开(公告)号: | CN113849498B | 公开(公告)日: | 2022-08-23 |
| 发明(设计)人: | 崔栋;张华;温巧燕;王华伟;涂腾飞 | 申请(专利权)人: | 北京邮电大学 |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458;G06F16/29 |
| 代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 徐雅琴 |
| 地址: | 100876 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 索引 构建 查询 方法 | ||
本说明书一个或多个实施例提供一种索引构建及查询方法,包括根据空间数据集,构造四叉树结构;利用Z曲线对单元格内的空间数据进行数据降维处理,得到空间数据的空间数据表示;根据Z值对空间数据表示进行排序,并构建链表;基于链表进行数据分段处理,得到多个数据段;构建每个数据段的本地模型,根据各数据段的本地模型,确定单元格的查询模型。在构建的四叉树结构基础上,利用数据分段算法划分数据段,并构建查询模型,降低空间存储代价,提高检索性能,可以一次性的数据遍历快速构建索引,提高索引构建效率,适用于动态更新的空间数据集的动态索引构建。
技术领域
本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及一种索引构建及查询方法。
背景技术
物联网设备会生成大量的地理空间数据,为了有效地访问和处理此类数据,通常会采用树型索引结构存储空间数据。然而,当数据量达到PB级别以上时,树形索引结构急剧变大,严重侵占系统资源;另一方面,传统的树形索引结构在静态数据上性能较好,但无法支持动态的索引构建与更新。
发明内容
有鉴于此,本说明书一个或多个实施例的目的在于提出一种索引构建及查询方法,能够实现动态索引构建。
基于上述目的,本说明书一个或多个实施例提供了一种索引构建方法,包括:
根据空间数据集,构造包括至少一个单元格的四叉树结构;
利用Z曲线对所述单元格内的空间数据进行数据降维处理,得到与所述空间数据对应的空间数据表示;其中,所述空间数据表示包括空间数据的坐标及Z值;
根据所述Z值对所述空间数据表示进行排序,并将排序后的空间数据表示保存于链表中;
基于所述链表进行数据分段处理,得到至少一个数据段;
构建每个数据段的本地模型,根据各数据段的本地模型,确定所述单元格的查询模型。
可选的,所述链表的各结点包括空间数据表示及其在链表中的位置。
可选的,基于所述链表进行数据分段处理,得到至少一个数据段为:采用FSW算法对所述链表中的结点进行数据分段,得到至少一个数据段。
可选的,所述数据段的本地模型包括数据段的起始点的位置及Z值,结束点的位置及Z值,根据所述起始点和结束点计算得到的斜率。
可选的,根据各数据段的本地模型,确定所述单元格的查询模型为:对各数据段的本地模型进行数据拟合,生成所述查询模型。
本说明书实施例还提供一种范围查询方法,基于所构建的索引进行查询,包括:
根据输入的查询矩形查询所述四叉树结构,确定与所述查询矩形具有交集的单元格;
将所述查询矩形划分为多个子矩形;其中,所述子矩形分为与所述单元格完全重合的子矩形,和与所述单元格部分重合的子矩形;
对于与单元格完全重合的子矩形,将所述完全重合的单元格中的空间数据作为查询结果;
对于与单元格部分重合的子矩形,根据所述部分重合的单元格的查询模型进行查询,得到查询结果。
可选的,根据根据所述部分重合的单元格的查询模型进行查询,得到查询结果,包括:
确定所述与单元格部分重合的子矩形的最小Z值和最大Z值;
确定所述最大Z值和最小Z值在所述查询模型中的可能位置范围;
判断所述可能位置范围内的空间数据是否在所述查询矩形范围内,将在所述查询矩形范围内的空间数据作为查询结果。
本说明书实施例还提供一种最近邻查询方法,基于所构建的索引进行查询,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110950796.7/2.html,转载请声明来源钻瓜专利网。





