[发明专利]面向海量轨迹点数据的时空索引构建方法有效
申请号: | 201710270989.1 | 申请日: | 2017-04-24 |
公开(公告)号: | CN107220285B | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 陈昭;王磊;刁博宇;徐勇军 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 11280 北京泛华伟业知识产权代理有限公司 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据文件 空间填充特性 可扩展性 索引单元 索引构建 索引结构 点数据 轨迹点 映射 多维 索引 并行 存储 时空 消耗 概率 | ||
1.一种面向海量轨迹点数据的时空索引构建方法,包括以下步骤:
步骤1)、将轨迹点数据存储为若干个轨迹点数据文件,所述轨迹点数据至少包含时间信息和二维位置信息;
步骤2)、获取每个轨迹点数据文件包含的轨迹点数据的时空取值范围;
步骤3)、以所述轨迹点数据文件为索引单元构建索引树;
其中所述索引树是通过下面步骤构建的:
1)叶子节点的构建:每个叶子节点包含了至少一个索引单元,以及可以框住上述所有索引单元的最小时空矩形;所述最小时空矩形是指其所包含的所有轨迹点数据文件的时空取值范围;
2)非叶子节点的构建:每个非叶子节点包含了其子节点的指针数组以及可以框住其所有子节点的最小时空矩形;
3)索引子树根节点的构建:每个计算单元上的索引子树根节点,包含了其子节点的指针数组以及可以框住该根节点所有子节点的最小时空矩形,如果索引子树根节点为叶子节点,则包含了该计算单元上的所有轨迹点数据文件的时空取值范围;
4)索引树根节点的构建:每个索引树根节点包含了所有计算单元上轨迹点数据文件的记录路径以及可以框住该根节点所有子节点的最小时空矩形。
2.根据权利要求1所述的面向海量轨迹点数据的时空索引构建方法,其特征在于,所述步骤3)进一步包括:
步骤31)、将所述轨迹点数据文件划分到至少一个计算单元中;
步骤32)、所述计算单元基于空间索引结构构建时空索引。
3.根据权利要求2所述的面向海量轨迹点数据的时空索引构建方法,其特征在于,当所述计算单元为多个并行计算单元时,所述步骤31)中对轨迹点数据文件的划分为有序划分。
4.根据权利要求3所述的面向海量轨迹点数据的时空索引构建方法,其特征在于,利用空间填充曲线实现所述步骤31)的有序划分。
5.根据权利要求4所述的面向海量轨迹点数据的时空索引构建方法,其特征在于,所述空间填充曲线为希尔伯特曲线。
6.根据权利要求5所述的面向海量轨迹点数据的时空索引构建方法,其特征在于,所述步骤31)进一步包括:
步骤311)计算用于表征所述轨迹点数据文件的二维空间信息的二维希尔伯特值;
步骤312)根据所述步骤311)中计算得出的二维希尔伯特值计算用于表征所述轨迹点数据文件的三维空间信息的三维希尔伯特值;
步骤313)根据所述步骤312)中计算得出的三维希尔伯特值对所述轨迹点数据文件进行划分。
7.根据权利要求3至6中任一项所述的面向海量轨迹点数据的时空索引构建方法,其特征在于,所述步骤32)中的空间索引结构是R*树结构。
8.根据权利要求3至6中任一项所述的面向海量轨迹点数据的时空索引构建方法,其特征在于,可基于MapReduce或Spark编程框架实现对所述索引树的构建。
9.一种利用如权利要求1至8中任一项构建的索引树对轨迹点数据进行查询的方法,包括:
步骤a)、遍历所述索引树的根节点,取得根节点列表;
步骤b)、查询所述步骤a)取得的根节点列表,取得子节点列表;
步骤c)、并行遍历步骤b)中取得的子节点列表,取得轨迹点数据文件列表。
10.根据权利要求9所述的方法,其特征在于,该方法可基于MapReduce或Spark编程框架实现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710270989.1/1.html,转载请声明来源钻瓜专利网。