[发明专利]一种城市路网车辆出行轨迹的检索方法及系统在审
申请号: | 202110721918.5 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113407542A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 李松江;赵健宏;杨迪;王鹏;任志鹏;宋小龙 | 申请(专利权)人: | 长春理工大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2453;G06F16/27;G06F16/28 |
代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 程华 |
地址: | 130022 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 城市 路网 车辆 出行 轨迹 检索 方法 系统 | ||
本发明公开了一种城市路网车辆出行轨迹的检索方法及系统,方法包括:获取城市路网车辆出行轨迹数据,构建时空数据集;根据时空数据集,构建并存储Hilbert‑DR树;输入检索条件,根据检索条件,遍历Hilbert‑DR树,确定与检索条件对应的城市路网车辆出行轨迹数据集。本发明提供的方法及系统,具有存储分布均匀、检索效率高且存储成本低的优点。
技术领域
本发明涉及大数据管理技术领域,特别是涉及一种城市路网车辆出行轨迹的检索方法及系统。
背景技术
城市路网车辆出行轨迹数据是一种多维度数据,且数据量庞大,在轨迹数据的检索过程中,HBase数据库仅凭RowKey设计原则难以维持车辆轨迹数据检索的要求,存在数据存储分布不均、检索效率低的问题。对此,现有技术提出了以下几种方案:(1)将网络对象空间关系和Hilbert(希尔伯特)分层代码合并到多层网络,这种方法提高了空间检索效率,但是需预设空间范围,这会导致索引结构的不平衡,并且这种方法的检索对象仅适用于点对象。(2)利用Z曲线对数据进行聚类,然后基于聚类结果,将HBase数据库用作时空关联算法的整体检索结构。这种方法具有高实时性和高动态性,但索引效率低。(3)基于四叉树和3DR树构建双层结构的分布式时空索引,能持久化支持磁盘子树动态加载进而提高查询效率,但存储成本高。
因此,目前亟需一种存储分布均匀、检索效率高且存储成本低的数据检索技术。
发明内容
本发明的目的是提供一种城市路网车辆出行轨迹的检索方法及系统,具有存储分布均匀、检索效率高且存储成本低的优点。
为实现上述目的,本发明提供了如下方案:
一种城市路网车辆出行轨迹的检索方法,包括:
获取城市路网车辆出行轨迹数据,构建时空数据集;
根据所述时空数据集,构建并存储Hilbert-DR树;
输入检索条件,根据所述检索条件,遍历所述Hilbert-DR树,确定与所述检索条件对应的城市路网车辆出行轨迹数据集。
可选的,所述根据所述时空数据集,构建并存储Hilbert-DR树,具体包括:
按照时间段对所述时空数据集进行分片,得到多个分片数据集;
令i的数值为1;
分别将多个所述分片数据集作为多个第i级中间节点的对应簇集;
对每个所述第i级间节点的对应簇集采用k-means聚类算法进行聚类处理,获得每个第i级中间节点的多个包含簇集;
分别判断每个第i级中间节点的每个包含簇集是否满足叶子节点生成条件;所述叶子节点生成条件为所述包含簇集内的数据个数小于节点容量阈值;
将满足叶子节点生成条件的包含簇集作为满足叶子节点生成条件的所述包含簇集所在的第i级中间节点的叶子节点;
将不满足叶子节点生成条件的包含簇集作为不满足叶子节点生成条件的所述包含簇集所在的第i级中间节点下的第i+1级中间节点的对应簇集;
令i的数值增加1,返回步骤“对每个所述第i级间节点的对应簇集采用k-means聚类算法进行聚类处理,获得每个第i级中间节点的多个包含簇集”,直到每个包含簇集均满足叶子节点生成条件,得到Hilbert-DR树。
可选的,在按照时间段对所述时空数据集进行分片,得到多个分片数据集之后,还包括:
对各所述分片数据集内的数据均进行Hilbert编码,得到多个编码后的分片数据集。
可选的,所述对每个所述第i级间节点的对应簇集采用k-means聚类算法进行聚类处理,获得每个第i级中间节点的多个包含簇集,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春理工大学,未经长春理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110721918.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:傅里叶型波导分光芯片
- 下一篇:铣削方法