[发明专利]一种基于时空数据库的轨迹多维度分布式压缩方法在审
申请号: | 202111620669.7 | 申请日: | 2021-12-27 |
公开(公告)号: | CN114328784A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 周健 | 申请(专利权)人: | 中科星图股份有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/27;G06F16/22 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 金怡 |
地址: | 101399 北京市顺义区临空经济核心*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时空 数据库 轨迹 多维 分布式 压缩 方法 | ||
本发明涉及一种基于时空数据库的轨迹多维度分布式压缩方法,包括如下步骤:步骤1、海量时空轨迹数据入库;步骤2、针对同一运动物体,插入其后续轨迹点数据时对其进行实时压缩,即多行数据压缩成一行数据;步骤3、当单一物体的轨迹点达到某一限定大小后,对其进行分表拆分处理,采用分布式压缩算法进行并行压缩存储待定。本发明提出了基于分布式时空数据库对海量轨迹数据进行多维度的压缩,在保留原始轨迹的主要轨迹特征的前提下,大大减少了轨迹数据的存储压力、节省了存储资源,同时大大减少了针对轨迹数据挖掘的计算资源。
技术领域
本发明涉及数据压缩技术领域,尤其是一种基于时空数据库的轨迹多维度分布式压缩方法。
背景技术
随着北斗全球卫星导航系统及5G通信技术的在各行各业的普及,无数终端产生了海量的北斗时空轨迹数据。
在处理轨迹数据时,传统的Douglas-Peucker算法对每条轨迹的首末点虚连接一条直线,求其他所有轨迹点与这条直线的距离,并找到最大距离值dmax,用dmax与限差D相比:若 dmax<D,这条轨迹上的中间点全部舍掉;若dmax>D,保留dmax对应的坐标点,并以该点为界,把轨迹分为两部分,分别对这两部分重复使用此方法。
Douglas-Peucker算法用来处理时空轨迹数据存在两个问题:一是由于其仅仅以各个轨迹点到起始点连线的垂直欧式距离作为判断是否舍弃轨迹点的唯一判断标准,可能会去除掉一些具有明显轨迹特征的轨迹语义点,进而影响后续轨迹数据挖掘的相关效果;二是时间复杂度高,用它来直接处理海量的时空轨迹数据、或者一条具有巨量轨迹点的数据效率不太理想。
对于移动对象,基于时间戳的轨迹记录可以采用秒级记录,但是由于存储设备、计算能力等的限制,轨迹数据挖掘不需要如此精细的位置定位,通常需要采用轨迹压缩的方法来处理轨迹数据。
发明内容
为了解决上述技术问题,本发明提出了基于分布式时空数据库对海量轨迹数据进行多维度的压缩,在保留原始轨迹的主要轨迹特征的前提下,大大减少了轨迹数据的存储压力、节省了存储资源,同时大大减少了针对轨迹数据挖掘的计算资源。
本发明的技术方案为:一种基于时空数据库的轨迹多维度分布式压缩方法,包括如下步骤:
步骤1、海量时空轨迹数据入库;
步骤2、针对同一运动物体,插入其后续轨迹点数据时对其进行实时压缩,即多行数据压缩成一行数据;
步骤3、当单一物体的轨迹点达到某一限定大小后,对其进行分表拆分处理,采用分布式压缩算法进行并行压缩存储。
进一步的,所述步骤1具体包括:
步骤1.1、在分布式数据库中创建分区表;
步骤1.2、将包含时间、经纬度、速度、方向等信息的单个轨迹点数据作为一条行数据插入到分布式时空数据库中。
进一步的,所述步骤2具体包括:
步骤2.1、保留轨迹首尾两点;
步骤2.2、依次计算相邻两个轨迹点之间速度差及方向角差值,如果速度差值大于阈值或者方向角差值大于阈值,则该轨迹点应当保留,记做突变点,总共有N个;
步骤2.3、计算完成后,所有突变点将原始轨迹切分成N+1段子轨迹;
步骤2.4、分别在N+1个子轨迹段中,将子轨迹首尾两个轨迹点之间连接一条直线,对于第i-1个点Ci-1和第i个点Ci之间的子轨迹段,遍历子轨迹段上其他所有点,求每个点到直线的垂直欧式距离,找到最大距离的点D,最大距离记为dmax;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科星图股份有限公司,未经中科星图股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111620669.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种超大样品振动切片及收集自动化装置
- 下一篇:一种适配于有机固废气化的装置