[发明专利]一种基于时空数据库的轨迹多维度分布式压缩方法在审

申请号：	202111620669.7	申请日：	2021-12-27
公开（公告）号：	CN114328784A	公开（公告）日：	2022-04-12
发明（设计）人：	周健	申请（专利权）人：	中科星图股份有限公司
主分类号：	G06F16/29	分类号：	G06F16/29;G06F16/27;G06F16/22
代理公司：	北京科迪生专利代理有限责任公司 11251	代理人：	金怡
地址：	101399 北京市顺义区临空经济核心***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于时空数据库轨迹多维分布式压缩方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种基于时空数据库的轨迹多维度分布式压缩方法，包括如下步骤：步骤1、海量时空轨迹数据入库；步骤2、针对同一运动物体，插入其后续轨迹点数据时对其进行实时压缩，即多行数据压缩成一行数据；步骤3、当单一物体的轨迹点达到某一限定大小后，对其进行分表拆分处理，采用分布式压缩算法进行并行压缩存储待定。本发明提出了基于分布式时空数据库对海量轨迹数据进行多维度的压缩，在保留原始轨迹的主要轨迹特征的前提下，大大减少了轨迹数据的存储压力、节省了存储资源，同时大大减少了针对轨迹数据挖掘的计算资源。

技术领域

本发明涉及数据压缩技术领域，尤其是一种基于时空数据库的轨迹多维度分布式压缩方法。

背景技术

随着北斗全球卫星导航系统及5G通信技术的在各行各业的普及，无数终端产生了海量的北斗时空轨迹数据。

在处理轨迹数据时，传统的Douglas-Peucker算法对每条轨迹的首末点虚连接一条直线，求其他所有轨迹点与这条直线的距离，并找到最大距离值d_max,用d_max与限差D相比：若 d_max＜D，这条轨迹上的中间点全部舍掉；若d_max＞D，保留d_max对应的坐标点，并以该点为界，把轨迹分为两部分，分别对这两部分重复使用此方法。

Douglas-Peucker算法用来处理时空轨迹数据存在两个问题：一是由于其仅仅以各个轨迹点到起始点连线的垂直欧式距离作为判断是否舍弃轨迹点的唯一判断标准，可能会去除掉一些具有明显轨迹特征的轨迹语义点，进而影响后续轨迹数据挖掘的相关效果；二是时间复杂度高，用它来直接处理海量的时空轨迹数据、或者一条具有巨量轨迹点的数据效率不太理想。

对于移动对象，基于时间戳的轨迹记录可以采用秒级记录，但是由于存储设备、计算能力等的限制，轨迹数据挖掘不需要如此精细的位置定位，通常需要采用轨迹压缩的方法来处理轨迹数据。

发明内容

为了解决上述技术问题，本发明提出了基于分布式时空数据库对海量轨迹数据进行多维度的压缩，在保留原始轨迹的主要轨迹特征的前提下，大大减少了轨迹数据的存储压力、节省了存储资源，同时大大减少了针对轨迹数据挖掘的计算资源。

本发明的技术方案为：一种基于时空数据库的轨迹多维度分布式压缩方法，包括如下步骤：

步骤1、海量时空轨迹数据入库；

步骤2、针对同一运动物体，插入其后续轨迹点数据时对其进行实时压缩，即多行数据压缩成一行数据；

步骤3、当单一物体的轨迹点达到某一限定大小后，对其进行分表拆分处理，采用分布式压缩算法进行并行压缩存储。

进一步的，所述步骤1具体包括：

步骤1.1、在分布式数据库中创建分区表；

步骤1.2、将包含时间、经纬度、速度、方向等信息的单个轨迹点数据作为一条行数据插入到分布式时空数据库中。

进一步的，所述步骤2具体包括：

步骤2.1、保留轨迹首尾两点；