[发明专利]一种多语义轨迹数据分段存储方法有效
申请号: | 201911372236.7 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111190891B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 涂来;周伟 | 申请(专利权)人: | 武汉长江通信产业集团股份有限公司;武汉长江通信智联技术有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/29;G06F16/174 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 许莲英 |
地址: | 430074 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 轨迹 数据 分段 存储 方法 | ||
本发明提出了一种多语义轨迹数据分段存储方法。本发明将轨迹由原始的采样点模型转换为便于理解和组织的轨迹段的形式,并将原始轨迹数据分为移动对象、点对象和轨迹对象分别存储和管理。本发明方法主要分为三个步骤,首先将原始轨迹数据进行必要的数据清洗,然后基于轨迹语义和停留点两种方法进行分段,轨迹分段后再根据轨迹尺度,选取合适压缩算法,对轨迹段进行压缩,最后以设计的数据表字段格式将轨迹数据进行存储。
技术领域
本发明属于数据挖掘技术领域,尤其涉及一种多语义轨迹数据分段存储方法。
背景技术
随着位置采集装备和移动计算技术的进步,现在已经能够产生大量移动物体的时空轨迹数据。时空轨迹是物体在地理空间上运动产生的轨迹,通常用一系列按时间排序的点表示,例如车辆的GPS轨迹、手机WiFi接入、手机蜂窝基站定位等。支持GPS的移动终端以及地图服务(如百度地图、高德地图)的不断推广与普及,使得人们可以记录自己当前的地理坐标并分享至互联网。而且越来越多的社交网络,如微信、微博等,也提供基于位置和行程的服务。欧盟GSA的报告显示,苹果和安卓手机APP市场中有近一半的应用需要用户提供位置信息。时空轨迹数据的迅速增长,要求我们对轨迹数据的存储、管理、计算、检索以及挖掘等新计算技术有系统的研究和发展,空间轨迹计算也成为越来越重要的研究领域。这为轨迹模式挖掘、基于位置的社交网络、智能交通系统、城市计算等应用提供了有力支持。
然而轨迹数据的挖掘与计算却存在着以下几点挑战:
轨迹数据具有覆盖范围广、种类繁多、更新频率快等特点,因此数据量庞大。例如车辆GPS轨迹、手机基站轨迹、社交媒体行为轨迹等,其日均数据量达到百万甚至上亿级。
轨迹数据尺度各异。由于轨迹都具有异频采样性,同种甚至不同类型的移动对象采样频率也会不同。例如,通常有源车载GPS约30秒上传一次定位,也有某些车载定位设备为节省流量间隔数分钟或数十分钟上传一次定位;除了采样频率不同外,空间点坐标的精度可能也会不同,例如GPS的精度约能达到10米,而手机基站定位的精度一般在100~1000米。对于不同属性的异质轨迹数据而言不仅难于统一管理,而且使用目前较通用的距离度量方式所计算的轨迹相似性也可能会出现偏差;
不含语义的表达难以被人类理解。通常轨迹数据是以采样点模型进行存储,当研究人员进行轨迹挖掘时,需要将轨迹转换为含有语义的表示。例如某些轨迹是一段有目的出行,某些轨迹只是在一个区域的游走,需要将轨迹的点序列表示转换为根据物理意义划分或停留时长划分的有语义的轨迹段。
面临上述挑战,如果没有合理的轨迹存储组织和管理模型,轨迹计算往往费时费力。本发明旨在构建一个原始轨迹点序列与轨迹挖掘计算的中间层,提出一种面向多语义跨尺度轨迹大数据的存储管理模型,为构建轨迹数据库提供一个良好的轨迹存储组织方法。
发明内容
为了解决上述技术问题,本发明提出了一种多语义轨迹数据分段存储方法。
本发明的技术方案为一种多语义轨迹数据分段存储方法,具体包括以下步骤:
步骤1:将车辆轨迹数据通过数据清洗去除无效数据得到清洗后车辆轨迹数据,将语义分段数据通过数据清洗去除无效数据得到清洗后语义分段数据;
步骤2:将数据清洗后车辆轨迹数据和数据清洗后车辆语义行程分段进行数据融合,得到融合后车辆轨迹段数据;
步骤3:采用基于停留点分段的方法对融合后车辆轨迹段数据进行分段,得到轨迹分段后数据;
步骤4:将轨迹分段后数据进行数据压缩,得到压缩完成的轨迹段数据;
步骤5:将轨迹分段后数据、压缩完成的轨迹段数据通过数据表方式进行存储。
作为优选,步骤1中所述车辆轨迹数据具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉长江通信产业集团股份有限公司;武汉长江通信智联技术有限公司,未经武汉长江通信产业集团股份有限公司;武汉长江通信智联技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911372236.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置