[发明专利]大数据环境下出行OD节点识别和节点间路径提取方法在审
申请号: | 201710843841.2 | 申请日: | 2017-09-18 |
公开(公告)号: | CN107770744A | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 张颖;顾高翔;刘杰;吴佳玲;王伟娟;常华威 | 申请(专利权)人: | 上海世脉信息科技有限公司 |
主分类号: | H04W4/20 | 分类号: | H04W4/20;H04W4/029;G06F17/30 |
代理公司: | 上海申汇专利代理有限公司31001 | 代理人: | 翁若莹,吴小丽 |
地址: | 200040 上海市静安区沪太支路536,5*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 环境 出行 od 节点 识别 路径 提取 方法 | ||
技术领域
本发明涉及一种大数据环境下、基于海量匿名加密时间序列定位数据的出行 OD节点识别和OD节点间路径提取方法,属于大数据分析技术领域。
背景技术
近年来,随着信息技术的发展,数据信息量呈现爆炸式增长,数据来源越来 越多,数据量也越来越庞大。其中,由手机、WIFI、物联网等信息传感器记录 的数据已经成为大数据分析中最重要的数据来源,其较为完备的个体出行记录为 大数据、尤其是交通大数据分析提供了很好的数据支持。以手机为例,至2015 年,手机用户达到13.06亿,占到总人口的96%以上,手机终端设备持续产生的 信号信息,形成了记录用户出行的一系列数据集,为分析城市人群出行、滞留等 行为提供了重要的数据来源。
然而,目前可供获得的手机信令大数据只包含了匿名加密用户与基站的通信 记录,其中与用户出行行为相关的只有通信时间和基站编号等,用户的出行行为 (包括出行的起止点、中间停留地、出行路径、出行方式等)只是蕴含在手机信 令中,并没有直接表现出来,这就需要一种高效、简洁的算法对以手机信令数据 构成的用户出行轨迹数据进行处理,识别出用户出行的O-D点,分割用户出行 的O-D路径,提取用户的出行行为特征。现有技术中,并没有这样的算法。
发明内容
本发明要解决的技术问题是提供一种用于对以手机信令数据构成的用户出 行轨迹数据进行处理,识别出用户出行的O-D点,分割用户出行的O-D路径的 方法。
为了解决上述技术问题,本发明的技术方案是提供一种大数据环境下出行 OD节点识别和节点间路径提取方法,其特征在于,该方法由以下5个步骤组成:
步骤1、读取从传感器运营商获取的匿名加密移动终端传感器数据,匿名加 密移动终端传感器数据理论上在时间与空间上连续,不同移动终端对应不同的用 户唯一编号EPID,提取每个EPID在指定时间段内所触发的通信信令记录,构 成该EPID的出行数据集;
步骤2、依次提取每个EPID在指定时间段内与传感器的通信记录,按时间 顺序排序,建立用户出行轨迹数据集;从时间起点t0出发,以T时间为间隔对 出行数据的空间位置进行插值,构建由真实点和插值点构成的用户出行时空序列;
步骤3、对用户出行时空序列中O-D点的节点聚类密度ρ和O-D点半径内 的最小节点数量ε,以及O-D点前后出行时空序列的交角进行分析,设置参数的 初始化,同时制定O-D点的判别规则;
步骤4、基于DBSCAN算法,设计一种基于距离的空间聚类算法;即在步 骤2得到的聚类参数的基础上,对用户出行时空序列数据上的插值点进行空间聚 类,提取出节点的聚类簇,从中提取出聚类簇中的最核心点;计算从最核心点出 发,到节点聚类簇前后的第一个节点的方向角,计算用户在节点簇前后的出行时 空序列的交角;
步骤5、根据步骤2得到的判别规则,判别步骤4得到的聚类簇是否是用户 出行时空序列上的O-D点,对判别得到的O-D聚类簇进行整理,将其最核心节 点作为O-D点,查找其原始的相近位置的记录点,将其位置投影到地图上,记 录其实际的所在位置;根据提取得到的O-D点分割用户的出行数据,得到分段 的、已表明起始点的用户出行轨迹。
优选地,所述步骤1包括:
步骤1.1、读取从传感器运营商获取匿名加密移动终端传感器数据,理论上 匿名加密移动终端传感器数据在时间与空间上都应该是连续的,包括:用户唯一 编号EPID、通信动作类型TYPE、通信动作发生时刻TIME、传感器所处大区 REGIONCODE、传感器具体编号SENSORID;其中,传感器所处大区 REGIONCODE及传感器具体编号SENSORID构成了传感器编号;
步骤1.2、一条匿名加密移动终端传感器数据为一个信令记录,对每条信令 记录进行解密;
步骤1.3、根据用户唯一编号EPID,查询其在指定时间段内所有的通讯记录, 构建用户出行轨迹数据。
更优选地,所述步骤2包括:
步骤2.1、提取步骤1.3得到的用户出行轨迹数据中的所有的固定传感器编 号REGIONCODE-SENSORID及其对应的经纬度坐标LON-LAT,将经纬度坐标 转换为地理坐标X-Y;
步骤2.2、遍历用户出行轨迹数据,将其按触发通信时间TIMESTAMP顺序 排列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海世脉信息科技有限公司,未经上海世脉信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710843841.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置