[发明专利]基于信令大数据的用户出行轨迹提取方法和系统有效
| 申请号: | 202010004569.0 | 申请日: | 2020-01-02 |
| 公开(公告)号: | CN111209261B | 公开(公告)日: | 2020-11-03 |
| 发明(设计)人: | 司俊俊;羊晋;刘智超;夏水军;涂波 | 申请(专利权)人: | 邑客得(上海)信息技术有限公司 |
| 主分类号: | G06F16/182 | 分类号: | G06F16/182;G06F16/24;G06F16/28;G06F16/29 |
| 代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
| 地址: | 200082 上海市虹口*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 信令大 数据 用户 出行 轨迹 提取 方法 系统 | ||
1.一种基于信令大数据的实时和离线用户轨迹提取方法,包括以下步骤:
首先,通过流处理平台Kafka消息队列接入实时信令数据,并对实时信令数据进行存储;
第二步,对一段时间内实时信令数据汇集后得到的全量信令数据,按照用户ID进行分组计算,并在每个用户组内按照信令生成时间对该用户的全部信令数据进行排序,得到该用户的有序信令数据;
第三步,对每个用户的有序信令数据,按照基站或经纬度坐标位置生成用户基站或位置切换数据;具体方法是:
比较用户有序信令数据前后相邻数据的基站或位置,当且仅当基站或位置发生变化时,则生成一条新的数据,且用户在当前基站或位置的出现时间是用户离开上一个基站或位置的时间,两个时间之差是用户在上一个基站或位置的停留时间,由此得到每个用户的基站或位置切换数据;
第四步,基于每个用户的基站或位置切换数据,检测用户驻留点;
具体方法是:比较用户在每个基站或位置的停留时间与给定阈值的大小,仅当停留时间大于给定阈值时,该基站或位置是用户驻留点;如果用户在某个基站或位置的停留时间小于等于给定阈值,则比较该基站或位置与用户上一个基站或位置、下一个基站或位置的距离,把用户在该基站或位置的停留时间累加到距离其较近的那个基站或位置点上;
第五步,根据用户驻留点检测结果,得到每个用户的离线轨迹数据,包括:用户ID、基站或位置信息、出现时间、离开时间、停留时间;
第六步,对用户离线轨迹数据进行存储;
第七步,通过Kafka消息队列订阅实时信令数据,维护用户状态数据,记录当前驻留点、用户在当前驻留点的出现时间、上一个驻留点;采用实时轨迹数据中的基站经纬度进行驻留点的geohash计算,并选择设定长度的geohash字符串作为用户驻留点;
第八步,基于第七步的用户状态数据,每当到来一条新的该用户信令数据时,比较新的该用户信令数据与用户状态数据的指定长度的geohash字符串是否相同,当前仅当指定长度的geohash字符串发生变化时,更新该用户的状态为新的该用户信令数据的指定长度的geohash字符串、出现时间和上一个geohash字符串;
第九步,每当用户状态发生变化时,输出一条用户当前实时轨迹数据日志,包括:驻留点、出现时间、离开时间、停留时间、上一个驻留点及下一个驻留点信息,从而得到用户包含当前最新位置的实时轨迹序列;
第十步,存储用户实时轨迹数据;具体将用户实时轨迹数据存储在分布式文件系统或数据仓库中,按天、小时进行分区;或存入Key-Value数据库中,以用户ID为Key;
通过上述步骤,实现基于信令大数据的实时和离线用户轨迹提取。
2.如权利要求1所述的基于信令大数据的实时和离线用户轨迹提取方法,其特征是,第四步用户在某个基站或位置的停留时间相应的阈值设置为100秒。
3.如权利要求1所述的基于信令大数据的实时和离线用户轨迹提取方法,其特征是,第六步对用户离线轨迹数据进行存储,包括存储在分布式文件系统、数据仓库或OLAP数据库。
4.如权利要求1所述的基于信令大数据的实时和离线用户轨迹提取方法,其特征是,第七步中,设定6-8位长度的geohash字符串作为用户驻留点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邑客得(上海)信息技术有限公司,未经邑客得(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010004569.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





