[发明专利]用户轨迹分析方法及系统有效
申请号: | 201710114734.6 | 申请日: | 2017-02-28 |
公开(公告)号: | CN106878951B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 周熠晨;王振;黄皓峰;谭昶;曾祥云;牛鑫;贾若然 | 申请(专利权)人: | 上海讯飞瑞元信息技术有限公司 |
主分类号: | H04W4/02 | 分类号: | H04W4/02;H04W64/00 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 赵景平;宋少华 |
地址: | 201403 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 轨迹 分析 方法 系统 | ||
本发明公开了一种用户轨迹分析方法及系统,该方法包括:获取用户的信令数据;所述信令数据包括:时间信息、空间信息、用户ID;根据所述信令数据得到对应每个用户ID的用户轨迹点信息,所述用户轨迹点信息包括:采集轨迹点的时间、所处小区ID、小区经度、小区纬度;剔除所述用户轨迹点信息中的异常数据;确定剔除异常数据后的用户轨迹点中的移动点对,得到移动轨迹序列。利用本发明,可以提高用户轨迹分析的准确性。
技术领域
本发明涉及数据挖掘领域,具体涉及一种用户轨迹分析方法及系统。
背景技术
近年来,随着智能设备的普及,以及数据收集处理、分析技术的快速发展,用户数据越来越受到各家企业,特别是涉及交通分析、用户推荐等相关业务企业的关注。目前,用于用户轨迹分析的主要数据来源有GPS数据、SDK(Software Development Kit,软件开发工具包)获得的用户位置数据和运营商提供的基站收集到的信令数据。其中,GPS数据定位较准确,但其数据太过密集和繁杂,难以分析处理;SDK数据收集间隔长,由此分析出的用户轨迹不准确;信令数据准确性虽较之GPS数据略差,但误差通常不会超过200米,且其收集量、收集间隔时间,都在可控范围内,能基本反映用户轨迹。
现有的基于信令数据的用户轨迹分析方法,多是较为简单的根据用户所在基站位置,得到用户移动序列轨迹。这种方法存在以下缺点:基站的覆盖范围较大,且各基站间有交集,用户可能同时位于两个基站的覆盖范围内,这都导致用户轨迹分析不准确;此外,在实际收集的信令数据中,由于信号技术本身的问题,会出现一瞬间距离特别远的点,严重影响用户轨迹分析的准确性。
发明内容
本发明实施例提供一种用户轨迹分析方法及系统,以提高用户轨迹分析的准确性。
为此,本发明提供如下技术方案:
一种用户轨迹分析方法,包括:
获取用户的信令数据;所述信令数据包括:时间信息、空间信息、用户ID;
根据所述信令数据得到对应每个用户ID的用户轨迹点信息,所述用户轨迹点信息包括:采集轨迹点的时间、所处小区ID、小区经度、小区纬度;
剔除所述用户轨迹点信息中的异常数据;
确定剔除异常数据后的用户轨迹点中的移动点对,得到移动轨迹序列。
优选地,所述空间信息具体为小区信息,所述小区信息包括:小区ID、经度、纬度、覆盖半径。
优选地,所述空间信息具体为基站信息,所述基站信息包括:基站ID、覆盖半径、经度、纬度、小天线编号、小天线方位角;
所述方法还包括:
将所述基站信息转换为小区信息。
优选地,所述剔除所述用户轨迹点信息中的异常数据包括:
剔除所述用户轨迹点信息中速度异常的轨迹点数据,所述速度异常的轨迹点数据是指速度不属于设定的速度范围内的轨迹点数据;和/或
剔除所述用户轨迹点信息中与前、后轨迹点形成的夹角异常的轨迹点数据,所述与前、后轨迹点形成的夹角异常的轨迹点数据是指夹角小于设定的夹角阈值的轨迹点数据。
优选地,所述方法还包括:
确定剔除异常数据后的用户轨迹点中的静止点簇。
优选地,所述确定剔除异常数据后的用户轨迹点中的移动点对和静止点簇包括:
对应每个用户ID,初始化轨迹点序列M、移动点对序列W、静止点簇集合N;
将所述用户ID对应的预设时间内的轨迹点信息按时间先后顺序形成轨迹点序列M;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海讯飞瑞元信息技术有限公司,未经上海讯飞瑞元信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710114734.6/2.html,转载请声明来源钻瓜专利网。