[发明专利]一种用户出行标签获取方法及装置在审
申请号: | 202111243090.3 | 申请日: | 2021-10-25 |
公开(公告)号: | CN116028585A | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 曾瑞;邵波;白洋;熊玉萍;周晓雪 | 申请(专利权)人: | 中国移动通信集团黑龙江有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/215 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 150028 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 出行 标签 获取 方法 装置 | ||
本申请提供一种用户出行标签获取方法、装置、电子设备及计算机程序产品,涉及数据分析技术领域。所述方法包括:基于特定信息对信令数据进行数据清洗;根据用户轨迹数据生成出行链并进行归类,计算每一类出行链列表的信息熵;从每一出行链列表中提取出一个出行链并与对应信息熵进行组合,生成得到出行链信息熵列表;判断目标用户的出行规律指标达标时,将出行链信息熵列表与地图兴趣点分类表进行匹配得到目标用户的出行标签。本申请实施例通过基于特定信息对获取到的信令数据进行清洗,并基于提取到的用户出行规律特征对用户的出行信息进行筛选,从而匹配出能够准确反映用户出行习惯的出行标签。
技术领域
本申请涉及数据分析技术领域,具体涉及一种用户出行标签获取方法、装置、电子设备及计算机程序产品。
背景技术
用户的出行标签,反映了用户出行的规律,有助于城市规划、疫情防疫、交通调度、精准营销等领域的工作。而信令数据,或称手机信令数据,是由手机用户在发生通话、发短信或移动位置等事件时,被运营商的通信基站捕获并记录的数据,内容包括用户的当前经纬度,接入或离开基站的时间等,具有实时性强、精度高、覆盖范围广等特点。通过信令数据识别用户的出行,是当前主流的技术方向,但使用的技术并不相同,效果也有很大差异。
目前,现有的用户出行识别方案由于对信令数据的数据清洗不完全存在识别结果不准确的问题,这是因为用户在多个基站交叉地带附近活动时会反复出现多条信令数据记录导致用户出行轨迹出现“乒乓效应”,对出行结果的识别造成了不良影响。另外,现有方案只是根据信令数据直接匹配用户的出行标签,没有对信令数据的规律特征进行判断,因此所得到的用户出行识别结果并不准确。
发明内容
本申请实施例提供一种用户出行标签获取方法、装置、电子设备及计算机程序产品,用以解决现有技术对用户出行识别不准确的问题。
第一方面,本申请实施例提供一种用户出行标签获取方法,包括:
获取目标用户在预设时间内的信令数据,根据所述信令数据中的特定信息对所述信令数据进行数据清洗,生成得到目标用户轨迹数据;其中,所述特定信息包括停留基站时间信息、相邻基站间距信息中的至少一种;
根据所述用户轨迹数据生成若干个出行链,以各个出行链的初始点作为分类依据将所有出行链分别归类至对应的出行链列表,并计算每一所述出行链列表的信息熵;
提取出每一所述出行链列表中出现次数最多的一个出行链并与该出行链列表的信息熵进行组合为出行链信息熵条目,继而将所有出行链信息熵条目组合成出行链信息熵列表;
当根据所述出行链信息熵列表判断目标用户的出行规律指标超过预设指标阈值时,将所述出行链信息熵列表中的各个出行链信息熵条目与地图兴趣点分类表进行匹配得到所述目标用户的出行标签。
在一个实施例中,所述根据所述信令数据中的特定信息对所述信令数据进行数据清洗,包括:
获取目标用户在预设时间内的信令数据,对所述信令数据中停留基站时间小于预设时间阈值的对应的信令记录条目进行删除;
将相邻基站间距小于预设距离阈值的两个信令记录条目合并为一个信令记录条目。
在一个实施例中,所述将相邻基站间距小于预设距离阈值的两个信令记录条目合并为一个信令记录条目,包括:
当根据相邻基站间距信息判断相邻两个信令记录条目的距离小于预设距离阈值时,根据这两个信令记录条目的停留基站时间信息,将具有较小停留基站时间的对应的信令记录条目合并至具有较大停留基站时间的对应的信令记录条目中;
其中,合并后的信令记录条目的基站进入时间更新为这两个信令记录条目中的基站进入时间的最小值,合并后的信令记录条目的基站离开时间更新为这两个信令记录条目中的基站离开时间的最大值,合并后的信令记录条目的停留基站时间更新为这两个信令记录条目中的停留基站时间的总和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团黑龙江有限公司;中国移动通信集团有限公司,未经中国移动通信集团黑龙江有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111243090.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:机器翻译自动后编辑方法及装置
- 下一篇:一种固井质量评价最佳测井时间确定方法