[发明专利]基于停车数据和APP操作日志的用户和车辆画像构建方法有效
申请号: | 202111575171.3 | 申请日: | 2021-12-22 |
公开(公告)号: | CN113961734B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 刘寒松;王永;王国强;刘瑞;翟贵乾 | 申请(专利权)人: | 松立控股集团股份有限公司 |
主分类号: | G06F16/535 | 分类号: | G06F16/535;G06Q30/02;G06N3/04;G06N3/08 |
代理公司: | 济南龙瑞知识产权代理有限公司 37272 | 代理人: | 刘燕丽 |
地址: | 266000 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 停车 数据 app 操作 日志 用户 车辆 画像 构建 方法 | ||
本发明公开了基于停车数据和APP操作日志的用户和车辆画像构建方法,涉及交通和数据挖掘处理技术领域。本发明包括如下步骤:S1.获取用户停车行为数据和用户APP操作日志数据;S2.数据清洗,数据清洗的操作包括:字段去重;删除不必要的空记录,填充充分必要但缺失的数据;数值格式统一;S3包括步骤S3‑1和步骤S3‑2;步骤S3‑1:S3‑1‑A构建单视图数据集,S3‑1‑B构建基本画像;步骤S3‑2:S3‑2‑A构建多视图数据集,S3‑2‑B设计多视图代理任务,S3‑2‑C构建高级画像;S4.构建总画像:基本画像和高级画像组合构成用户和车辆的总画像。本发明实现了从浅层和深层两个维度刻画用户和车辆信息。
技术领域
本发明属于数据挖掘技术领域,涉及基于停车数据和APP操作日志的用户和车辆画像构建方法。
背景技术
从数据中挖掘有效信息已经成为大数据背景下的重要技术,被广泛应用于个性化推荐和关系网构建等实际场景。现有借助车辆使用信息、车联网或车身总线等数据挖掘用户行为和车辆特征的方法多借助统计学方法处理简单的单维度数据,在大数据场景中,数据处理能力和挖掘信息质量会急剧下降。即使有部分基于深度学习(如深度卷积网络)的方法,受流行网络模型架构的影响依然存在一些固有的问题:
1. 无法同时处理多视图数据。用户和车辆的信息通常采集自不同的终端,以不同的信息形式存储,具有多视图的属性。多视图属性可以理解为对同一个目标多个角度的描述,又可细分为多模态和多特征属性。例如,停车信息可以由停车场的摄像头采集,以图像的形式存储,包含详细的车辆信息;同时,停车信息也可以来自停车缴费记录,以文本信息存储,包含更多的时序信息和用户行为。现有方法通常需要为每种模态的数据建立模型,甚至对于同一种模态数据的不同特征(如缴费记录中的时间特征和空间特征)也要单独建模。
2. 挖掘的信息层次单一。现有方法为每种模态或特征单独建模的方式必然会引起挖掘信息的单一,不同视图数据间存在互补信息无法被充分的挖掘,无法刻画用户或车辆的深层次属性。
3.深度模型需要大量的标注信息。尽管基于深度学习的方法能够挖掘单一模态深层特征,但训练过程需要大量的标注数据;标注过程往往由专业人员手动完成,这在驾驶、停车行为分析等对实时性要求较高开放场景中几乎是不可能满足的。
发明内容
本发明为了弥补现有技术的不足,提供了基于停车数据和APP操作日志的用户和车辆画像构建方法,通过对多个终端设备采集的多视图数据建模,并以浅层和深层两个角度刻画用户和车辆画像。本发明是通过如下技术方案实现的:本发明提供了基于停车数据和APP操作日志的用户和车辆画像构建方法,包括如下步骤:
S1.数据获取,包括获取用户停车行为数据和用户APP操作日志数据;
S2.数据清洗,数据清洗的操作包括:字段去重;删除不必要的空记录,填充充分必要但缺失的数据;数值格式统一;
S3包括步骤S3-1和步骤S3-2;步骤S3-1:S3-1-A构建单视图数据集,S3-1-B构建基本画像;步骤S3-2:S3-2-A构建多视图数据集,S3-2-B设计多视图代理任务,S3-2-C构建高级画像;
S3-1-A构建单视图数据集:基于清洗后的数据,抽取单视图数据实例构建单视图数据集;并制定单视图数据集及其对应规则;
S3-1-B构建基本画像:利用统计学基本方法和杰卡德距离,手动设计基本画像的生成规则;以设计的规则为基础,分析用户停车行为,构建确定性的用户和车辆的基本画像;
S3-2-A构建多视图数据集:基于清洗后的数据,按照单次停车为一个数据单位构建多视图数据集;
S3-2-B设计多视图代理任务:先对数据进行破坏性预处理,然后按照数据维度为多视图数据设计代理任务;一维数据的代理任务包括:重建任务和一致性学习任务;二维数据的代理任务包括:重建任务、旋转预测任务和一致性学习任务;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松立控股集团股份有限公司,未经松立控股集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111575171.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置