[发明专利]基于停车数据和APP操作日志的用户和车辆画像构建方法有效
申请号: | 202111575171.3 | 申请日: | 2021-12-22 |
公开(公告)号: | CN113961734B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 刘寒松;王永;王国强;刘瑞;翟贵乾 | 申请(专利权)人: | 松立控股集团股份有限公司 |
主分类号: | G06F16/535 | 分类号: | G06F16/535;G06Q30/02;G06N3/04;G06N3/08 |
代理公司: | 济南龙瑞知识产权代理有限公司 37272 | 代理人: | 刘燕丽 |
地址: | 266000 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 停车 数据 app 操作 日志 用户 车辆 画像 构建 方法 | ||
1.基于停车数据和APP操作日志的用户和车辆画像构建方法,其特征在于,包括如下步骤:
S1.数据获取,包括获取用户停车行为数据和用户APP操作日志数据;
S2.数据清洗,数据清洗的操作包括:字段去重;删除不必要的空记录,填充充分必要但缺失的数据;数值格式统一;
S3包括步骤S3-1和步骤S3-2;步骤S3-1:S3-1-A构建单视图数据集,S3-1-B构建基本画像;步骤S3-2:S3-2-A构建多视图数据集,S3-2-B设计多视图代理任务,S3-2-C构建高级画像;
S3-1-A构建单视图数据集:基于清洗后的数据,抽取单视图数据实例构建单视图数据集;并制定单视图数据集及其对应规则;
S3-1-B构建基本画像:利用统计学基本方法和杰卡德距离,手动设计基本画像的生成规则;以设计的规则为基础,分析用户停车行为,构建确定性的用户和车辆的基本画像;
S3-2-A构建多视图数据集:基于清洗后的数据,按照单次停车为一个数据单位构建多视图数据集;
S3-2-B设计多视图代理任务:先对数据进行破坏性预处理,然后按照数据维度为多视图数据设计代理任务;一维数据的代理任务包括:重建任务和一致性学习任务;二维数据的代理任务包括:重建任务、旋转预测任务和一致性学习任务;当处理二维数据时重建任务被定义为,
其中,使用损失作为该任务的损失函数,和分别表示输入图像和破坏性预处理后的图像,表示重建模型,是模型中的可学习参数,为图像数量;
当处理二维数据时旋转预测任务被定义为,
其中,表示旋转操作,将输入图像按照角度旋转;表示模型旋转头的输出,则是每种旋转度数的预测概率, 为归一化指数函数,为了将神经网络的输出以概率的形式展现, 索引是旋转预测任务的目标函数,这里使用的是交叉熵损失;
S3-2-C构建高级画像:以ViT为模型结构,通过多视图代理任务和多视图数据集训练得到预训练模型;用户或车辆的高级画像由经过该预训练模型导出的深层特征组成;
S4.构建总画像:基本画像和高级画像组合构成用户和车辆的总画像。
2.根据权利要求1所述的基于停车数据和APP操作日志的用户和车辆画像构建方法,其特征在于,步骤S1中获取的数据包括用户停车行为数据和用户APP操作日志数据;
用户停车行为数据包括停车位置、停车时间和停车影像;
停车位置包括经纬度、停车场名称、道路名称和附近重要建筑排序;
停车时间包括进入停车场时间、离开停车场时间和持续时间;
停车影像包括进入停车场时的影像、离开停车场时的影像和停车过程的影像;
用户APP操作日志数据以单次停车为一个记录单位,包括缴费记录、搜索记录和其他记录;
缴费记录包括缴费时间和缴费金额;
搜索记录包括停车场搜索次数、总搜索时长、搜索到的停车场的时长、收费情况、距离当前位置的距离和距离最终停车位置的距离;
其他记录包括寻车功能使用次数、广告点击次数、点击广告的类型、截图分享次数、截图内容和分享人。
3.根据权利要求1所述的基于停车数据和APP操作日志的用户和车辆画像构建方法,其特征在于,步骤S3-1-A中制定的单视图数据集及其对应规则包括时空视图和行为视图;
a.时空视图的数据集和规则如下:
数据集为以天为最小单位抽取每天进入停车场的名称和时间;
规则以工作日期间每天最早和最晚停车时间的方差描述工作日出行时间规律度,方差越小出行越规律;同理可得非工作日出行规律度和节假日出行时间规律度;另外以工作日、非工作日和节假日期间每天进入停车场名称的集合描述出行空间规律度;
b.行为视图的数据集和规则如下:
数据集以单次停车记录为最小单位抽取停车影像数据;
规则为构建MLP多层感知机模型。
4.根据权利要求1所述的基于停车数据和APP操作日志的用户和车辆画像构建方法,其特征在于,步骤S3-1-B中以出行规律度和出游爱好程度构建用户的基本画像;以车辆损耗程度和车辆异常情况构建车辆的基本画像。
5.根据权利要求1所述的基于停车数据和APP操作日志的用户和车辆画像构建方法,其特征在于,步骤S3-2-C中高级画像的构建包括:构建ViT模型;将预处理后的视图数据依次输入ViT模型,通过代理任务中设置的标签和损失训练ViT模型参数,得到最终的预训练模型;在训练好的ViT模型中,输入用户停车行为数据得到该行为的深层特征;根据输入数据的视图,将得到的深层特征在特征纬度拼接即可作为用户或车辆的高级画像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松立控股集团股份有限公司,未经松立控股集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111575171.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置