[发明专利]用户画像模型训练的方法、用户数据确定方法、设备在审
| 申请号: | 202111675261.X | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN114330579A | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 王蕾 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/906;G06F16/9535 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 霍莉莉;黄健 |
| 地址: | 100033 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户 画像 模型 训练 方法 数据 确定 设备 | ||
本公开提供的一种用户画像模型训练的方法、用户数据确定方法、设备,涉及用户画像技术,包括:获取训练数据集;训练数据集中包括多个无标记的原始样本;每个无标记的原始样本中包括用户的多个特征;对原始样本中的多个特征进行掩盖处理,得到掩盖后的训练样本;其中,训练样本中包括原始样本中的部分特征;根据训练样本以及与训练样本对应的原始样本对预设模型进行训练,得到用户画像模型;其中,用户画像模型用于输出用户画像向量。本公开提供的方案可以对训练样本的不同种类的多个特征进行整合训练,能够发现不同特征之间的关联性,使训练结果在具有通用性的同时也能够带来更好的准确率。
技术领域
本公开涉及用户画像技术,尤其涉及一种用户画像模型训练的方法、用户数据确定方法、设备。
背景技术
随着计算机和互联网技术的快速发展,用户画像技术应运而生。用户画像模型是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。
现有技术中,用户画像模型的训练方法中,大部分首先基于原始特征进行独热编码生成训练样本;然后将训练样本通过单层全连接层,或者多层压缩维度,或者直接接入目标任务模型进行同步训练。
但是,上述方式对于不同的训练任务没有通用性,对于不同的训练目标都需要从头初始化训练;且训练参数较多导致同样的样本规模和训练时长效果较差,易陷入局部最优不再优化。
发明内容
本公开提供了一种用户画像模型训练的方法、用户数据确定方法、设备,以解决现有技术中对于不同的训练任务没有通用性,对于不同的训练目标都需要从头初始化训练;且训练参数较多导致同样的样本规模和训练时长效果较差,易陷入局部最优不再优化地问题。
根据本公开第一方面,提供了一种用户画像模型训练的方法,包括:
获取训练数据集;所述训练数据集中包括多个无标记的原始样本;每个所述无标记的原始样本中包括用户的多个特征;
对所述原始样本中的多个特征进行掩盖处理,得到掩盖后的训练样本;其中,所述训练样本中包括原始样本中的部分特征;
根据所述训练样本以及与所述训练样本对应的原始样本对预设模型进行训练,得到用户画像模型;其中,所述用户画像模型用于输出用户画像向量。
根据本公开第二方面,提供了一种用户数据确定方法,包括:
把用户信息输入到用户画像模型,得到用户画像向量;所述用户画像模型是通过上述任一实施例所述的用户画像模型训练的方法训练得到的;
将用户画像向量输入到用于对用户画像向量进行处理的模型,得到与用户对应的数据。
根据本公开第三方面,提供了一种用户画像模型训练的装置,所述装置包括:
获取单元,用于获取训练数据集;所述训练数据集中包括多个无标记的原始样本;每个所述无标记的原始样本中包括用户的多个特征;
处理单元,用于对所述原始样本中的多个特征进行掩盖处理,得到掩盖后的训练样本;其中,所述训练样本中包括原始样本中的部分特征;
训练单元,用于根据所述训练样本以及与所述训练样本对应的原始样本对预设模型进行训练,得到用户画像模型;其中,所述用户画像模型用于输出用户画像向量。
根据本公开第四方面,提供了一种用户数据确定装置,包括:
处理单元,用于把用户信息输入到用户画像模型,得到用户画像向量;所述用户画像模型是通过上述任一实施例所述的用户画像模型训练的方法训练得到的;
确定单元,用于将用户画像向量输入到用于对用户画像向量进行处理的模型,得到与用户对应的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111675261.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:视频监测方法、装置、设备及存储介质
- 下一篇:一种信息回复方法、装置、介质





