[发明专利]一种用户画像的构建方法和装置在审
| 申请号: | 201910417949.4 | 申请日: | 2019-05-20 |
| 公开(公告)号: | CN111966885A | 公开(公告)日: | 2020-11-20 |
| 发明(设计)人: | 朱家卫;张伸正;吴敬桐 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
| 代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用户 画像 构建 方法 装置 | ||
1.一种用户画像的构建方法,其特征在于,包括:
获取用户在预设时间段的行为数据;
分析所述行为数据中的多个行为以及每个行为的对象内容,得到当前行为序列;
根据所述当前行为序列中的对象内容在预设信息库中查找满足预设条件的内容,得到相似对象内容;
基于多个相似对象内容对用户行为生成相似行为序列;
利用所述当前行为序列和所述相似行为序列对用户进行画像构建,得到用户画像。
2.根据权利要求1所述的方法,其特征在于,所述基于多个相似对象内容对用户行为生成相似行为序列,包括:
利用所述当前行为序列和多个相似对象内容计算用户对每个相似对象内容的偏好强度;
根据用户的偏好强度对用户行为进行预测,生成相似行为序列。
3.根据权利要求2所述的方法,其特征在于,所述利用所述当前行为序列和多个相似对象内容计算用户对每个相似对象内容的偏好强度,包括:
设置当前行为序列中行为的权重;
计算当前行为序列的每个对象内容与相似对象内容的相似性;
利用所述行为的权重和所述相似性计算用户对每个相似对象内容的偏好强度。
4.根据权利要求1所述的方法,其特征在于,所述根据所述当前行为序列中的对象内容在预设信息库中查找满足预设条件的内容,得到相似对象内容,包括:
采用向量训练模型将所述当前行为序列中的对象内容进行向量化,得到对象向量;
采用向量训练模型将预设信息库中的内容进行向量化,得到内容向量;
在所述预设信息库中查找与所述对象向量相似度大于预设阈值的内容向量,得到相似对象内容。
5.根据权利要求4所述的方法,其特征在于,所述采用向量训练模型将所述当前行为序列中的对象内容进行向量化,得到对象向量之前,还包括;
获取多组用户信息样本;
利用所述用户信息样本对预设向量模型进行训练,得到向量训练模型。
6.根据权利要求5所述的方法,其特征在于,每组用户信息样本包括多个行为样本和每个行为样本的对象样本,所述利用所述用户信息样本对预设向量模型进行训练,得到向量训练模型,包括:
采用预设向量模型分别构建行为样本和对象样本的矩阵,得到行为样本矩阵和对象样本矩阵;
对所述行为样本矩阵和对象样本矩阵进行计算,得到对象样本的预测值;
获取对象样本的真实值,根据所述对象样本的预测值和真实值对所述预设向量模型进行收敛,得到向量训练模型。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述分析所述行为数据中的多个行为以及每个行为的对象内容,得到当前行为序列,包括:
将获取到的行为数据发送到消息队列;
获取消息队列中的数据,将所述消息队列中的数据的多个行为以及每个行为的对象内容进行预设规则处理,得到当前行为序列。
8.根据权利要求1至6任一项所述的方法,其特征在于,所述利用所述当前行为序列和所述相似行为序列对用户进行画像构建,得到用户画像,包括:
获取当前行为序列的行为时间;
设置当前行为序列和相似行为序列中行为的权重;
根据行为的权重和行为时间的衰减,利用牛顿冷却定律对当前行为序列的对象内容和相似行为序列的对象内容进行计算,得到用户画像。
9.根据权利要求8所述的方法,其特征在于,所述根据行为的权重和行为时间的衰减,利用牛顿冷却定律对当前行为序列的对象内容和相似行为序列的对象内容进行计算,得到用户画像,包括:
将所述当前行为序列的对象内容进行语言信息处理,得到第一内容信息;
将所述相似行为序列的对象内容进行语言信息处理,得到第二内容信息;
根据行为的权重和行为时间的衰减,利用牛顿冷却定律对第一内容信息和第二内容信息进行计算,得到用户画像。
10.一种用户画像的构建装置,其特征在于,包括:
获取单元,用于获取用户在预设时间段的行为数据;
分析单元,用于分析所述行为数据中的多个行为以及每个行为的对象内容,得到当前行为序列;
查找单元,用于根据所述当前行为序列中的对象内容在预设信息库中查找满足预设条件的内容,得到相似对象内容;
生成单元,用于基于多个相似对象内容对用户行为生成相似行为序列;
构建单元,用于利用所述当前行为序列和所述相似行为序列对用户进行画像构建,得到用户画像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910417949.4/1.html,转载请声明来源钻瓜专利网。





