[发明专利]一种用户画像的构建方法和装置在审
| 申请号: | 201910417949.4 | 申请日: | 2019-05-20 |
| 公开(公告)号: | CN111966885A | 公开(公告)日: | 2020-11-20 |
| 发明(设计)人: | 朱家卫;张伸正;吴敬桐 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
| 代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用户 画像 构建 方法 装置 | ||
本发明实施例公开了一种用户画像的构建方法和装置;本发明实施例可以先获取用户在预设时间段的行为数据,接着,分析该行为数据中的多个行为以及每个行为的对象内容,得到当前行为序列,然后,根据该当前行为序列中的对象内容在预设信息库中查找满足预设条件的内容,得到相似对象内容,再基于多个相似对象内容对用户行为生成相似行为序列,再然后,利用该当前行为序列和该相似行为序列对用户进行画像构建,得到用户画像;该方案可以使得用户画像的构建更加丰富和准确。
技术领域
本发明涉及通信技术领域,具体涉及一种用户画像的构建方法和装置。
背景技术
近年来,网络发展迅速,用户人数呈爆炸式增长。通过网络服务,人们除了进行社交行为,更多的是将网络当成公共的媒体平台,满足社交需求和特定兴趣获取需求。因此,在网络的个性化推荐系统中,用户兴趣画像在推荐的各个模块(召回,排序,重排)中起着重要作用,对用户兴趣刻画是否准确直接影响到线上效果。
为了能够准确刻画用户兴趣,现有技术主要是通过获取用户行为,然后使用这些行为文章的自然语言处理(Natural Language Processing,NLP)信息对用户进行兴趣刻画。这种方式通常只是一些简单的标签统计,具有一定的局限性,所构建的用户画像准确性并不高。
发明内容
本发明实施例提供一种用户画像的构建方法和装置,可以使得用户画像的构建更加丰富和准确。
本发明实施例提供一种用户画像的构建方法,包括:
获取用户在预设时间段的行为数据;
分析所述行为数据中的多个行为以及每个行为的对象内容,得到当前行为序列;
根据所述当前行为序列中的对象内容在预设信息库中查找满足预设条件的内容,得到相似对象内容;
基于多个相似对象内容对用户行为生成相似行为序列;
利用所述当前行为序列和所述相似行为序列对用户进行画像构建,得到用户画像。
相应的,本发明实施例还提供一种用户画像的构建装置,包括:
获取单元,用于获取用户在预设时间段的行为数据;
分析单元,用于分析所述行为数据中的多个行为以及每个行为的对象内容,得到当前行为序列;
查找单元,用于根据所述当前行为序列中的对象内容在预设信息库中查找满足预设条件的内容,得到相似对象内容;
生成单元,用于基于多个相似对象内容对用户行为生成相似行为序列;
构建单元,用于利用所述当前行为序列和所述相似行为序列对用户进行画像构建,得到用户画像。
可选的,在一些实施例中,所述生成单元可以包括计算子单元和预测子单元,如下:
所述计算子单元,用于利用所述当前行为序列和多个相似对象内容计算用户对每个相似对象内容的偏好强度;
所述预测子单元,用于根据用户的偏好强度对用户行为进行预测,生成相似行为序列。
可选的,在一些实施例中,所述计算子单元,具体用于设置当前行为序列中行为的权重;计算当前行为序列的每个对象内容与相似对象内容的相似性;利用所述行为的权重和所述相似性计算用户对每个相似对象内容的偏好强度。
可选的,在一些实施例中,所述查找单元可以包括向量化子单元和查找子单元,如下:
所述向量化子单元,用于采用向量训练模型将所述当前行为序列中的对象内容进行向量化,得到对象向量;采用向量训练模型将预设信息库中的内容进行向量化,得到内容向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910417949.4/2.html,转载请声明来源钻瓜专利网。





