[发明专利]用户画像生成方法、装置、存储介质及设备在审
申请号: | 202010082465.1 | 申请日: | 2020-02-07 |
公开(公告)号: | CN111275492A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 易全政;胡彬;肖邱勇;郑晓晓;张纪红 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/00;G06K9/62;G06N20/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 画像 生成 方法 装置 存储 介质 设备 | ||
本申请实施例公开了一种用户画像生成方法、装置、存储介质及设备,其中,该方法包括:获取第一用户的用户特征数据,以及至少两个第二用户的用户特征数据,所述至少两个第二用户与所述第一用户均具有社交关联关系;对所述至少两个第二用户进行聚类,得到至少两个用户集合,每个用户集合中的第二用户的用户特征数据之间的相似度满足相似度条件;根据所述每个用户集合中的第二用户的用户特征数据,确定所述每个用户集合对应的关键用户特征数据;根据所述每个用户集合对应的关键用户特征数据以及所述第一用户的用户特征数据,生成所述第一用户的用户画像。通过本申请实施例能够提高对用户画像的生成准确度。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种用户画像生成方法、装置、存储介质及设备。
背景技术
用户画像是指用于描述用户特征的技术,即通过获取针对用户的标签属性,从而利用这些标签属性对用户多方面的特征进行描述;用户画像可以用于挖掘用户需求及分析用户偏好等等,并通过匹配用户画像给用户提供更高效和更有针对性的信息。目前主要是通过对用户发布至社交网页中的内容进行分析,以得到用户的用户画像。实践中发现,如果用户在社交网页中发布内容的频率比较低,则只能从社交网页中获取到少量与该用户相关的信息,导致生成的用户画像的准确度比较低。
发明内容
本申请实施例所要解决的技术问题在于,提供一种用户画像生成方法、装置、存储介质及设备,能够提高对用户画像的生成准确度。
本申请实施例一方面提供一种用户画像生成方法,包括:
获取第一用户的用户特征数据,以及至少两个第二用户的用户特征数据,所述至少两个第二用户与所述第一用户均具有社交关联关系;
对所述至少两个第二用户进行聚类,得到至少两个用户集合,每个用户集合中的第二用户的用户特征数据之间的相似度满足相似度条件;
根据所述每个用户集合中的第二用户的用户特征数据,确定所述每个用户集合对应的关键用户特征数据;
根据所述每个用户集合对应的关键用户特征数据以及所述第一用户的用户特征数据,生成所述第一用户的用户画像。
可选的,获取所述至少两个第二用户的用户特征数据对应的类别数量,作为第一数量;
根据所述第一数量获取高斯混合模型,所述高斯混合模型包括至少两个高斯分量,所述至少两个高斯分量中的高斯分量的数量与所述第一数量相同;
获取所述至少两个第二用户的用户特征数据分别属于第i个高斯分量的概率,作为目标概率,所述第i个高斯模型属于所述至少两个高斯分量,i为小于或等于K的正整数,K为所述至少两个高斯分量中的高斯分量的数量;
对所述至少两个第二用户中对应的所述目标概率大于概率阈值的第二用户进行聚类,得到所述第i个高斯分量对应的用户集合。
可选的,获取所述至少两个第二用户的用户特征数据分别属于所述第i个高斯分量的概率,作为第一概率;
采用所述第一概率更新所述第i个高斯分量的原始参数,得到更新后的第i个高斯分量;
若所述更新后的第i个高斯分量处于收敛状态,则将所述第一概率确定为所述目标概率。
可选的,获取所述至少两个第二用户的用户特征数据分别属于所述更新后的第i个高斯分量的概率,作为第二概率;
获取所述第一概率与所述第二概率之间的差值;
若所述第一概率与所述第二概率之间的差值小于第一差值阈值,则确定所述更新后的第i个高斯分量处于所述收敛状态。
可选的,获取所述更新后的第i个高斯分量的参数,作为更新参数;
获取所述更新参数与所述原始参数之间的差值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010082465.1/2.html,转载请声明来源钻瓜专利网。