[发明专利]数据处理方法、装置以及计算机可读介质在审
| 申请号: | 202010662408.0 | 申请日: | 2020-07-10 |
| 公开(公告)号: | CN112749332A | 公开(公告)日: | 2021-05-04 |
| 发明(设计)人: | 郝晓波;刘雨丹;葛凯凯;唐琳瑶;张旭;林乐宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/04;G06N3/08;H04L29/08 |
| 代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 韩绍君 |
| 地址: | 518064 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 装置 以及 计算机 可读 介质 | ||
1.一种数据处理方法,其特征在于,包括:
获取待训练的兴趣试探模型根据用户特征数据确定的第一分值,所述第一分值用于表征样本数据属于用户未知兴趣的可能性;
获取联合概率模型根据所述样本数据确定的权重值,所述权重值用于表征所述样本适用于训练所述兴趣试探模型的可能性;
根据所述权重值调整所述第一分值,所述权重值与所述第一分值正相关;
根据调整后的所述第一分值训练所述待训练的兴趣试探模型,训练后的兴趣试探模型用于根据所述用户特征数据确定用户的预估兴趣信息,所述预估兴趣信息为所述用户的非已知兴趣信息,所述预估兴趣信息用于确定推送至用户对应的客户端的待推送内容。
2.根据权利要求1所述的方法,其特征在于,所述获取联合概率模型根据所述样本数据确定的权重值,包括:
获取所述用户与各个好友之间的亲密程度和每个好友的兴趣信息;
获取联合概率模型根据每个所述好友的亲密程度、每个好友的兴趣信息以及所述样本数据确定的所述权重值。
3.根据权利要求2所述的方法,其特征在于,所述联合概率模型用于:
根据每个好友的已知兴趣信息确定的每个好友对所述样本数据的兴趣度;
根据所述好友的亲密程度和兴趣度确定所述权重值,其中,所述亲密程度越大且所述兴趣度越大,所确定的所述权重值越小。
4.根据权利要求1所述的方法,其特征在于,还包括:
获取精准兴趣模型根据所述用户的已知兴趣信息确定的第二分值,所述第二分值用于表征所述样本数据属于用户已知兴趣的可能性,所述已知兴趣信息为已确定的所述用户的兴趣爱好;
根据所述第一分值和所述第二分值调整所述权重值,所述权重值作为所述联合概率模型的损失函数的输出值;
根据调整后的所述权重值训练所述联合概率模型。
5.根据权利要求1所述的方法,其特征在于,所述获取待训练的兴趣试探模型根据用户特征数据确定的第一分值之前,还包括:
根据所述样本数据和所述用户特征数据对初始的兴趣试探模型预先训练指定次数,得到待训练的兴趣试探模型。
6.根据权利要求1-5任一所述的方法,其特征在于,所述用户特征数据包括用户的基础特征和行为数据,所述行为数据为用户针对客户端的指定应用模块以及其他应用模块的操作产生的数据,所述其他应用模块为与所述指定应用模块相关的同属于所述客户端的应用模块。
7.根据权利要求1-5任一所述的方法,其特征在于,所述根据调整后的所述第一分值训练所述待训练的兴趣试探模型之后,还包括:
获取根据已训练的兴趣试探模型得到用户的预估兴趣信息;
根据所述用户的预估兴趣信息确定待推送内容;
将所述待推送内容推送至所述用户对应的客户端。
8.根据权利要求7所述的方法,其特征在于,所述根据所述用户的预估兴趣信息确定待推送内容,包括:
确定符合指定需求的内容,作为备选内容;
根据所述用户的预估兴趣信息由所述备选内容内确定待推送内容。
9.根据权利要求8所述的方法,其特征在于,所述确定符合指定需求的内容,作为备选内容,包括:
由多个内容内确定与用户的已知兴趣信息匹配的内容;
将所述多个内容中,所述匹配内容之外的内容作为备选内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010662408.0/1.html,转载请声明来源钻瓜专利网。





