[发明专利]一种模型训练以及点击率预估方法及装置有效
申请号: | 202110265834.5 | 申请日: | 2021-03-11 |
公开(公告)号: | CN113010780B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 曹雪智;张富峥 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/36;G06F16/955 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 以及 点击率 预估 方法 装置 | ||
本说明书公开了一种模型训练以及点击率预估方法及装置,通过根据用户信息、产品信息、用户历史行为构建多模态知识图谱的结构,以及确定该多模态知识图谱内各节点的基础特征,并根据该多模态知识图谱的结构以及图谱内各节点的基础特征,确定各节点的增强特征,进而确定图谱中各用户节点与各产品节点的增强表示,以确定由用户节点的图谱表示和产品节点的图谱表示构成的各训练样本,以及样本标签,并根据标签及预测结果对该点击率预估模型进行训练。基于多模态知识图谱,确定用户节点和产品节点的图谱表示,得到训练样本和样本标签,使得训练出的点击率预估模型,可基于该图谱中的各条知识进行点击率预估,提高了模型的预测准确率。
技术领域
本说明书涉及计算机技术领域,尤其涉及一种模型训练以及点击率预估方法及装置。
背景技术
目前,随着计算机技术的发展,如何从海量信息中选择有价值的信息,从而为用户推荐合适的产品,已经成为服务提供方需要解决的问题之一。而点击率预估模型因为能够基于用户的历史行为以及产品特性为用户推荐合适的产品的特性,被广泛应用于服务提供方为用户提供服务的场景中。
在现有技术中,一种常用的点击率预估方法是将用户的用户信息、用户的历史行为信息、以及产品的产品信息进行特征提取,并将提取出来的用户特征、用户的历史行为特征,以及产品特征作为输入,输入到预先训练好的基于深度学习的点击率预估模型中,由该点击率预估模型确定出该用户对于该产品的点击率。
但是,在缺少用户信息以及用户的历史行为信息的情况下,如,冷启动场景中,现有技术无法准确地确定出产品的点击率,因此,为了提高点击率预估的准确度,亟需一种改进的点击率预估方法。
发明内容
本说明书提供模型训练以及点击率预估方法及装置,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供的点击率预估模型的训练方法,包括:
根据各用户的用户信息、各产品的产品信息,以及各用户的历史行为,确定多模态知识图谱的结构,所述多模态知识图谱中至少包括用户节点以及产品节点;
根据各用户的用户信息以及各产品的产品信息,通过待训练的点击率预估模型的图谱表示模块的编码器,确定所述多模态知识图谱中各节点的基础特征;
根据所述多模态知识图谱中各节点的基础特征以及所述多模态知识图谱的结构,确定各节点的增强特征,其中,所述节点的增强特征可根据所述节点的相邻节点的基础特征确定;
根据所述多模态知识图谱的结构、各节点的基础特征以及增强特征,分别确定各用户节点的图谱表示以及各产品节点的图谱表示;
确定由用户节点的图谱表示和产品节点的图谱表示构成的各训练样本,并根据用户历史行为,确定各训练样本的标签;
将各训练样本作为输入,输入待训练的点击率预估模型的预测模块,并根据所述预测模块的预测结果以及各训练样本的标签,确定损失函数,并以损失函数最小为优化目标调整所述预测模块的参数,训练完成的所述点击率预估模型用于对用户点击产品的概率进行预测。
可选地,根据各用户的用户信息、各产品的产品信息,以及各用户的历史行为,确定多模态知识图谱的结构,具体包括:
根据各用户的用户信息,以及各产品的产品信息,确定所述多模态知识图谱的各节点;
根据各用户的用户信息、各产品的产品信息、各用户的历史行为,确定所述多模态知识图谱中的各节点的关联关系;
根据所述多模态知识图谱的各节点,以及所述多模态知识图谱中的各节点的关联关系,确定所述多模态知识图谱的结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110265834.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种过约束两栖机器人
- 下一篇:一种信息推荐的方法及装置