[发明专利]转化率预估模型的训练方法、装置及电子设备在审
申请号: | 202110276438.2 | 申请日: | 2021-03-15 |
公开(公告)号: | CN113011920A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 丁娇;张论华;李沛龙;韩聪;姜振 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 黄灿;尹倩 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 转化 预估 模型 训练 方法 装置 电子设备 | ||
本公开公开了一种转化率预估模型的训练方法、装置及电子设备,涉及计算机技术领域,尤其涉及深度学习技术领域。具体实现方案为:获取目标多媒体的M个特征子集及所述目标多媒体的实际转化标签值,其中,每一个所述特征子集包括至少一个特征信息,M为正整数;基于多头注意力机制对所述特征子集中的特征信息进行筛选,得到目标向量;基于所述目标向量得到所述转化率预估模型输出的转化率;获取所述转化率与所述实际转化标签值之间的损失值,基于所述损失值对所述转化率预估模型进行训练。本公开提供的方案能够提高转化率预估模型对转化率预估的准确性。
技术领域
本公开涉及计算机技术领域,具体涉及深度学习技术领域,尤其涉及一种转化率预估模型的训练方法、装置及电子设备。
背景技术
在互联网平台展示广告的过程中,平台需要根据广告的竞价和对广告转化率的预估来决定广告的投放价格。目前,平台通常是基于转化率预估模型来对广告等多媒体的转化率进行预测,集成学习(Ensemble Learning)和多任务学习(Multi-task Learning,MTL)在模型训练中较为常见,通过把训练集合划分为多个样本子集或特征子集,训练多个弱分类器,再通过加权或者辅助训练来实现对目标任务的增强,以提升模型输出结果的准确率。
发明内容
本公开提供了一种转化率预估模型的训练方法、装置及电子设备。
根据本公开的第一方面,提供了一种转化率预估模型的训练方法,包括:
获取目标多媒体的M个特征子集及所述目标多媒体的实际转化标签值,其中,每一个所述特征子集包括至少一个特征信息,M为正整数;
基于多头注意力机制对所述特征子集中的特征信息进行筛选,得到目标向量;
基于所述目标向量得到所述转化率预估模型输出的转化率;
获取所述转化率与所述实际转化标签值之间的损失值,基于所述损失值对所述转化率预估模型进行训练。
根据本公开的第二方面,提供了一种转化率预估模型的训练装置,包括:
第一获取模块,用于获取目标多媒体的M个特征子集及所述目标多媒体的实际转化标签值,其中,每一个所述特征子集包括至少一个特征信息,M为正整数;
筛选模块,用于基于多头注意力机制对所述特征子集中的特征信息进行筛选,得到目标向量;
第二获取模块,用于基于所述目标向量得到所述转化率预估模型输出的转化率;
训练模块,用于获取所述转化率与所述实际转化标签值之间的损失值,基于所述损失值对所述转化率预估模型进行训练。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面中所述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据第一方面所述的方法。
根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据第一方面所述的方法。
本公开提供的方案,基于多头注意力机制来对特征信息进行筛选提取,剔除无关的特征信息,保留并关注与转化率相关性更高的特征信息,使得转化率预估模型能够对转化率作出更准确的预估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110276438.2/2.html,转载请声明来源钻瓜专利网。