[发明专利]超参数的迭代训练方法、迭代训练装置及电子设备在审
申请号: | 202310280280.5 | 申请日: | 2023-03-21 |
公开(公告)号: | CN116361564A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 雷营涛;刘道广;刘博 | 申请(专利权)人: | 微梦创科网络科技(中国)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00;G06F16/9535;G06F18/25 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 叶碧莲 |
地址: | 100193 北京市海淀区东北旺西路中关村*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 参数 训练 方法 装置 电子设备 | ||
本申请公开一种超参数的迭代训练方法、迭代训练装置及电子设备,该方法包括:获取与至少两个物料预估分值对应的至少两组第一正态分布参数,确定至少两组初始超参数;基于分别使用每组初始超参数的排序融合模型和至少两个物料预估分值,确定至少两种物料混排结果,分别获取每种物料混排结果对应的目标数据;基于每种物料混排结果对应的目标数据以及目标激励函数,确定至少两个第一激励函数值;基于前K个第一激励函数值对应的K组初始超参数,确定至少两个物料预估分值对应的至少两组第二正态分布参数;在判定当前次超参数的迭代训练满足收敛条件的情况下,将当前次得到的最大第一激励函数值对应的一组初始超参数作为排序融合模型的目标超参数。
技术领域
本申请涉及超参数搜索领域,尤其涉及一种超参数的迭代训练方法、迭代训练装置及电子设备。
背景技术
作为从海量信息中提取有价值、符合用户兴趣的内容的手段之一,推荐系统在互联网信息爆炸的时代蓬勃发展。其中,基于社交关系的推荐系统,是在推荐系统中利用用户的社交网络来进行更加精准的内容推荐,其中心思想为用户会对关注的人所感兴趣的内容同样感兴趣,因此,推荐系统的物料池中存在关注人物料、关注人感兴趣物料、关注的兴趣领域下物料等多种类型物料。在面临多种类型物料进行推荐时,需要建立基于统一价值的排序融合模型,以更好地平衡各种类型物料的影响,使整体推荐系统达到最优效果。
在相关技术中,在排序融合模型中,超参数的调整方式为基于人工经验手动调整超参数,并在手动调整超参数后,观察线上核心业务数据指标,然后根据历史经验继续对超参数进行迭代调整,存在超参数的迭代速度慢的问题。
发明内容
本申请公开一种超参数的迭代训练方法、迭代训练装置及电子设备,以解决相关技术中存在的超参数的迭代速度慢的问题。
为了解决上述问题,本申请采用下述技术方案:
第一方面,本申请实施例提供了一种超参数的迭代训练方法,包括:在每次超参数的迭代训练过程中,获取与至少两个物料预估分值一一对应的至少两组第一正态分布参数,基于与每组第一正态分布参数相对应的正态分布,确定至少两组初始超参数;基于分别使用所述至少两组初始超参数中每组初始超参数的排序融合模型和所述至少两个物料预估分值,确定与所述至少两组初始超参数一一对应的至少两种物料混排结果,并分别获取每种物料混排结果对应的目标数据;基于每种物料混排结果对应的目标数据、以及目标激励函数,确定至少两个第一激励函数值;基于数值从大到小排列的前K个第一激励函数值对应的K组初始超参数,确定与所述至少两个物料预估分值一一对应的至少两组第二正态分布参数,其中,K大于0且小于所述第一激励函数值的总数量;在判定当前次超参数的迭代训练满足收敛条件的情况下,将当前次得到的最大第一激励函数值对应的一组初始超参数作为所述排序融合模型使用的目标超参数;其中,所述收敛条件包括:当前次超参数的迭代训练过程中确定的至少两个第一激励函数值与上一次超参数的迭代训练过程中确定的至少两个第一激励函数值之间的波动率小于第一阈值,或所述至少两组第二正态分布参数与所述至少两组第一正态分布参数之间的波动率小于第二阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310280280.5/2.html,转载请声明来源钻瓜专利网。