[发明专利]超参数的迭代训练方法、迭代训练装置及电子设备在审
申请号: | 202310280280.5 | 申请日: | 2023-03-21 |
公开(公告)号: | CN116361564A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 雷营涛;刘道广;刘博 | 申请(专利权)人: | 微梦创科网络科技(中国)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00;G06F16/9535;G06F18/25 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 叶碧莲 |
地址: | 100193 北京市海淀区东北旺西路中关村*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 参数 训练 方法 装置 电子设备 | ||
1.一种超参数的迭代训练方法,其特征在于,包括:
在每次超参数的迭代训练过程中,获取与至少两个物料预估分值一一对应的至少两组第一正态分布参数,基于与每组第一正态分布参数相对应的正态分布,确定至少两组初始超参数;
基于分别使用所述至少两组初始超参数中每组初始超参数的排序融合模型和所述至少两个物料预估分值,确定与所述至少两组初始超参数一一对应的至少两种物料混排结果,并分别获取每种物料混排结果对应的目标数据;
基于每种物料混排结果对应的目标数据、以及目标激励函数,确定至少两个第一激励函数值;
基于数值从大到小排列的前K个第一激励函数值对应的K组初始超参数,确定与所述至少两个物料预估分值一一对应的至少两组第二正态分布参数,其中,K大于0且小于所述第一激励函数值的总数量;
在判定当前次超参数的迭代训练满足收敛条件的情况下,将当前次得到的最大第一激励函数值对应的一组初始超参数作为所述排序融合模型使用的目标超参数;
其中,所述收敛条件包括:当前次超参数的迭代训练过程中确定的至少两个第一激励函数值与上一次超参数的迭代训练过程中确定的至少两个第一激励函数值之间的波动率小于第一阈值,或所述至少两组第二正态分布参数与所述至少两组第一正态分布参数之间的波动率小于第二阈值。
2.根据权利要求1所述的迭代训练方法,其特征在于,所述获取与至少两个物料预估分值一一对应的至少两组第一正态分布参数,包括:
获取上一次超参数的迭代训练过程中确定的与所述至少两个物料预估分值一一对应的至少两组第二正态分布参数;
基于上一次超参数的迭代训练过程中的所述至少两组第二正态分布参数确定当前次超参数的迭代训练过程中的至少两组第一正态分布参数;其中,在初次超参数的迭代训练过程中,所述至少两组第一正态分布参数为预先配置的参数。
3.根据权利要求2所述的迭代训练方法,其特征在于,每组第一正态分布参数包括第一均值和第一方差,每组第二正态分布参数包括第二均值和第二方差,所述基于上一次超参数的迭代训练过程中的所述至少两组第二正态分布参数确定当前次超参数的迭代训练过程中的至少两组第一正态分布参数,包括:
将上一次的至少两个第二均值作为当前次超参数的迭代训练过程中的至少两个第一均值,将上一次的至少两个第二方差添加噪声扰动后作为当前次超参数的迭代训练过程中的至少两个第一方差。
4.根据权利要求1所述的迭代训练方法,其特征在于,所述至少两个物料预估分值对应至少两种物料类型,每个物料预估分值对应一种物料类型,每种物料类型对应至少一个物料预估分值,所述目标数据包括如下至少之一:人均互动量、互动率、点击率、人均阅读时长、以及所述至少两种物料类型中的各种物料类型曝光量占比。
5.根据权利要求1所述的迭代训练方法,其特征在于,在所述基于每种所述物料混排结果对应的目标数据、以及目标激励函数,确定至少两个第一激励函数值之前,还包括:
基于所述目标数据,确定目标激励函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310280280.5/1.html,转载请声明来源钻瓜专利网。