[发明专利]一种模型的训练方法、装置、存储介质及电子装置在审
申请号: | 202210353017.X | 申请日: | 2022-04-06 |
公开(公告)号: | CN114511042A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 林亦宁;易芮 | 申请(专利权)人: | 杭州闪马智擎科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310000 浙江省杭州市西湖区文*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 存储 介质 电子 | ||
1.一种模型的训练方法,其特征在于,包括:
利用训练完成的目标老师模型从N个目标维度识别训练数据,确定所述训练数据的第一特征图以及所述训练数据在每个所述目标维度的第一识别结果,其中,所述目标老师模型中包括所述N个第一子模型,一个所述第一子模型用于从一个所述目标维度识别所述训练数据;
利用初始学生模型从所述N个所述目标维度识别所述训练数据,确定所述训练数据的第二特征图以及所述训练数据在每个所述目标维度的第二识别结果,其中,所述初始学生模型为经过初始训练后得到的网络模型,所述初始学生模型中包括所述N个第二子模型,一个所述第二子模型用于从一个所述目标维度识别所述训练数据;
基于所述第一识别结果、所述第二识别结果、所述第一特征图以及所述第二特征图确定所述初始学生模型的目标损失值;
在所述目标损失值不满足预定条件的情况下,更新所述初始学生模型的网络参数,直到所述目标损失值满足所述预定条件为止,得到目标网络模型。
2.根据权利要求1所述的方法,其特征在于,基于所述第一识别结果、所述第二识别结果、所述第一特征图以及所述第二特征图确定所述初始学生模型的目标损失值包括:
基于所述第一识别结果以及所述第二识别结果确定第一损失值;
基于所述第一特征图以及所述第二特征图确定第二损失值;
基于所述第一损失值以及所述第二损失值确定目标损失值。
3.根据权利要求2所述的方法,其特征在于,基于所述第一识别结果以及所述第二识别结果确定第一损失值包括:
确定所述第一识别结果中包括的每个所述目标维度的第一子识别结果以及所述第二识别结果中包括的每个所述目标维度的第二子识别结果;
基于每个所述目标维度的所述第一子识别结果以及所述第二子识别结果确定第一子损失值;
确定每个所述目标维度对应的目标权重;
基于每个所述第一子损失值以及每个所述目标权重确定所述第一损失值。
4.根据权利要求3所述的方法,其特征在于,确定每个所述目标维度对应的目标权重包括:
在首次确定所述第一损失值的情况下,将预先确定的初始权重确定为每个所述目标维度的所述目标权重;
在非首次确定所述第一损失值,确定所述N个所述第一子损失值中包括的最大子损失值,按照第一预定方式增大所述最大子损失值对应的目标维度的第一当前权重,减小其他子损失值对应的目标维度的第二当前权重,以得到每个所述目标维度的所述目标权重,其中,所述其他子损失值为所述N个所述第一子损失值中包括的除所述最大子损失值之外的损失值。
5.根据权利要求3所述的方法,其特征在于,基于每个所述第一子损失值以及每个所述目标权重确定所述第一损失值包括:
确定每个所述目标权重与第一常数的乘积的倒数,得到N个第一倒数;
确定每个所述第一子损失值与所述第一子损失值对应的所述第一倒数的第一乘积,以得到所述N个第一乘积;
确定所述N个所述目标权重的乘积的N次方根;
确定以第二常数为底的所述N次方根的对数;
将所述N个所述第一乘积以及所述对数的第一和值确定为所述第一损失值。
6.根据权利要求2所述的方法,其特征在于,基于所述第一特征图以及所述第二特征图确定第二损失值包括:
确定所述第一特征图与所述第二特征图之间的均方误差;
将所述均方误差确定为所述第二损失值。
7.根据权利要求2所述的方法,其特征在于,基于所述第一损失值以及所述第二损失值确定目标损失值包括:
确定所述第一损失值对应的第一权重以及所述第二损失值对应的第二权重;
确定所述第一损失值与所述第一权重的第二乘积;
确定所述第二损失值与所述第二权重的第三乘积;
将所述第二乘积与所述第三乘积的第二和值确定为所述目标损失值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州闪马智擎科技有限公司,未经杭州闪马智擎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210353017.X/1.html,转载请声明来源钻瓜专利网。