[发明专利]模型训练方法、装置、设备和存储介质在审
| 申请号: | 201911292758.6 | 申请日: | 2019-12-12 |
| 公开(公告)号: | CN111046959A | 公开(公告)日: | 2020-04-21 |
| 发明(设计)人: | 周康明;胡威 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 樊倩 |
| 地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 装置 设备 存储 介质 | ||
1.一种模型训练方法,其特征在于,所述方法包括:
计算机设备获取计算机视觉任务的训练样本集,所述训练样本集包括多个训练样本和每个训练样本的识别标签;
所述计算机设备将所述多个训练样本作为初始神经网络模型的输入,将对应的训练样本的识别标签作为所述初始神经网络模型的参考输出,以目标损失函数的值对所述初始神经网络模型进行训练,得到目标神经网络模型;
其中,所述目标损失函数为基于平均绝对误差函数MAE和分类交叉熵函数CCE进行融合后得到的函数。
2.根据权利要求1所述方法,其特征在于,所述目标损失函数的获取方法,包括:
所述计算机设备基于所述训练样本集,获取所述训练样本集中错误样本的占比信息;
所述计算机设备根据所述占比信息确定与所述错误样本数量有关的权重因子;
所述计算机设备根据所述权重因子、所述MAE和所述CCE确定所述目标损失函数。
3.根据权利要求2所述方法,其特征在于,所述权重因子为q,所述q的范围为不小于0且不大于1,所述计算机设备根据所述权重因子、所述MAE和所述CCE确定所述目标损失函数,包括:
根据公式q*MAE+(1-q)*CCE确定所述目标损失函数。
4.根据权利要求2或3所述方法,其特征在于,所述占比信息所指示的错误样本的占比越大,则所述权重因子越大;所述占比信息所指示的错误样本的占比越小,则所述权重因子越小。
5.根据权利要求3所述方法,其特征在于,所述计算机设备根据所述占比信息确定与所述错误样本数量有关的权重因子,包括:
所述计算机设备根据所述占比信息自适应确定多个权重因子;
对应的,所述计算机设备根据所述权重因子、所述MAE和所述CCE确定所述目标损失函数,包括:
所述计算机设备根据所述多个权重因子、所述MAE和所述CCE确定多个候选损失函数;
所述计算机设备根据每个候选损失函数对应的神经网络模型与所述计算机设备的计算资源匹配度,确定所述目标损失函数;所述目标损失函数对应的神经网络模型与所述计算机设备的计算资源的匹配度最高。
6.根据权利要求2-5任一项所述方法,其特征在于,所述计算机设备基于所述训练样本集,获取所述训练样本集中错误样本的占比信息,包括:
所述计算机设备采用样本遗忘工具处理所述训练样本集,筛选出所述训练样本集中的错误样本;
所述计算机设备基于所述错误样本的个数计算所述训练样本集中错误样本的占比信息。
7.根据权利要求6所述方法,其特征在于,所述计算机设备采用样本遗忘工具处理所述训练样本集,筛选出所述训练样本集中的错误样本,包括:
所述计算机设备采用所述样本遗忘工具动态统计每个训练样本在每次训练过程中的累积遗忘次数;
所述计算机设备基于所述累积遗忘次数和预设的遗忘阈值列表,确定所述训练样本是否为错误样本;
其中,所述遗忘阈值列表包括多个遗忘阈值,每个遗忘阈值与当前的训练次数有关。
8.根据权利要求7所述方法,其特征在于,所述计算机设备基于所述累积遗忘次数和预设的遗忘阈值列表,确定所述训练样本是否为错误样本,包括:
所述计算机设备基于当前的训练日志获取当前的训练进度;
所述计算机设备基于当前的训练进度自适应调整所述遗忘阈值列表中的每个遗忘阈值,并基于所述遗忘阈值确定当前训练过程中所述训练样本是否为所述错误样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911292758.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种烧结烟气脱硝工艺
- 下一篇:移动设备的数据预缓存方法及装置





