[发明专利]网络模型的训练方法、装置、设备和存储介质在审
| 申请号: | 201710993043.8 | 申请日: | 2017-10-23 |
| 公开(公告)号: | CN107633242A | 公开(公告)日: | 2018-01-26 |
| 发明(设计)人: | 张玉兵 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 孟金喆 |
| 地址: | 510530 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网络 模型 训练 方法 装置 设备 存储 介质 | ||
1.一种网络模型的训练方法,其特征在于,包括:
当第一网络模型达到预设的更新停止条件,根据所述第一网络模型的更新结果确定第一目标网络模型,在所述第一目标网络模型中的预设池化层后插入中继损失网络层以确定第二网络模型;
根据所述第二网络模型以及所述中继损失网络层确定所述中继损失网络层对应的中继损失函数;
根据所述第二网络模型和所述中继损失函数确定所述第二网络模型的全局损失函数;
应用所述中继损失函数和所述全局损失函数对所述第二网络模型的参数进行更新,以获取更新后的第二网络模型。
2.根据权利要求1所述的方法,其特征在于,所述预设的更新停止条件包括:第一网络模型的训练精度在设定的次数中均小于第一预设精度阈值;
在当第一网络模型达到预设的更新停止条件,根据所述第一网络模型的更新结果确定第一目标网络模型,在所述第一目标网络模型中的预设池化层后插入中继损失网络层以确定第二网络模型之前,还包括:
将待训练图片输入到第一网络模型中进行训练,根据训练结果对所述第一网络模型进行更新;
所述当第一网络模型达到预设的更新停止条件,根据所述第一网络模型的更新结果确定第一目标网络模型,包括:
根据所述训练结果确定的第一训练精度在设定的次数中均小于第一预设精度阈值时,记录所述第一网络模型最后一次的更新结果作为第一目标网络模型和所述待训练图片的训练结果,将所述待训练图片的训练结果作为第一训练结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第二网络模型以及所述中继损失网络层确定所述中继损失网络层对应的中继损失函数,包括:
将待所述第一训练结果的图片输入到所述第二网络模型进行训练,获取所述第一训练结果的图片在所述中继损失网络层的输出结果;
根据所述输出结果确定中继损失函数。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第二网络模型和所述中继损失函数确定所述第二网络模型的全局损失函数,包括:
获取所述网络模型中的初始全局损失函数;
将所述中继损失函数与所述初始全局损失函数进行结合以确定所述第二网络模型的全局损失函数。
5.根据权利要求1所述的方法,其特征在于,所述应用所述中继损失函数和所述全局损失函数对所述第二网络模型的参数进行更新,以获取更新后的第二网络模型,包括:
应用所述中继损失函数对所述第二网络模型中预设池化层之前各层的参数进行更新,同时,应用全局损失函数对所述第二网络模型中各层的参数进行更新;
根据所述各层的参数更新结果获取更新后的第二网络模型。
6.根据权利要求1所述的方法,其特征在于,所述应用所述中继损失函数和所述全局损失函数对所述第二网络模型的参数进行更新,以获取更新后的第二网络模型之后,还包括:
将所述更新后的第二网络模型对图片验证集中的图片进行训练以获取训练精度;
若所述训练精度大于第二预设精度阈值,则停止对所述第二网络模型的更新,将最后一次的更新结果作为第二目标网络模型。
7.根据权利要求1所述的方法,其特征在于,所述第一网络模型和所述第二网络模型均包括卷积层、池化层和全连阶层,其中,所述预设池化层为所述池化层中的任意一层;
所述在所述第一目标网络模型中的预设池化层后插入中继损失网络层以确定第二网络模型,包括:
在所述第一目标网络模型中的预设池化层后插入至少一个中继损失网络层以确定第二网络模型。
8.一种网络模型的训练装置,其特征在于,包括:
第二网络模型确定模块,用于当第一网络模型达到预设的更新停止条件,根据所述第一网络模型的更新结果确定第一目标网络模型,在所述第一目标网络模型中的预设池化层后插入中继损失网络层以确定第二网络模型;
中继损失函数确定模块,用于根据所述第二网络模型以及所述中继损失网络层确定所述中继损失网络层对应的中继损失函数;
全局损失函数确定模块,用于根据所述第二网络模型和所述中继损失函数确定所述第二网络模型的全局损失函数;
第二网络模型更新模块,用于应用所述中继损失函数和所述全局损失函数对所述第二网络模型的参数进行更新,以获取更新后的第二网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710993043.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:纸张收叠机
- 下一篇:一种计算机专用清洁散热装置





