[发明专利]模型训练方法、装置、终端设备及计算机可读存储介质在审
申请号: | 202110578751.1 | 申请日: | 2021-05-26 |
公开(公告)号: | CN113298152A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 林灿然;程骏;郭渺辰;邵池;庞建新 | 申请(专利权)人: | 深圳市优必选科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 刘永康 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 终端设备 计算机 可读 存储 介质 | ||
本申请适用于图像处理技术领域,提供了一种模型训练方法、装置、终端设备及计算机可读存储介质,包括:获取训练图像的真实标签;根据预先训练后的第一识别模型获取所述训练图像的参考标签;由所述真实标签辅助所述参考标签,对待训练的第二识别模型进行迭代训练,获得训练后的所述第二识别模型,其中,所述第二识别模型的模型复杂度小于所述第一识别模型的模型复杂度。通过上述方法,训练得到的第二识别模型不仅图像识别精度较高,且模型复杂度较低,有效提高了图像识别方法的适用性。
技术领域
本申请属于图像处理技术领域,尤其涉及一种模型训练方法、装置、终端设备及计算机可读存储介质。
背景技术
随着图像处理技术的发展,对图像识别精度的要求也在逐渐提高。基于深度学习的图像识别方法因其数据处理速度快、识别精度高,而成为主流的图像识别方法。
现有的基于深度学习的图像识别方法中,为了实现较高的识别精度,需要构建模型复杂度较高的图像识别模型。而这样的模型往往需要运行在具有较大存储空间的终端设备上,很大程度上限制了图像识别的适用范围。因此,如何利用模型复杂度较低的图像识别模型实现较高的识别精度,是亟需解决的问题。
发明内容
本申请实施例提供了一种模型训练方法、装置、终端设备及计算机可读存储介质,能够训练得到图像识别精度较高、且模型复杂度较低的图像识别模型。
第一方面,本申请实施例提供了一种模型训练方法,包括:
获取训练图像的真实标签;
根据预先训练后的第一识别模型获取所述训练图像的参考标签;
由所述真实标签辅助所述参考标签,对待训练的第二识别模型进行迭代训练,获得训练后的所述第二识别模型,其中,所述第二识别模型的模型复杂度小于所述第一识别模型的模型复杂度。
在本申请实施例中,通过预先训练后的第一识别模型对第二识别模型进行训练,即利用模型复杂度较高的第一识别模型引导模型复杂度较低的第二识别模型学习相关特征,相当于将大而笨重的模型预先学习到的“知识”转移给小型模型;但由于第一识别模型识别出的参考标签与真实标签之间可能仍存在一定偏差,本申请实施例中,利用真实标签辅助训练第二识别模型,以纠正可能存在的偏差,进一步提高了第二识别模型的训练精度。通过上述方法,训练得到的第二识别模型不仅图像识别精度较高,且模型复杂度较低。
在第一方面的一种可能的实现方式中,在由所述真实标签辅助所述参考标签,对待训练的第二识别模型进行迭代训练,获得训练后的所述第二识别模型的步骤中,每一次迭代训练的过程包括:
根据所述第二识别模型获取所述训练图像的识别标签;
由所述真实标签辅助计算所述参考标签和所述识别标签之间的第一损失值;
根据所述第一损失值更新所述第二识别模型。
在第一方面的一种可能的实现方式中,所述由所述真实标签辅助计算所述参考标签和所述识别标签之间的第一损失值,包括:
计算所述参考标签和所述识别标签之间的第二损失值;
根据所述真实标签调整所述第二损失值,得到调整后的所述第二损失值;
将调整后的所述第二损失值确定为所述第一损失值。
在第一方面的一种可能的实现方式中,所述根据所述真实标签调整所述第二损失值,得到调整后的所述第二损失值,包括:
计算所述真实标签和所述识别标签之间的第三损失值;
将所述第二损失值和所述第三损失值加权求和,得到调整后的所述第二损失值。
在第一方面的一种可能的实现方式中,所述根据所述第一损失值更新所述第二识别模型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优必选科技股份有限公司,未经深圳市优必选科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110578751.1/2.html,转载请声明来源钻瓜专利网。