[发明专利]一种识别模型的迭代方法和装置在审
申请号: | 202110158715.X | 申请日: | 2021-02-04 |
公开(公告)号: | CN112819078A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 翟步中 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 曾军;黄巍 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 模型 方法 装置 | ||
本申请涉及一种识别模型的迭代方法和装置,其中,该方法包括:获取第一训练样本,其中,第一训练样本包括具有对应关系的第一识别模型识别错误的数据和标注信息,第一识别模型用于执行数据识别任务;使用第一训练样本训练第一识别模型对应的初始模型,得到第二识别模型;将第一训练样本添加到第二训练样本中,得到第三训练样本,其中,第二训练样本是用于训练第一识别模型对应的初始模型的样本;使用第三训练样本训练第二识别模型,得到第三识别模型,其中,第三识别模型用于继续执行数据识别任务。本申请解决了对识别模型进行迭代后得到的模型识别准确率较低的技术问题。
技术领域
本申请涉及计算机领域,尤其涉及一种识别模型的迭代方法和装置。
背景技术
深度学习的模型常常通过识别图片的形式识别物体,这种识别模型的准确率不是100%,在识别过程中有时会出现识别错误的情况。这些识别错误的图片被收集起来,做为模型迭代时训练模型的数据。在深度学习识别模型实际使用中会发现这些被错误的识别的图片对模型优化有更高的价值。但错误图片的分布是不均匀的,并且随着模型的迭代,数据分布一直在变。如果只是简单的把错误图片加入到原图片集中重训模型,并不能很好的优化模型。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供了一种识别模型的迭代方法和装置,以至少解决相关技术中对识别模型进行迭代后得到的模型识别准确率较低的技术问题。
根据本申请实施例的一个方面,提供了一种识别模型的迭代方法,包括:
获取第一训练样本,其中,所述第一训练样本包括具有对应关系的第一识别模型识别错误的数据和标注信息,所述第一识别模型用于执行数据识别任务;
使用所述第一训练样本训练所述第一识别模型对应的初始模型,得到第二识别模型;
将所述第一训练样本添加到第二训练样本中,得到第三训练样本,其中,所述第二训练样本是用于训练所述第一识别模型对应的初始模型的样本;
使用所述第三训练样本训练所述第二识别模型,得到第三识别模型,其中,所述第三识别模型用于继续执行数据识别任务。
可选地,使用所述第一训练样本训练所述第一识别模型对应的初始模型,得到第二识别模型包括:
使用所述第一训练样本分别按照多个学习算法中的每个学习算法训练所述初始模型,得到多个第四识别模型,其中,所述多个学习算法与所述多个第四识别模型一一对应;
确定所述多个第四识别模型中每个第四识别模型的损失值;
将损失值最低的第四识别模型确定为所述第二识别模型。
可选地,使用所述第一训练样本分别按照多个学习算法中的每个学习算法训练所述初始模型,得到多个第四识别模型包括:
将所述第一训练样本划分为支持集和询问集;
使用所述支持集分别按照所述多个学习算法中的每个学习算法训练所述初始模型,得到多个第五识别模型,其中,所述多个学习算法与所述多个第五识别模型一一对应;
使用所述询问集分别对所述多个第五识别模型中的每个第五识别模型进行测试,得到所述多个第四识别模型。
可选地,使用所述支持集分别按照所述多个学习算法中的每个学习算法训练所述初始模型包括:使用所述支持集分别按照所述每个学习算法控制所述初始模型执行多个训练任务,得到所述每个学习算法对应的多个第一子模型,其中,所述多个第一子模型与所述多个训练任务一一对应;
使用所述询问集分别对所述多个第五识别模型中的每个第五识别模型进行测试包括:使用所述询问集分别对所述多个第一子模型中的每个子模型进行测试,得到多个第二子模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110158715.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:充电方法、装置以及存储介质
- 下一篇:一种船用自动排气定压补水装置