[发明专利]基于一致性负样本的图像目标检测模型训练方法及装置有效
申请号: | 201911183070.4 | 申请日: | 2019-11-27 |
公开(公告)号: | CN110969200B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 陈晨;王晓莲;胡晰远;彭思龙 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 一致性 样本 图像 目标 检测 模型 训练 方法 装置 | ||
本发明涉及图像处理技术领域,具体涉及一种基于一致性负样本的图像目标检测模型训练方法及装置。为了解决现有技术采用固定负样本导致模型难以学习到有判别力的特征的问题,本发明提出一种图像目标检测模型训练方法,该方法包括基于待识别图像中的真实框和预设的初始锚框的重叠度,获取初始图像样本集;根据所述初始图像样本集,通过预设的图像目标检测模型,获取所述与初始锚框对应的预测锚框,基于所述真实框与所述预测锚框的重叠度,获取更新图像样本集;通过所述更新图像样本集训练所述图像目标检测模型。利用本发明的方法和装置能够利用更为全面的信息训练图像目标检测模型。
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于一致性负样本的图像目标检测模型训练方法及装置。
背景技术
目标检测是预测图像中所有目标物体的位置,并用矩形框将目标物体的位置进行标记,预测矩形框内物体的类别。目前鲁棒高效的方法大多基于卷积神经网络,常采用基于锚框的方式,即事先在图像上按一定间隔均匀铺满锚框,在预测过程中,模型对先验锚框进行回归,使它们的形状和位置逐渐贴近前景物体,同时模型对框内的物体进行类别预测,从而完成目标检测。
为了对模型进行监督训练,初始平铺在图像中的先验锚框要预先设定各自的回归目标,即对应具体的真实框。回归目标的匹配由锚框和真实框的重叠度决定,并由此确定正负样本。
在以往的方法中,正负样本的分配是一个一次性操作,并由正负分配阈值决定(“正负”针对样本性质而言,非数值正负)。当锚框和其最近真实框的重叠度高于正阈值时为正样本,和所有真实框的重叠度均低于负阈值时为负样本,其它未分配的样本为中性样本且不参与训练。
采用不同的阈值对,会对正负样本集的生成产生影响。虽然不同检测器在阈值的设定上有差别,但它们都使用了固定负样本,即负样本一旦在训练前被分配好,在训练过程中就都是固定不变的。初始正负样本的分配完全基于人类先验,即默认离物体远的框不会回归到物体附近。但恰有某些负样本在经过一次次迭代优化过的模型后产生了和初始不同的表现,即不再处于背景区。由于在深度学习中模型受数据驱动进行优化,如此的有偏负样本会混淆前景和背景的概念,使模型难以学到有判别力的特征。
因此,如何提出一种解决现有技术问题的方案是本领域技术人员需要解决的技术问题。
发明内容
为了解决现有技术中的上述问题,即为了解决现有技术采用固定负样本导致模型难以学习到有判别力的特征的问题,本发明的第一方面提供了一种基于一致性负样本的图像目标检测模型训练方法,所述方法包括:
基于待识别图像中的真实框和预设的初始锚框的重叠度,获取初始图像样本集;
其中,所述初始锚框为所述待识别图像中预先设定的锚框,所述真实框为所述待识别图像中待识别物体对应的真实矩形框,所述初始图像样本集为与所述真实框的重叠度满足预设条件的初始锚框的集合;
根据所述初始图像样本集,通过预设的图像目标检测模型,获取所述与初始锚框对应的预测锚框,基于所述真实框与所述预测锚框的重叠度,获取更新图像样本集;
其中,所述图像目标检测模型基于神经网络构建,通过预设图像样本集训练,用于识别图像中待识别物体和确定所述待识别物体的真实框的位置;
通过所述更新图像样本集训练所述图像目标检测模型。
优选地,所述真实框的个数为多个,“基于待识别图像中真实框和预设的初始锚框的重叠度,获取初始图像样本集”,其方法包括:
分别获取每个所述初始锚框与多个所述真实框的第一重叠度,
若存在第一重叠度大于等于第一预设阈值,则将与至少一个所述真实框的第一重叠度大于等于第一预设阈值的初始锚框认定为第一锚框,将所述第一锚框的集合作为正样本集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911183070.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种应用有纯水蓄水箱的纯水泡膜方法
- 下一篇:一种钻石光感面料及其制备方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序