[发明专利]图片分析模型调整方法、装置以及计算机可读存储介质在审
| 申请号: | 202111683471.3 | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN114359669A | 公开(公告)日: | 2022-04-15 |
| 发明(设计)人: | 潘雪;杨浚琦;吴凡 | 申请(专利权)人: | 云从科技集团股份有限公司 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 宋宝库;郭婷 |
| 地址: | 511457 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图片 分析 模型 调整 方法 装置 以及 计算机 可读 存储 介质 | ||
本发明涉及计算机处理技术领域,具体提供一种图片分析模型调整方法、装置以及计算机可读存储介质,旨在解决快速调整模型以降低误检情况的技术问题。为此目的,本发明的方法包括:将训练图片输入模型,其携带指示第一检测框的类别的标注数据,模型检测头包括第一分支和第二分支,计算第二检测框的置信度和类别;在置信度高于预设水平时,判断第二检测框与第一检测框类别是否相同,不相同时为第二检测框设置伪标签,记录其类别为未知类别;对第二分支进行调整;调整完毕后,禁止模型输出检测框类别为未知类别的结果。本发明只对输出检测框类别的分支进行调整,有利于提升模型调整的效率,禁止模型输出未知类型的检测结果,改善了模型的识别能力。
技术领域
本发明涉及计算机技术领域,具体提供一种图片分析模型调整方法、装置以及计算机可读存储介质。
背景技术
随着人工智能领域的发展,计算机视觉技术在生活中得到广泛应用,人们所熟知的刷脸支付、智能监控、自动驾驶等等,背后都有一套基于计算机视觉的系统提供支持。这些系统的第一步工作大部分都是目标检测任务,找出图像中感兴趣的目标(物体),确定他们的类别和位置,然后再交由系统的后续识别、跟踪等模块进一步处理。这种检测模型通常只针对特定的检测类别,如人脸、车辆、行人、商品等,模型可以部署在开放场景下的任意环境中。
但是基于特定任务的检测模型学习都会面临一个通用的问题,准备阶段训练数据场景单一,即使在训练集表现较好的模型,当部署在开放场景时也会存在很多意想不到的误检。因此模型在实际部署过程中,场景多样性和复杂性急剧增大,误检风险明显升高。而误检的存在又会极大地影响系统的后续识别结果。因此,如何在有限的训练集上,迅速迭代模型,减少模型在开放场景的误检是一个非常有意义且十分必要的技术问题。
针对检测模型的误检问题,当前主要使用的方法包括以下两种:
(1)基于阈值过滤的方法:提高模型的输出置信度阈值,只输出分数较高模型笃定的检测目标,但是这样必然会降低模型的召回率,减少有效输出。
(2)误检作为背景的模型训练:如果总是对某种类型的目标误检,可以增加一些相应的样本到训练集中去,提高模型的分辨能力,可以在不降低召回的情况下降低误检。这种方法也存在一个直接的问题,为了让模型充分学习误检对象作为背景的泛化性,需要进行端到端的学习,每新增一类误检对象,都需要对模型重新进行端到端的训练,当训练集数据量庞大时,这样的迭代速度显然是不能被接受的。
发明内容
为了克服上述缺陷,提出了本发明,以提供解决或至少部分地快速调整模型以降低误检情况的图片分析模型调整方法、装置以及计算机可读存储介质。
在第一方面,本发明提供一种图片分析模型调整方法,所述方法包括:
将训练图片输入所述模型,所述训练图片携带指示了所述训练图片中目标对象的第一检测框的类别的标注数据,所述模型的检测头包括第一分支和第二分支,分别计算用于指示所述目标对象的第二检测框的置信度和类别;
在所述第二检测框的置信度高于预设水平时,判断所述第二检测框的类别与所述第一检测框的类别是否相同,在不相同时为所述第二检测框设置伪标签,并在所述伪标签中记录所述第二检测框的类别为未知类别;
将所述第二检测框及所述伪标签作为所述第二分支的训练数据,输入所述第二分支,根据输出结果对所述第二分支进行调整;
在所述模型调整完毕后,禁止所述模型输出检测框类别为所述未知类别的结果。
在上述图片分析模型调整方法的一个技术方案中,“根据输出结果对所述第二分支进行调整”的步骤,包括:
根据预设的损失函数,计算所述输出结果的损失值,根据所述损失值对所述第二分支的参数进行调整;
和/或,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云从科技集团股份有限公司,未经云从科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111683471.3/2.html,转载请声明来源钻瓜专利网。





