[发明专利]对图像进行分类的方法、计算机设备、存储介质在审
申请号: | 202111306893.9 | 申请日: | 2021-11-05 |
公开(公告)号: | CN113920377A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 王美涵 | 申请(专利权)人: | 中国电子科技集团公司信息科学研究院 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/774;G06N3/04;G06N3/08 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 付婧 |
地址: | 100086 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 进行 分类 方法 计算机 设备 存储 介质 | ||
本发明涉及一种对图像进行分类的方法方法、计算机设备和存储介质,该方法包括:获取第一训练样本;基于图像分类模型中的第一处理支路,获得第一训练样本的第一分类信息;基于图像分类模型中的被关注区域提取支路,获得第一训练样本的各图像中被关注区域的图像;基于图像分类模型中的第二处理支路,获得第一训练样本和被关注区域的图像组成的第二训练样本的第二分类信息;基于第一分类信息的第一损失函数、第二分类信息的第二损失函数和图像分类模型总的损失函数,对图像分类模型进行训练。上述方法训练得到的模型能避免长尾效应,能增强模型的泛化性能。
技术领域
本发明涉及计算机视觉技术领域,特别是涉及对图像进行分类的方法、计算机设备和存储介质。
背景技术
图像分类模型的训练(Fine-Grained Categorization),又被称作子类别图像分类(Sub-Category Recognition),是近年来计算机视觉、模式识别等领域一个非常热门的研究课题。其目的是对粗粒度的大类别进行更加细致的子类划分。细粒度图像的类别精度更加细致,类间差异更加细微,往往只能借助于微小的局部差异才能区分出不同的类别。而与人脸识别相比,细粒度图像的类内差异更加巨大,存在着姿态、光照、遮挡、背景干扰等诸多不确定因素。因此,图像分类模型的训练是一项极具挑战的研究任务,并且在工业界和学术界都有着广泛的研究需求与应用场景。与之相关的研究课题主要包括识别不同种类的鸟、狗、花、车、飞机等。在实际生活中,识别不同的子类别又存在着巨大的应用需求。例如,在生态保护中,有效识别不同种类的生物,是进行生态研究的重要前提。而当下图像分类模型的训练所面临的难点主要为数据集长尾分布和准确提取到具有分辨力的关键区域块特征难,这两点都会影响模型最终的泛化性能。
图像分类模型的训练现有的技术缺点1.数据集往往呈现出长尾分布模式,即少量类别具有大量数据,而大部分类别仅有少量样本。这种类别不平衡会导致分类训练的头部数据过拟合,尾部数据欠拟合。现有技术处理长尾问题显著且有效的方法是类别再平衡,可通过数据集重采样或对损失函数重新加权。这些方法虽然可以增强分类器的性能,但会造成尾部样本由于反复被学习导致过拟合,无法学习更鲁棒、易泛化的特征,损害深度特征的表征能力。2.图像分类模型的训练常常面临类间差异小(如不同品种,但相同视角),类内差异大(同一品种但姿势、角度不同)的问题,为了兼顾类内和类间差异造成的影响,需要准确定位到具有分辨力的关键区域块,面对这一难点现有技术的解决方案是引入注意力机制。但在识别某些物体的时候,注意力特征图通常只覆盖感兴趣对象小且最具区分性的区域,而不能完整覆盖目标前景对象。
发明内容
基于此,有必要针对上述问题,提供一种对图像进行分类的方法、对图像进行分类的方法、计算机设备和存储介质。
本申请第一方面提供了一种对图像进行分类的方法,包括:
获取第一训练样本;
基于图像分类模型中的第一处理支路,获得所述第一训练样本的第一分类信息;
基于所述图像分类模型中的被关注区域提取支路,获得所述第一训练样本的各图像中被关注区域的图像;
基于图像分类模型中的第二处理支路,获得第一训练样本和被关注区域的图像组成的第二训练样本的第二分类信息;
基于所述第一分类信息的第一损失函数、所述第二分类信息的第二损失函数和所述图像分类模型总的损失函数,对所述图像分类模型进行训练;
采用训练好的图像分类模型对图像进行分类。
在一些实施例中,所述第一处理支路和所述第二处理支路均包括特征提取层、全连接层和分类层,所述被关注区域处理支路连接在所述第一处理支路的特征提取层的输出端和所述第二处理支路的输入端之间;
所述基于图像分类模型中的第二处理支路,获得第一训练样本和被关注区域的图像组成的第二训练样本的第二分类信息,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司信息科学研究院,未经中国电子科技集团公司信息科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111306893.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序