[发明专利]基于特征比较的通道注意力机制的细粒度图像识别方法有效
| 申请号: | 202010877341.2 | 申请日: | 2020-08-27 |
| 公开(公告)号: | CN111985572B | 公开(公告)日: | 2022-03-25 |
| 发明(设计)人: | 张靖;贾书坤;赵鑫;白岩 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 特征 比较 通道 注意力 机制 细粒度 图像 识别 方法 | ||
本发明属于深度学习、计算机视觉及细粒度图像分类领域,具体涉及了一种基于特征比较的通道注意力机制的细粒度图像识别方法、系统及装置,旨在解决在细粒度图像标注数据较少的情况下,常规模型的识别正确率较低、细粒度分类模型结构复杂的问题。本发明包括:提取样本的特征图并经过非线性映射和平均池化后得到基本特征向量;计算并更新类别平均特征向量,与样本基本特征向量比较;对比较结果进行编码;根据样本基本特征向量学习特征通道的基础注意力权重;融合编码结果和基础注意力权重并进行映射,得到最终注意力权重引导模型训练;将训练后的模型应用到细粒度图像识别中。本发明以简单有效的方式提升了常规分类器在细粒度任务中的分类准确性。
技术领域
本发明属于深度学习、计算机视觉及细粒度图像分类领域,具体涉及了一种基于特征比较的通道注意力机制的细粒度图像识别方法、系统及装置。
背景技术
图像分类是计算机视觉中一个经典而重要的任务。近年来随着深度学习在计算机视觉中取得极大成功,图像分类任务取得了很大进展。在此基础上,越来越多的具体应用场景需要被特别研究。在一些场景下,相似物体之间的图像识别具有非常重要的应用价值。比如,在鸟类研究中,识别出鸟的种类往往是研究的第一步。如果能够准确且自动识别出具有相似外表但不同种类的鸟,则能够减少学者在鸟类识别上的精力投入,进而极大地方便后续研究。类似的细粒度图像识别还包括车辆识别、飞行器识别、花的识别和狗的识别等。
细粒度图像识别对象的特点决定了该任务具有很大的挑战。由于其识别对象原则上属于同一大类下的不同子类,因此它们之间的差别非常细微,即具有较小的类间差;又由于物体形态本身的多样性,如鸟类的飞行、站立、划水等,以及拍摄场景的多样性,如拍摄天气、光照、角度、焦距等,即便属于同一子类的样本之间也具有很大的差别,即具有较大的类内差。较大的类内差和较小的类间差构成细粒度图像识别的基本挑战。在此基础上,由于细粒度图像的研究范围通常为一个大类下的许多子类,其标注往往需要借助专业人员的专业知识,这无形中增加了图像数据的标注成本,也导致细粒度图像分类任务中每个类别的图片数量都非常有限。因此,如何充分利用有限的标注信息,使模型高效地学习到不同子类的根本特征,是我们克服该领域挑战的一个重要思路。与此同时,常规分类模型在细粒度识别上正确率较低,而很多细粒度分类方法或模型普遍而言较为复杂,导致其计算量大、需要大量调参、可解释性较差,增加了它们在实际应用中的约束,继而增加了落地难度。
总的来说,在数据层面,细粒度图像样本具有较大的类内差和较小的类间差,这一特点使得这个任务需要大量的标注样本。然而在较为高昂的标注成本下通常只能获得较少的标注样本,这就对细粒度图像分类任务提出了巨大的挑战。在模型方法层面,常规分类模型的识别正确率较低,而已有的细粒度分类方案普遍较为复杂,增加了它们的实施难度、约束了它们的应用范围。
发明内容
为了解决现有技术中的上述问题,即在细粒度图像标注数据较少的情况下,常规模型的识别正确率较低、细粒度分类模型结构复杂的问题,本发明提供了一种基于特征比较的通道注意力机制的细粒度图像识别方法,该细粒度图像识别方法包括:
步骤S10,通过训练好的特征提取网络提取待识别细粒度图像的特征图;所述特征提取网络基于深度卷积神经网络构建;
步骤S20,对所述特征图进行非线性映射,并对每个特征通道的特征进行平均池化,获得基本特征向量xi;其中,i=1,2,…,d为特征通道的标记,d为特征向量的维度;
步骤S30,将所述基本特征向量xi输入训练好的分类器,获取待识别细粒度图像的分类结果。
在一些优选的实施例中,所述特征提取网络和所述分类器,其训练中引入基于特征比较的通道注意力机制(FCCA,Feature Comparison based Channel Attention),其训练方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010877341.2/2.html,转载请声明来源钻瓜专利网。





