[发明专利]一种基于通道剪裁和定位分类子网络的细粒度图像分类方法及系统在审
申请号: | 202011000935.1 | 申请日: | 2020-09-22 |
公开(公告)号: | CN112149729A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 柯逍;黄艳艳;林心茹 | 申请(专利权)人: | 福州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/32;G06N3/04;G06N3/08 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 钱莉;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通道 剪裁 定位 分类 网络 细粒度 图像 方法 系统 | ||
本发明涉及一种基于通道剪裁和定位分类子网络的细粒度图像分类方法及系统,包括以下步骤:获取细粒度图像分类数据集,构建定位分类子网络;对构建的定位分类子网络进行联合训练,得到训练好的模型;对训练好的模型进行剪裁,得到新的更小的模型后,再进行微调以恢复精度,最后得到最终模型;采用最终模型对细粒度图像进行分类。本发明能够有效地对图像进行细粒度的分类。
技术领域
本发明涉及计算机视觉技术领域,特别是一种基于通道剪裁和定位分类子网络的细粒度图像分类方法及系统。
背景技术
随着互联网与大数据的发展,网络上的图片与视频信息呈爆炸式增长,使得对图片和视频的处理备受关注。图像分类是计算机视觉中最基础的一个任务,已经取得了很好的水平,而细粒度图像分类的精度却差强人意。
细粒度图像分类是对粗粒度的大类别进行更加细致的子类划分。例如:给定一张鸟的图片,我们不仅想知道图片里的是一只鸟,而且还想知道鸟的品种是什么。细粒度图像的类别精度更加细致,类间差异更加细微,往往只能借助于微小的局部差异才能区分出不同的类别。细粒度图像分类无论在工业界还是学术界都有着广泛的研究需求与应用场景。与之相关的研究课题主要包括识别不同种类的鸟、狗、花、车、飞机等。
发明内容
有鉴于此,本发明的目的是提出一种基于通道剪裁和定位分类子网络的细粒度图像分类方法及系统,能够有效地对图像进行细粒度的分类。
本发明采用以下方案实现:一种基于通道剪裁和定位分类子网络的细粒度图像分类方法,具体包括以下步骤:
获取细粒度图像分类数据集,构建定位分类子网络;
对构建的定位分类子网络进行联合训练,得到训练好的模型;
对训练好的模型进行剪裁,得到新的更小的模型后,再进行微调以恢复精度,最后得到最终模型;
采用最终模型对细粒度图像进行分类。
进一步地,所述构建定位分类子网络具体为:
所述构建的定位分类子网络包括三个协作的子网络,分别为定位子网络、教师子网络和分类子网络;各个子网络中的特征提取器共享权重;
所述定位子网络用于输出输入图片的一系列关键区域和区域所包含的信息量;
所述教师子网络将定位子网络输出的每个区域映射为一个数值并将其作为该区域的置信度;
所述分类子网络将定位子网络的输出调整为预定义大小,再经过特征提取器提取特征,然后将提取的特征与输入图片的特征连接起来,最后通过完全连接层得出分类结果。
进一步地,所述对构建的定位分类子网络进行联合训练,得到训练好的模型具体为:
构建定位分类子网络的总体损失函数Ltotal如下:
Ltotal=LI+λ·LS+μ·LC;
式中,LI为定位子网络的损失函数,LS为分类子网络的损失函数,LC为教师子网络的损失函数,λ与μ为超参数;
采用随机梯度下降的方法来优化总体损失函数Ltotal,训练模型直至收敛,得到训练好的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011000935.1/2.html,转载请声明来源钻瓜专利网。