[发明专利]一种基于通道剪裁和定位分类子网络的细粒度图像分类方法及系统在审
申请号: | 202011000935.1 | 申请日: | 2020-09-22 |
公开(公告)号: | CN112149729A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 柯逍;黄艳艳;林心茹 | 申请(专利权)人: | 福州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/32;G06N3/04;G06N3/08 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 钱莉;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通道 剪裁 定位 分类 网络 细粒度 图像 方法 系统 | ||
1.一种基于通道剪裁和定位分类子网络的细粒度图像分类方法,其特征在于,包括以下步骤:
获取细粒度图像分类数据集,构建定位分类子网络;
对构建的定位分类子网络进行联合训练,得到训练好的模型;
对训练好的模型进行剪裁,得到新的更小的模型后,再进行微调以恢复精度,最后得到最终模型;
采用最终模型对细粒度图像进行分类。
2.根据权利要求1所述的一种基于通道剪裁和定位分类子网络的细粒度图像分类方法,其特征在于,所述构建定位分类子网络具体为:
所述构建的定位分类子网络包括三个协作的子网络,分别为定位子网络、教师子网络和分类子网络;各个子网络中的特征提取器共享权重;
所述定位子网络用于输出输入图片的一系列关键区域和区域所包含的信息量;
所述教师子网络将定位子网络输出的每个区域映射为一个数值并将其作为该区域的置信度;
所述分类子网络将定位子网络的输出调整为预定义大小,再经过特征提取器提取特征,然后将提取的特征与输入图片的特征连接起来,最后通过完全连接层得出分类结果。
3.根据权利要求2所述的一种基于通道剪裁和定位分类子网络的细粒度图像分类方法,其特征在于,所述对构建的定位分类子网络进行联合训练,得到训练好的模型具体为:
构建定位分类子网络的总体损失函数Ltotal如下:
Ltotal=LI+λ·LS+μ·LC;
式中,LI为定位子网络的损失函数,LS为分类子网络的损失函数,LC为教师子网络的损失函数,λ与μ为超参数;
采用随机梯度下降的方法来优化总体损失函数Ltotal,训练模型直至收敛,得到训练好的模型。
4.根据权利要求3所述的一种基于通道剪裁和定位分类子网络的细粒度图像分类方法,其特征在于,所述定位子网络的损失函数LI的构造具体为:首先将定位子网络预测的并且排好序的前M个最有信息量的区域R={R1,R2,…,RM}经过信息函数I(·)的映射后对应的信息量表示为I={I1,I2,…,IM},以及经过教师子网络中置信函数C(·)的映射后对应的置信度表示为C={C1,C2,…,CM},则定位子网络的损失函数LI如下
式中,当集合C中的元素Cs大于Ct时,函数f使得Is也大于It,定位子网络的损失函数会惩罚集合I和C之间的逆序对,也即鼓励集合I和C中的元素所对应的区域标号有相同的顺序。
5.根据权利要求3所述的一种基于通道剪裁和定位分类子网络的细粒度图像分类方法,其特征在于,所述分类子网络LS的损失函数的构造具体为:当定位子网络在教师子网络的指导下定位出最具有信息量的K个区域{R1,R2,…,RK}后,分类子网络首先将这K个区域的特征和原始输入图片的特征B进行结合,令函数S(·)表示分类子网络的映射,则P=S(B,R1,R2,…,RK)是分类子网络给出的的细粒度分类结果;最后对分类结果应用交叉熵损失作为分类子网络的损失函数:
LS=-logS(B,R1,R2,…,RK)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011000935.1/1.html,转载请声明来源钻瓜专利网。