[发明专利]一种基于破坏重建学习与GoogLeNet的细粒度图像分类方法有效
申请号: | 202010894444.X | 申请日: | 2020-08-31 |
公开(公告)号: | CN111950525B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 黄捷;高静;王武;柴琴琴;蔡逢煌;林琼斌;张岳鑫;张祯毅 | 申请(专利权)人: | 福州大学 |
主分类号: | G06V40/18 | 分类号: | G06V40/18;G06V10/774;G06V10/82;G06N3/08;G06N3/04 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 钱莉;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 破坏 重建 学习 googlenet 细粒度 图像 分类 方法 | ||
1.一种基于破坏重建学习与GoogLeNet的细粒度图像分类方法,其特征在于,包括以下步骤:
构建训练集,并对其中的图像进行预处理;
对训练集中的每幅原始图像,将其划分为n′*n′个局部区域,再通过RCM处理得到对应原始图像的重组图像;
分别构建由分类网络、判别网络以及区域对齐网络构成的重建破坏学习网络,并分别定义与分类网络、判别网络以及区域对齐网络对应的分类损失、对抗性损失以及区域对齐损失;
以三个损失之和最小化为目标训练重建破坏学习网络;
利用训练好的重建破坏学习网络中的分类网络对输入的图像进行分类;
所述分类网络对应的分类损失为:
式中,l∈{0,1},当l=1时表示分类网络预测的类别与图像的实际类别一致,当l=0时表示分类网络预测的类别与图像的实际类别不一致;C(I)表示原始图像I经过分类网络的结果,C(φ(I))表示重组图像φ(I)经过分类网络的结果,Γ表示训练集;
所述判别网络对应的对抗性损失为:
其中,
式中,d∈{0,1},当d=1时表示图像没有被重组过,当d=0时表示图像被重组过;θadv表示判别网络中的可学习参数,表示将图像p输入到分类网络后第m个卷积层的输出特征向量的提取特征,是分类网络的从第1层到第m层的可学习参数;
所述区域对齐网络对应的区域对齐损失为:
其中,
式中,N表示区域的边界坐标值,[i,j]表示区域的位置,Mδ(i,j)(p)表示将图像p输入区域对齐网络后得到的位置[i,j]的预测位置坐标,h(*)表示区域对齐网络,θloc表示区域对齐网络的可学习参数,表示将图像p输入到分类网络后第n个卷积层的输出特征向量的提取特征,是分类网络的从第1层到第n层的可学习参数。
2.根据权利要求1所述的一种基于破坏重建学习与GoogLeNet的细粒度图像分类方法,其特征在于,对其中的图像进行预处理具体为:标准化训练集中的数据,并对其进行数据增扩操作,并对训练集中的图像进行标注,标注其是否属于重组图像以及图像的类别。
3.根据权利要求1所述的一种基于破坏重建学习与GoogLeNet的细粒度图像分类方法,其特征在于,所述分类网络采用GoogLeNet的inception v4的结构。
4.根据权利要求1所述的一种基于破坏重建学习与GoogLeNet的细粒度图像分类方法,其特征在于,所述以三个损失之和最小化为目标表示为:
L=αLcls+βLadv+γLloc;
式中,α、β、γ分别为分类损失Lcls、对抗性损失Ladv、区域对齐损失Lloc对应的权重系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010894444.X/1.html,转载请声明来源钻瓜专利网。