[发明专利]一种基于破坏重建学习与GoogLeNet的细粒度图像分类方法有效
申请号: | 202010894444.X | 申请日: | 2020-08-31 |
公开(公告)号: | CN111950525B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 黄捷;高静;王武;柴琴琴;蔡逢煌;林琼斌;张岳鑫;张祯毅 | 申请(专利权)人: | 福州大学 |
主分类号: | G06V40/18 | 分类号: | G06V40/18;G06V10/774;G06V10/82;G06N3/08;G06N3/04 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 钱莉;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 破坏 重建 学习 googlenet 细粒度 图像 分类 方法 | ||
本发明涉及一种基于破坏重建学习与GoogLeNet的Inception v4网络结构的细粒度图像分类方法,包括步骤:构建训练集,并对其中的图像进行预处理;对训练集中的每幅原始图像,将其划分为n*n个局部区域,再通过RCM处理得到对应原始图像的重组图像;分别构建由分类网络、判别网络以及区域对齐网络构成的重建破坏学习网络,并分别定义与分类网络、判别网络以及区域对齐网络对应的分类损失、对抗性损失以及区域对齐损失;以三个损失之和最小化为目标训练重建破坏学习网络;利用训练好的重建破坏学习网络中的分类网络对输入的图像进行分类。本发明在对细粒度图像的分类上取得了显著的效果。
技术领域
本发明涉及图像处理技术领域,特别是一种基于破坏重建学习与GoogLeNet的细粒度图像分类方法。
背景技术
相较于人脸识别等分类任务,视网膜图像的分类难度更大。主要的原因在于视网膜图像属于细粒度图像,即类别精度更加细致,类间差异更加细微。所以视网膜图像往往只能借助于微小的子区域的差异才能区分出其所属的类别。视网膜图像存在着遮挡、背景干扰等诸多不确定因素。因此,视网膜图像分类是一项具有挑战的研究任务。前人提取的模型有以下不足:第一,要正确的先验知识和大量的人力来设计模型视网膜与提取特征。第二,需要提取图像特征。第三,需要分析图像各种灰度信息、形状信息。第三,提取的特征不准确和图像存在噪声时,分层效果也并不鲁棒。
虽然传统机器学习算法在某些特定领域已给出不错的解决方案,但仍存在执行任务单一,处理过程复杂且模型能力有限等缺点。
发明内容
有鉴于此,本发明的目的是提出一种基于破坏重建学习与GoogLeNet的细粒度图像分类方法,在对细粒度图像的分类上取得了显著的效果。
本发明采用以下方案实现:一种基于破坏重建学习与GoogLeNet的细粒度图像分类方法,具体包括以下步骤:
构建训练集,并对其中的图像进行预处理;
对训练集中的每幅原始图像,将其划分为n*n个局部区域,再通过RCM处理得到对应原始图像的重组图像;
分别构建由分类网络、判别网络以及区域对齐网络构成的重建破坏学习网络,并分别定义与分类网络、判别网络以及区域对齐网络对应的分类损失、对抗性损失以及区域对齐损失;
以三个损失之和最小化为目标训练重建破坏学习网络;
利用训练好的重建破坏学习网络中的分类网络对输入的图像进行分类。
较佳的,上述图像为细粒度图像,例如视网膜图像。
进一步地,对其中的图像进行预处理具体为:标准化训练集中的数据,并对其进行数据增扩操作,并对训练集中的图像进行标注,标注其是否属于重组图像以及图像的类别。
进一步地,所述分类网络采用GoogLeNet的inception v4的结构。
进一步地,所述分类网络对应的分类损失为:
式中,l∈{0,1},当l=1时表示分类网络预测的类别与图像的实际类别一致,当l=0时表示分类网络预测的类别与图像的实际类别不一致;C(I)表示原始图像I经过分类网络的结果,C(φ(I))表示重组图像φ(I)经过分类网络的结果,Γ表示训练集。
进一步地,所述判别网络对应的对抗性损失为:
其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010894444.X/2.html,转载请声明来源钻瓜专利网。