[发明专利]图像多标签分类方法、系统、设备及可读存储介质有效
| 申请号: | 202010581393.5 | 申请日: | 2020-06-23 |
| 公开(公告)号: | CN111897985B | 公开(公告)日: | 2021-10-01 |
| 发明(设计)人: | 范力宏;蔺琛皓;沈超;朱炯历;王骞;李琦 | 申请(专利权)人: | 西安交通大学医学院第一附属医院 |
| 主分类号: | G06F16/55 | 分类号: | G06F16/55;G06N3/04;G06N3/08 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 李鹏威 |
| 地址: | 710061 陕西*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 标签 分类 方法 系统 设备 可读 存储 介质 | ||
本发明属于图像分类领域,公开了一种图像多标签分类方法、系统、设备及可读存储介质,所述方法包括:S1:获取待分类的多标签各自对应的原始图像,生成样本集;S2:获取用于图像多标签分类的初始深度卷积神经网络,添加门激活函数层得到深度卷积神经网络;S3:通过样本集迭代训练深度卷积神经网络,得到各标签对应的显著性图;S4:选取预设要求的标签对应的显著性图,通过显著性图从对应的原始图像中提取目标;S5:设置待生成图像,将目标区域迁移至待生成图像上得到目标图像;S6:将目标图像添加至样本集中,迭代S3至S5预设次数,通过最终的深度卷积神经网络进行输入图像的图像多标签分类。本方法有效提升图像多标签分类的精度和准确率。
技术领域
本发明属于图像分类领域,涉及一种图像多标签分类方法、系统、设备及可读存储介质。
背景技术
图像多标签分类问题一直是计算机视觉领域的热点问题,随着人工智能技术的兴起和发展,基于深度学习的图像多标签分类方法,尤其是采用深度卷积神经网络的图像多标签分类取得了重大的突破,其分类准确率远超传统机器学习的方法。但是由于基于深度卷积神经网络的模型参数量巨大,结果普遍缺乏可解释性,使得基于此方法的图像多标签分类结果不够置信,这已成为深度学习进一步发展和应用的瓶颈。与此同时,真实数据还存在长尾分布、多目标物体遮挡、尺度多变等现象,由此带来的数据不均衡、目标物体特征学习困难问题,造成了部分类别物体的分类准确率较低,无法满足真实场景中部署应用的需求。
针对以上问题,有研究者提出了图像可解释性定位的方法,用以对深度卷积神经网络的图像分类结果进行可视化解释和说明,增强图像分类结果的可信性。然而现有的工作多仅提供可解释的可视化图像显著性图或类激活图,而很少有利用这些可解释性的结果进一步提升图像多标签分类的准确率。研究论文《Learning Deep Features forDiscriminative Localization》[1]公开了一种基于深度卷积神经网络及全局平均池化(Global Average Pooling)的图像可解释分析及目标特征定位的方法。研究论文《Grad-CAM:Visual Explanations from Deep Networks via Gradient-based Localization》[2]公开了一种基于梯度定位的深度卷积网络结构可视化可解释性方法,该方法基于[1],提出引入ReLU激活函数及结合梯度反向传播原理获得更精细的可解释性可视化结果。以上方法都对基于深度卷积神经网络的图像分类的可解释做了分析及可视化呈现,但没有利用可解释性的结果对图像多标签分类的准确率做进一步的改进。
综上所述,现有的基于深度学习的图像分类中的可解释性方法,对目标物体的定位及描述不够准确,仅定位到目标物体的局部非重点区域,或将非目标物体定位为目标物体。现有的方法大多数仅给出了可解释性的可视化显著性图,而没有利用目标物体的可解释性对图像多标签分类效果做进一步的改善和提升。真实图像数据存在数据长尾分布(少见类别数据不足)、目标物体遮挡、尺度多变等特点,现有的方法多采用通用性的数据增广的方式解决数据不足的问题,而没有针对少样本数据、遮挡数据、分类效果差的类别设计专门的方法,这也一定程度上使得某些类别的图像多标签分类精度不够高。
发明内容
本发明的目的在于克服上述现有技术中图像多标签分类精度不够高、准确率低的缺点,提供一种图像多标签分类方法、系统、设备及可读存储介质。
为达到上述目的,本发明采用以下技术方案予以实现:
本发明第一方面,一种图像多标签分类方法,包括以下步骤:
S1:获取待分类的多标签各自对应的原始图像,生成样本集;
S2:获取用于图像多标签分类的初始深度卷积神经网络;在初始深度卷积神经网络内添加门激活函数层得到深度卷积神经网络;
S3:通过样本集迭代训练深度卷积神经网络,得到各标签对应的显著性图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学医学院第一附属医院,未经西安交通大学医学院第一附属医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010581393.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





