[发明专利]基于子空间分解进行深度特征估计的图像分类识别方法有效
申请号: | 201910074903.7 | 申请日: | 2019-01-25 |
公开(公告)号: | CN109902720B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 岑峰;赵啸宇 | 申请(专利权)人: | 同济大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 蔡彭君 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 空间 分解 进行 深度 特征 估计 图像 分类 识别 方法 | ||
本发明涉及一种基于子空间分解进行深度特征估计的图像分类识别方法,包括:步骤S1:获取训练集的无遮挡图像和额外图像对;步骤S2:对于输入的每张图像提取深度特征向量;步骤S3:计算额外图像对中遮挡图像和无遮挡图像的深度特征向量之差得到误差向量;步骤S4:将计算的所有无遮挡图像的深度特征向量组成第一子空间,误差向量组成第二子空间,并基于第一子空间和第二子空间构成级联字典;步骤S5:基于级联字典计算系数矩阵;步骤S6:基于第一子空间的所有列向量训练分类器;步骤S7:基于级联字典、系数矩阵和分类器对待识别图像进行分类识别。与现有技术相比,本发明具有适用范围广等优点。
技术领域
本发明涉及一种图像分类识别方法,尤其是涉及一种基于子空间分解进行深度特征估计的图像分类识别方法。
背景技术
在现实生活中遮挡的现象时有发生。对于人类视觉系统来说,对遮挡图像进行分类并非难事。但是,在计算机视觉领域,即使对于最近在许多计算机视觉任务中取得巨大成功的深度卷积神经网络来说,仍然是一项极具挑战性的任务。最先进的卷积神经网络有数以千万计的参数,因此若想取得较好效果,即使是对于无遮挡图像的分类也通常需要大量的数据集做支撑。然而在实际应用当中,收集大量的遮挡图像数据无疑是十分困难的。一种比较流行的选择是直接在无遮挡图像的数据集或包含少量被遮挡图像的数据集上训练网络。但是遮挡对于大多数卷积神经网络生成的深度特征非常敏感。因此,对于被遮挡图像的分类问题只有十分有限的帮助。
本发明主要来源于基于云端的深度学习应用。基于卷积神经网络的特征提取由于其高计算复杂性所以需要在云端或服务器端进行,但是随着深度神经网络加速芯片的发展,正逐渐转移到终端或移动端。为了在这种情况下节省传输带宽,只有将具有较少带宽消耗且在保护私有信息方面更加安全的深度特征而不是源图像发送到云端进行进一步处理,例如分类问题。因此,如果要解决在终端实现对遮挡图像的分类,我们必须解决云端深度特征空间中的遮挡问题。因此,我们没有去除图像空间中的遮挡,而是尽量去减小遮挡在深度特征空间中对于分类的负面影响。
然而,从遮挡图像的深度特征中恢复无遮挡图像的深度特征是一项具有挑战性的工作。尽管之前已经有很多研究工作来研究深层特征,但是遮挡与深度特征向量的变化之间的对应关系还远未明确。卷积神经网络实际上是从图像空间到深度特征空间的一种非线性和整体变换。图像空间中的任何小的局部变化都可能导致深度特征空间中的大的整体变化。
在计算机视觉领域中用于遮挡图像分类的最受欢迎的方法是稀疏表示分类法,由Wright等提出。在他们的工作中,被遮挡的面部图像首先通过l1范数最小化编码为扩展字典的稀疏线性组合。然后,通过搜索哪种类型的训练样本可以通过稀疏编码的内容导致最小的重建错误来进行分类。在Wright的工作之后,许多研究人员致力于在各种条件下提高稀疏表示分类的准确性。但是这些工作的缺点在于他们只致力于图像空间和图像空间的线性转换,并且只在面部识别上取得了较好的成果,然而这仅仅是在图像分类中一个很小的子领域上,并且所使用的数据集也很小。因此还需要有一种方法能够在更大的领域应用。
随着深度学习的快速发展,很多工作都致力于使用生成模型来生成部分遮挡或者部分缺失的图像。在有关文献中,深度扩张卷积网络被用于基于生成对抗网络(GAN)的框架产生图像的缺失部分并结合了与重建误差有关的损失函数。在有关文献中,变分自动编码器和GAN被组合以生成图像的缺失部分。然而,这些方法需要预先知道缺失部分的形状和位置。在有关文献中,使用基于严格的Boltzman机器的模型来学习遮挡物的结构。在有关文献中,利用基于自动编码器的去噪模型将损坏的图像映射到无损图像。在有关文献中,一个稳定的LSTM自动编码器模型与GAN相结合产生相关的部分图像,用于人脸识别。但是这些工作也有几个缺点,在于以下几个方面。首先,这些工作仅在面部识别的结果得到了提升,但是对于一般的遮挡图像没有表现出好的结果。其次,这些工作不适合未来的基于云端的应用程序,因为它们试图对于图像进行恢复。第三,这些工作通常需要大量部分遮挡或丢失的图像以及耗费大量时间去训练生成模型。最后,对于新的遮挡模式,这些工作需要对生成模型进行重新训练或微调,通常是复杂且耗时的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910074903.7/2.html,转载请声明来源钻瓜专利网。