[发明专利]基于稀疏编码预训练的卷积神经网络图像分类方法在审
申请号: | 201811157807.0 | 申请日: | 2018-09-30 |
公开(公告)号: | CN109344898A | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 刘芳;吴志威;路丽霞;王鑫;王洪娟;杨安喆 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像分类 训练样本 卷积神经网络 算法学习 稀疏编码 初始化 卷积核 灰度 图像 底层视觉特征 低频子带 分类效果 局部特征 随机选择 统计特性 网络训练 下采样 原图像 准确率 两层 排序 场景 分解 | ||
本发明公开了基于稀疏编码预训练的卷积神经网络图像分类方法,首先对训练样本进行非下采样Contourlet变换,选取前两层分解图像来扩充训练样本,然后随机选择图像采用SC算法学习其局部特征,并将特征按照灰度平均梯度从大到小进行排序,最后选择灰度平均梯度较大的特征值对CNN卷积核初始化。采用SC算法学习到原图像具有统计特性的特征对CNN卷积核初始化,获得比传统底层视觉特征更好的分类效果,有效避免了网络训练陷入局部最优;综合高、低频子带对不同场景的识别优势,在训练样本有限的情况下,有效的提高了图像分类准确率,具有良好的泛化能力和适用范围。
技术领域
本发明涉及一种图像分类方法,属于模式识别与机器视觉、图像处理技术领域,特别涉及一种基于稀疏编码(SparseCoding,SC)预训练的卷积神经网络图像分类方法。
背景技术
图像分类是图像分类识别的一个过程,图像识别是对图像建立识别模型,然后分析并且提取特征,最后采用分类器根据图像特征对图像进行归类识别的一种技术,它把具有相同属性的图像归为同一类。对于图像分类来说,最重要的是图像预处理和特征提取两个过程。特征学习过程是最重要的部分,图像的分类准确性取决于图像的特征表达。
传统图像分类方法一般是对图像底层特征进行研究,采用纹理、颜色和形状等低级特征表示图像信息,然后根据提取到的特征进行图像分类。由于复杂的图像包含的信息量较多,单一的底层特征不能完全描述,导致分类率很低,因此研究人员将多种视觉特征结合来进行图像分类,取得了比单一特征更好地分类效果。传统分类方法是基于底层特征和中层语义的图像分类,图像特征是根据先验知识人工设计的,特征提取效果的好坏很大程度上依赖研究人员的先验知识,且对于不同类型的图像(如地貌、人脸等),同一种底层特征不一定全部适用,需要根据不同的图像类型合理选择或尝试提取不同的底层特征,此外,有些图像的先验知识很难获取,因此图像的底层特征和语义特征识别力低,进而影响图像的分类准确率。
随着深度学习技术的不断发展,利用深度学习的图像分类方法性能远超过传统方法。深度学习(DeepLearning,DL),从狭义上理解,就是一种具有一定的结构和训练方法且含有多个隐含层的神经网络;从广义上理解,可以把具有任何层次结构的机器学习方法称为深度学习。在深度学习过程中,从输入图像,经过无监督的逐层训练和学习图像特征,通过有监督的训练更新整个网络参数,最小化损失函数,在输出层实现正确的分类。卷积神经网络(CNN)将权值共享、空间下采样和局部连接结合起来,不仅降低了网络的复杂性,而且保持了对图像的边缘模式信息和空间位置信息强大的检测能力。卷积神经网络中层次之间的紧密联系和空间信息使得其特别适用于图像的处理和理解,并且能够自动的从图像中抽取出丰富的相关特性。
现有的方法存在的不足:一方面:当CNN层数较多时需要大量样本训练网络,如果样本数量过少网络就会过拟合或者网络训练不充分造成分类率低;另一方面:CNN的卷积核在训练时是随机初始化的,在处理图像内容比较复杂且样本数量少的分类问题时容易陷入局部最优。
发明内容
本发明针对CNN在样本较少时容易陷入局部最优导致图像分类率低的问题,采用的技术方案为基于稀疏编码预训练的卷积神经网络图像分类方法,具体包括以下步骤:
S1:首先对图像数据集中的训练样本进行非下采样Contourlet变换,对训练样本中的原图像进行多尺度分解,并选取前两层分解图像来扩充图像数据集。
S2:将图像数据集中的图像裁剪成与卷积核尺寸相同的图像块patches,卷积核尺寸为patchDim{1,3,5},利用稀疏编码算法学习局部特征,得到图像的超完备基向量。
S3:计算S2中基向量灰度平均梯度值,并对特征向量按照灰度平均梯度从大到小进行排序。
S4:选择灰度平均梯度大的特征向量对卷积神经网络的卷积核进行初始化,然后将样本图像输入到CNN网络中进行训练,逐层对图像样本特征学习并得到全局特征响应的待分类图像特征集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811157807.0/2.html,转载请声明来源钻瓜专利网。