[发明专利]基于稀疏编码预训练的卷积神经网络图像分类方法在审

申请号：	201811157807.0	申请日：	2018-09-30
公开（公告）号：	CN109344898A	公开（公告）日：	2019-02-15
发明（设计）人：	刘芳;吴志威;路丽霞;王鑫;王洪娟;杨安喆	申请（专利权）人：	北京工业大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	沈波
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	图像分类训练样本卷积神经网络算法学习稀疏编码初始化卷积核灰度图像底层视觉特征低频子带分类效果局部特征随机选择统计特性网络训练下采样原图像准确率两层排序场景分解
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于稀疏编码预训练的卷积神经网络图像分类方法，其特征在于：具体包括以下步骤：

S1：首先对图像数据集中的训练样本进行非下采样Contourlet变换，对训练样本中的原图像进行多尺度分解，并选取前两层分解图像来扩充图像数据集；

S2：将图像数据集中的图像裁剪成与卷积核尺寸相同的图像块patches，卷积核尺寸为patchDim{1,3,5}，利用稀疏编码算法学习局部特征，得到图像的超完备基向量；

S3：计算S2中基向量灰度平均梯度值，并对特征向量按照灰度平均梯度从大到小进行排序；

S4：选择灰度平均梯度大的特征向量对卷积神经网络的卷积核进行初始化，然后将样本图像输入到CNN网络中进行训练，逐层对图像样本特征学习并得到全局特征响应的待分类图像特征集；

S5：将得到的待分类图像特征集输入到支持向量机，进行图像分类并得到分类准确率。

2.根据权利要求1所述的基于稀疏编码预训练的卷积神经网络图像分类方法，其特征在于：S1：首先对训练样本进行非下采样Contourlet变换，对原图像进行多尺度分解，并选取前两层分解图像来扩充图像数据集；

非下采样Contourlet变换是由非下采样塔形分解和非下采样方向滤波器分解两部分组成；首先通过非下采样金字塔分解，获得与拉普拉斯金字塔分解类似并且具有平移不变性的滤波器结构，是一个多尺度性的变化过程，通过这组滤波器，图像被分解为一个低频子带和一个高频子带，要实现多级结构，此后每一级对低频子带迭代滤波即可；其次是非下采样方向滤波器组再进行方向上的分解，是将非下采样金字塔产生的高频带通信号分解到多个方向子带上，得到的变换具有多方向性；

S2：将图像数据集中的图像裁剪成与卷积核尺寸相同的图像块patches，其中卷积核尺寸为patchDim{1,3,5}，利用稀疏编码算法学习局部特征，得到图像的超完备基向量；稀疏编码算法主要分为以下两个步骤：

S2.1：训练阶段；给定样本图像数据集[x₁,x₂,....,x_n]，从这些样本图像中学习的到一组基向量[φ₁,φ₂,....,φ_k]；训练过程就是一个重复迭代的过程，为得到超完备基向量，需要使如下公式所示的目标函数最小，方法是通过更替的更改a和φ的值使得目标函数最小；

其中，k是基向量的个数，n是图像样本的个数，且k＞n，x为样本图像数据，φ表示的是从样本中学习到的基向量，a为稀疏系数，常量λ是一个变换量，由常量λ来控制这两项式子的相对重要性；

即迭代过程分为以下两步骤：

步骤1)先固定φ_k，然后不断调整a_k，使得目标函数最小；

步骤2)然后固定a_k，再不断调整φ_k，使得目标函数最小；

通过不断迭代即重复步骤1)和步骤2)，直到函数收敛，就得到一组表示样本图像的基向量；

S2.2：编码阶段；输入一个新的图像，通过上面的训练阶段得到基向量，然后带入目标函数中，求解目标函数中的稀疏向量，这个稀疏向量就是输入图像的一个稀疏表达；

假设CNN的输入训练图像数据集含有N幅大小为m×s的训练图像，I_i表示为输入训练图像数据集中第i副图像，CNN卷积核是大小为k₁×k₂的二维矩阵，二维矩阵中的数据是对感受野中数据处理的系数，一个卷积核的滤波可以用来提取特定的特征；训练图像I_i被分成k₁×k₂大小的图像块，这些图像块表示为其中，x_i,z表示图像I_i中第z个图像块；那么，图像I_i的图像块数据为：

X_i＝[x_i,1,x_i,2,...,x_i,ms]

同理，训练图像的图像块数据为：

利用上述公式求出超完备基向量，那么，SC算法学习到特征向量作为CNN初始化的卷积核组W_lⁿ表示为：

其中，表示将向量映射到φ_l表示图像块X的l个超完备基向量；

S3：计算S2中基向量灰度平均梯度值，并对特征向量按照灰度平均梯度从大到小排序；灰度平均梯度不仅能够用来评价图像的清晰度，还能反映出图像中微小细节反差的变化和纹理特征信息；

如果将SC非监督学习得到的超完备基向量φ中每个基向量φ_l的p×p数据看作一幅图像，用梯度信息来衡量其特征学习的效果，因为灰度平均梯度值越大，纹理特征越好，表示图像越清晰；反之就越模糊；通过灰度平均梯度值对超完备基向量进行从大到小排序，按照特征边缘性强弱排序，然后再根据实际问题中卷积核大小和数量对基向量进行选择；基向量的灰度平均梯度为：

其中，GMG为图像的灰度平均梯度值，φ_l(i，j)表示图像矩阵中第i行、第j列的像素灰度值，p表示图像矩阵的行数；

从SC非监督学习的基向量的灰度平均梯度中选择最大值作为这些基向量从大到小排序显示的指标，即将学习的字典中每个基向量按照其灰度平均梯度从大到小的顺序排列，排序指标为：

mGMG(φ_l)＝max GMG(φ_l)

S4：选择灰度平均梯度较大的特征向量对卷积神经网络的卷积核进行初始化，然后将样本图像输入到CNN网络中进行训练，逐层对图像样本特征学习并得到全局特征响应。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811157807.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于图片蒸馏的通用物体检测系统及其实现方法
下一篇：多目标检测方法、装置和电子设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于稀疏编码预训练的卷积神经网络图像分类方法在审

专利文献下载