[发明专利]基于稀疏编码预训练的卷积神经网络图像分类方法在审

专利信息
申请号: 201811157807.0 申请日: 2018-09-30
公开(公告)号: CN109344898A 公开(公告)日: 2019-02-15
发明(设计)人: 刘芳;吴志威;路丽霞;王鑫;王洪娟;杨安喆 申请(专利权)人: 北京工业大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 沈波
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像分类 训练样本 卷积神经网络 算法学习 稀疏编码 初始化 卷积核 灰度 图像 底层视觉特征 低频子带 分类效果 局部特征 随机选择 统计特性 网络训练 下采样 原图像 准确率 两层 排序 场景 分解
【权利要求书】:

1.基于稀疏编码预训练的卷积神经网络图像分类方法,其特征在于:具体包括以下步骤:

S1:首先对图像数据集中的训练样本进行非下采样Contourlet变换,对训练样本中的原图像进行多尺度分解,并选取前两层分解图像来扩充图像数据集;

S2:将图像数据集中的图像裁剪成与卷积核尺寸相同的图像块patches,卷积核尺寸为patchDim{1,3,5},利用稀疏编码算法学习局部特征,得到图像的超完备基向量;

S3:计算S2中基向量灰度平均梯度值,并对特征向量按照灰度平均梯度从大到小进行排序;

S4:选择灰度平均梯度大的特征向量对卷积神经网络的卷积核进行初始化,然后将样本图像输入到CNN网络中进行训练,逐层对图像样本特征学习并得到全局特征响应的待分类图像特征集;

S5:将得到的待分类图像特征集输入到支持向量机,进行图像分类并得到分类准确率。

2.根据权利要求1所述的基于稀疏编码预训练的卷积神经网络图像分类方法,其特征在于:S1:首先对训练样本进行非下采样Contourlet变换,对原图像进行多尺度分解,并选取前两层分解图像来扩充图像数据集;

非下采样Contourlet变换是由非下采样塔形分解和非下采样方向滤波器分解两部分组成;首先通过非下采样金字塔分解,获得与拉普拉斯金字塔分解类似并且具有平移不变性的滤波器结构,是一个多尺度性的变化过程,通过这组滤波器,图像被分解为一个低频子带和一个高频子带,要实现多级结构,此后每一级对低频子带迭代滤波即可;其次是非下采样方向滤波器组再进行方向上的分解,是将非下采样金字塔产生的高频带通信号分解到多个方向子带上,得到的变换具有多方向性;

S2:将图像数据集中的图像裁剪成与卷积核尺寸相同的图像块patches,其中卷积核尺寸为patchDim{1,3,5},利用稀疏编码算法学习局部特征,得到图像的超完备基向量;稀疏编码算法主要分为以下两个步骤:

S2.1:训练阶段;给定样本图像数据集[x1,x2,....,xn],从这些样本图像中学习的到一组基向量[φ12,....,φk];训练过程就是一个重复迭代的过程,为得到超完备基向量,需要使如下公式所示的目标函数最小,方法是通过更替的更改a和φ的值使得目标函数最小;

其中,k是基向量的个数,n是图像样本的个数,且k>n,x为样本图像数据,φ表示的是从样本中学习到的基向量,a为稀疏系数,常量λ是一个变换量,由常量λ来控制这两项式子的相对重要性;

即迭代过程分为以下两步骤:

步骤1)先固定φk,然后不断调整ak,使得目标函数最小;

步骤2)然后固定ak,再不断调整φk,使得目标函数最小;

通过不断迭代即重复步骤1)和步骤2),直到函数收敛,就得到一组表示样本图像的基向量;

S2.2:编码阶段;输入一个新的图像,通过上面的训练阶段得到基向量,然后带入目标函数中,求解目标函数中的稀疏向量,这个稀疏向量就是输入图像的一个稀疏表达;

假设CNN的输入训练图像数据集含有N幅大小为m×s的训练图像,Ii表示为输入训练图像数据集中第i副图像,CNN卷积核是大小为k1×k2的二维矩阵,二维矩阵中的数据是对感受野中数据处理的系数,一个卷积核的滤波可以用来提取特定的特征;训练图像Ii被分成k1×k2大小的图像块,这些图像块表示为其中,xi,z表示图像Ii中第z个图像块;那么,图像Ii的图像块数据为:

Xi=[xi,1,xi,2,...,xi,ms]

同理,训练图像的图像块数据为:

利用上述公式求出超完备基向量,那么,SC算法学习到特征向量作为CNN初始化的卷积核组Wln表示为:

其中,表示将向量映射到φl表示图像块X的l个超完备基向量;

S3:计算S2中基向量灰度平均梯度值,并对特征向量按照灰度平均梯度从大到小排序;灰度平均梯度不仅能够用来评价图像的清晰度,还能反映出图像中微小细节反差的变化和纹理特征信息;

如果将SC非监督学习得到的超完备基向量φ中每个基向量φl的p×p数据看作一幅图像,用梯度信息来衡量其特征学习的效果,因为灰度平均梯度值越大,纹理特征越好,表示图像越清晰;反之就越模糊;通过灰度平均梯度值对超完备基向量进行从大到小排序,按照特征边缘性强弱排序,然后再根据实际问题中卷积核大小和数量对基向量进行选择;基向量的灰度平均梯度为:

其中,GMG为图像的灰度平均梯度值,φl(i,j)表示图像矩阵中第i行、第j列的像素灰度值,p表示图像矩阵的行数;

从SC非监督学习的基向量的灰度平均梯度中选择最大值作为这些基向量从大到小排序显示的指标,即将学习的字典中每个基向量按照其灰度平均梯度从大到小的顺序排列,排序指标为:

mGMG(φl)=max GMG(φl)

S4:选择灰度平均梯度较大的特征向量对卷积神经网络的卷积核进行初始化,然后将样本图像输入到CNN网络中进行训练,逐层对图像样本特征学习并得到全局特征响应。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811157807.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top