[发明专利]基于非下采样Contourlet变换和卷积神经网络的图像分类方法有效
申请号: | 201711404570.7 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108052981B | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 方玲玲;王相海 | 申请(专利权)人: | 辽宁师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 大连非凡专利事务所 21220 | 代理人: | 闪红霞 |
地址: | 116000 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 采样 contourlet 变换 卷积 神经网络 图像 分类 方法 | ||
本发明公开了一种基于非下采样Contourlet变换的卷积神经网络图像分类方法。首先利用非下采样Contourlet变换进行RGB三通道图像的特征统计,捕捉到图像在变换域上较好的不变性和区分性描述;然后在此基础上构建卷积神经网络的深度学习方法,从而达到RGB图像分类的目的。本发明分别通过非下采样Contourlet变换和卷积神经网络进行已知和未知特征的学习,不仅避免了大量参数的学习,还可以简化后续的网络模型。
技术领域
本发明涉及图像分类领域,具体地说是一种基于非下采样Contourlet变换和卷积神经网络的图像分类方法。
背景技术
图像分类是根据图像目标或者场景,在图像反映出来的不同特征对图像进行识别和分类,其目的是使得计算机能识别已知一副图像的所属分类,从而进一步对图像进行理解。基于卷积神经网络的图像分类技术由于其较高的识别效果,受到研究者的高度重视。
卷积神经网络的主要目标是学习分级的图像特征,所谓分级,指的是特征从底层的像素输入到高层的复杂函数映射。通常情况下,为了得到充分的分级特征,需要通过增加隐层数和神经元个数来增加卷积神经网络模型的学习能力,这就导致神经网络要学习的参数非常多,较多的参数会导致整个网络的训练时间变得很长,严重影响参数的调节。另外,过多的训练样本亦会导致模型的过拟合现象。因此,在进行网络学习前,如何提取图像特征是制约和提高分类系统性能的关键点。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种基于非下采样Contourlet变换和卷积神经网络的图像分类方法。
本发明的技术解决方案是:一种基于非下采样Contourlet变换和卷积神经网络的图像分类方法,其特征在于按照如下步骤进行:
步骤1:将自然图像分解为RGB三种不同的通道,分别对每个通道中的图像进行非下采样Contourlet变换:
NSCT(ψR,ψG,ψB;p,d)=Φ∪ΨR(ψR;p,d)∪ΨG(ψG;p,d)∪ΨB(ψB;p,d) (1)
其中,Φ表示近似的RGB通道图像;{ΨR,ΨG,ΨB}为每个通道的Contourlet系数矩阵;{ψR,ψG,ψB}为对应的变换矩阵;p和d分别为Contourlet变换的分解层数和方向子带的个数;
步骤2:利用类似于卷积神经网络中均值-最大池化方法计算基于非下采样Contourlet变换中每个系数的特征描述算子,其中均值池化过程如下:
其中,Δ∈{R,G,B}表示某个RGB通道;i=1,...,N为每个RGB通道中待池化区域的索引项;和分别表示某个RGB通道中第i个待池化区域的系数矩阵块和变换矩阵块;∑用来计算对应矩阵块内的系数值之和;m为池化区域的大小;采用最大池化方法对上述系数进行处理:
得到最终的特征描述算子,形成卷积神经网络中待输入的N维映射图
步骤3:利用卷积神经网络对上述特征描述算子进行学习,其中每一层的具体描述如下:
步骤3.1:卷积层:采用大小为3×3、步长为[4,4]、特征图为227×227×3的卷积核,对应的输出结果为:
其中,f为多维的滤波器组,对应的核权值和偏差分别为k和b;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁师范大学,未经辽宁师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711404570.7/2.html,转载请声明来源钻瓜专利网。