[发明专利]基于非下采样Contourlet变换和卷积神经网络的图像分类方法有效
申请号: | 201711404570.7 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108052981B | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 方玲玲;王相海 | 申请(专利权)人: | 辽宁师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 大连非凡专利事务所 21220 | 代理人: | 闪红霞 |
地址: | 116000 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 采样 contourlet 变换 卷积 神经网络 图像 分类 方法 | ||
1.一种基于非下采样Contourlet变换和卷积神经网络的图像分类方法,其特征在于按照如下步骤进行:
步骤1:将自然图像分解为RGB三种不同的通道,分别对每个通道中的图像进行非下采样Contourlet变换:
NSCT(ψR,ψG,ψB;p,d)=Φ∪ΨR(ψR;p,d)∪ΨG(ψG;p,d)∪ΨB(ψB;p,d) (1)
其中,Φ表示近似的RGB通道图像;{ΨR,ΨG,ΨB}为每个通道的Contourlet系数矩阵;{ψR,ψG,ψB}为对应的变换矩阵;p和d分别为Contourlet变换的分解层数和方向子带的个数;
步骤2:利用类似于卷积神经网络中均值-最大池化方法计算基于非下采样Contourlet变换中每个系数的特征描述算子,其中均值池化过程如下:
其中,Δ∈{R,G,B}表示某个RGB通道;i=1,...,N为每个RGB通道中待池化区域的索引项;和分别表示某个RGB通道中第i个待池化区域的系数矩阵块和变换矩阵块;∑用来计算对应矩阵块内的系数值之和;m为池化区域的大小;采用最大池化方法对上述系数进行处理:
得到最终的特征描述算子,形成卷积神经网络中待输入的N维映射图
步骤3:利用卷积神经网络对上述特征描述算子进行学习,其中每一层的具体描述如下:
步骤3.1:卷积层:采用大小为3×3、步长为[4,4]、特征图为227×227×3的卷积核,对应的输出结果为:
其中,f为多维的滤波器组,对应的核权值和偏差分别为k和b;
步骤3.2:池化层:采用均值-最大池化相混合的方法对上述卷积结果进行下采样:
步骤3.3:正则化:进一步地,采用如下修正线性单元激活函数和局部响应正则化以增加网络模型的非线性:
YLRN=[1+(α/m)Ypool]-β (8)
设置α=5×10-5、β=0.75;
步骤3.4:全连接层:将学到的特征映射到样本标记空间,将前层的结果转化为卷积核为1×1的卷积;
步骤3.5:分类层:利用softmax激活函数进行预测,将图像分为4或者5类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁师范大学,未经辽宁师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711404570.7/1.html,转载请声明来源钻瓜专利网。