[发明专利]一种利用DCGAN提高基于CNN图像识别性能的方法有效
申请号: | 201810467893.9 | 申请日: | 2018-05-16 |
公开(公告)号: | CN108665005B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 方巍;张飞鸿;丁叶文 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210044 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 dcgan 提高 基于 cnn 图像 识别 性能 方法 | ||
1.一种利用DCGAN提高基于CNN图像识别性能的方法,其特征在于:包括以下步骤:
(1)定义DCGAN中生成模型和判别模型的结构;
(2)建立学习率加速策略;
(3)生成样本检测;
(4)构建基于CNN的图像识别框架;
(5)性能优化;
其中,步骤(1)中所述的生成模型包括数据转化层和反卷积层,所述数据转化层和反卷积层的激活函数为LeakyReLu函数;
所述的判别模型包括卷积层和全连接层,所述卷积层和全连接层之间激活函数为ReLu函数,所述全连接层末端二分类函数为Sigmoid或SoftMax函数;
其中,步骤(2)具体包括以下步骤:
(21)设置学习率,所述学习率初始值范围为[0.9,1.0],其反向传播更新权值和偏置值遵循如下计算公式:
W=W-α·[损失函数对权值求偏导的值]
其中,W表示更新权值或偏置值,α为学习率;
(22)通过迭代逐步减少学习率,在每次循环中调用反向传播机制来调整权值和偏置值,进而求取损失函数的最小值,将学习率衰减幅度放入迭代操作中,其学习率衰减策略减遵循如下公式:
其中:decay_rate大小取0.1到1.0范围,epochi为第i次迭代训练,α0为初始学习率,取值范围为0.1到1.0;
其中,步骤(4)中的识别模型采用4层卷积层和3层全连接层的神经网络,输出的结果包括四类,分别为有雨有风类、有雨无风类、无雨有风类和无雨无风类。
2.根据权利要求1所述的一种利用DCGAN提高基于CNN图像识别性能的方法,其特征在于:步骤(1)包括建立网络损失函数,所述的网络损失函数包括网络总体损失函数、生成模型损失函数和判别模型损失函数,上述函数表达式定义如下所示:
所述网络总体损失函数表达式如下:
所述生成模型损失函数表达式如下:
LOSS(G)=-(log(D2(G(z))));
所述判别模型损失函数表达式如下:
LOSS(D)=-(log(D1(x))+log(1-D2(G(z))));
其中:D(x)为根据数据x的判别函数,G(z)为根据噪声z的生成函数,表示x来源于数据概率分布,同理中z来源于噪声分布,D1(x)与D2(x)运算方式等价。
3.根据权利要求1所述的一种利用DCGAN提高基于CNN图像识别性能的方法,其特征在于:步骤(2)包括使用mini-batch梯度下降的方式优化网络参数,所述的网络参数包括批量大小batch,迭代次数epoch,学习率α,需要调整的权重和偏置值W和b,以及优化梯度下降法时所要增加的动量因子m和v。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810467893.9/1.html,转载请声明来源钻瓜专利网。