[发明专利]一种基于WGAN模型的可变形卷积核方法在审
申请号: | 201711123711.8 | 申请日: | 2017-11-14 |
公开(公告)号: | CN107886162A | 公开(公告)日: | 2018-04-06 |
发明(设计)人: | 周智恒;李立军;胥静;朱湘军;李利苹;汪壮雄 | 申请(专利权)人: | 华南理工大学;广州视声智能股份有限公司;广州视声智能科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司44245 | 代理人: | 李斌 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 wgan 模型 变形 卷积 方法 | ||
技术领域
本发明涉及深度学习神经网络领域,具体涉及一种基于WGAN模型的可变形卷积核方法。
背景技术
生成式对抗网络(Generative Adversarial Network,简称GAN)是由Goodfellow在2014年提出的深度学习框架,它基于“博奕论”的思想,构造生成器(generator)和判别器(discriminator)两种模型,前者通过输入(0,1)的均匀噪声或高斯随机噪声生成图像,后者对输入的图像进行判别,确定是来自数据集的图像还是由生成器产生的图像。
在传统的对抗网络模型中,对于生成器生成图像质量并没有统一的评判标准,因此,亟待提出一种利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行,另外利用可变形卷积学习图像特征的方法,提高了整个网络的训练效率。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于WGAN模型的可变形卷积核方法。
本发明的目的可以通过采取如下技术方案达到:
一种基于WGAN模型的可变形卷积核方法,所述可变形卷积核方法包括下列步骤:
S1、构造原始生成对抗网络模型,通过生成器生成图像输入至判别器进行网络训练;
S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;
在本发明所涉及到的网络模型中,利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行。
S3、初始化随机噪声,输入生成器中;
S4、在WGAN模型中利用可变形卷积核对图像进行卷积;
在原始的生成对抗网络模型中,卷积核的形状一般为方形,这限制了神经网络对图像特征学习的自由度,而在本发明中,针对这一缺陷,利用网络训练对卷积核的形状进行自适应地改变,从而能够以更高的效率学习到数据集中图像的特征。
S5、将可变形卷积操作得到的损失函数输入生成器进行后续训练。
进一步地,所述的步骤S2具体如下:
构造多个卷积核,不同的卷积核,代表着在学习的过程中,能够学习到不同的图像特征。
进一步地,所述的步骤S4中在WGAN中利用可变形卷积核对图像进行卷积,具体过程如下:
S41、构造多个不同数值但大小相同的卷积核;
S42、采用已构造的卷积核,分别对生成器生成的多张图像进行卷积,从而得到多张特征图。
进一步地,所述的步骤S5中,将可变形卷积操作得到的损失函数输入生成器进行后续训练。具体过程如下:
S51、对S4中卷积之后的特征图,输入判别器进行判别;
S52、将可变形卷积操作得到的损失函数输入生成器进行后续训练。
S53、将所有损失函数的均值输入至生成器中继续进行训练。
本发明相对于现有技术具有如下的优点及效果:
鲁棒性:本发明根据可变形卷积的操作过程,设置构造了多个可变形卷积核,通过在训练过程中动态地改变卷积核大小的方式,应用在以深度卷积神经网络充当生成器与判别器的对抗网络模型中,同时利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行。
附图说明
图1是本发明中公开的基于WGAN模型的可变形卷积核方法训练流程图;
图2是本发明中对原始卷积核改造成为可变形卷积核的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
本实施例公开了一种基于WGAN模型的可变形卷积核方法,具体包括下列步骤:
步骤S1、构造原始生成对抗网络模型,生成器通过生成图像输入至判别器进行网络训练。
步骤S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;
不同的卷积核,体现在矩阵数值的不同、行列数的不同。
构造多个卷积核,在处理图像的过程中,不同的卷积核意味着能够在网络训练的过程中学习到生成图像的不同特征。
在本发明所涉及到的网络模型中,利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;广州视声智能股份有限公司;广州视声智能科技有限公司,未经华南理工大学;广州视声智能股份有限公司;广州视声智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711123711.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可伸缩物流码放架
- 下一篇:一种用于胶带密封的包装盒