[发明专利]一种图像生成方法、系统及相关设备有效
申请号: | 202110707279.7 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113379593B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 孙志伟;马韬;闫潇宁 | 申请(专利权)人: | 深圳市安软科技股份有限公司;深圳市安软慧视科技有限公司 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06N3/04;G06N3/08 |
代理公司: | 深圳君信诚知识产权代理事务所(普通合伙) 44636 | 代理人: | 刘伟 |
地址: | 518000 广东省深圳市龙华新区龙华*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 生成 方法 系统 相关 设备 | ||
本发明适用于人工智能应用领域,提供了一种图像生成方法、系统、计算机设备及存储介质,具体包括:提取有特征标签的训练图片为训练集;随机生成满足高斯分布的第一噪声和第二噪声;利用生成器根据第一噪声、第二噪声得到中间噪声,并对特征标签、第一噪声、第二噪声、中间噪声进行处理,得到第一图片集、第二图片集和第三图片集;将第一图片集、第二图片集、第一噪声、第二噪声、中间噪声以及第三图片集输入到多样化模式损失函数进行处理;将第三图片集、训练集以及特征标签输入到生成对抗网络的判别器进行处理;生成器和判别器反复交替更新学习,直到达到纳什均衡,生成最终图像。本发明缓解了生成对抗网络中的模式崩塌问题。
技术领域
本发明属于人工智能应用领域,尤其涉及一种图像生成方法、系统及相关设备。
背景技术
生成对抗网络(Generative Adversarial Networks,GAN)一般有两个重要的组成部分:生成器和判别器。通过使生成器和判别器相互对抗直至双方均达到最优的过程,称为纳什均衡。然而,实际训练中很难达到纳什均衡,主要原因是,对于生成图像和辨别图像两个任务来说,生成图像的任务难度远高于辨别图像的难度,所以判别器往往比生成器训练得更快,从而使得判别器率先达到最优状态,在这种情况下,生成器生成的图片会很容易被判别器辨别出来,导致在反向传播时,生成器得到无效的梯度,最终使得生成器一直无法达到最优状态。达不到纳什均衡的结果是生成器无法生成更高保真度和多样性的图片。
GAN一直被广泛应用于各种条件生成任务,但一直以来两个主要问题都未能得到很好的解决,其一,为上述描述的训练不稳定导致很难达到纳什均衡的问题;其二,为模式崩塌,是指对于取自同一分布不同的隐变量通过生成器得到的图片很大程度上是相似的,缺乏多样性。出现模式崩塌的原因主要是,对于生成器学到的一个具体的特征,会出现两种情况:一,生成器学习到的特征是符合实际需求的,但是由于判别器训练的过好,所以会给虚假的特征一个较低的分数;二,生成器学习到的特征不符合实际需求,但是由于判别器训练的过差,无法判别虚假图像的真假,可能会误给虚假的特征一个很高的分数。
从优化生成器的角度,MSGAN(Mode Seeking Generative AdversarialNetworks,模式寻求型生成对抗网络)的作者提出一种损失函数MS_Loss,具体表述为:对于取自同一分布的任意两个隐变量通过生成器生成的图片的多样性距离应该是尽量的大,即希望生成器在隐变量距离比较小的时候,可以寻找到更多的模式。但是,对于原先两个相近的隐变量对应生成的图片相似度距离也很相近,MSGAN会将所有的样本都输入到MS_Loss中,最终会使得生成器最终学习到有偏差的真实分布。
发明内容
本发明实施例提供一种图像生成方法、系统及相关设备,旨在解决生成对抗网络中生成器过分追求模式的多样性,最终造成模式崩塌的问题。
第一方面,本发明实施例提供一种图像生成方法,包括以下步骤:
将预设的训练图片数据中的图片提取为训练集,所述训练集中的图片对应有特征标签;
随机地生成满足高斯分布的第一噪声和第二噪声;
将所述特征标签分别与所述第一噪声和所述第二噪声拼接,再输入到生成对抗网络的生成器进行处理,分别得到对应所述第一噪声和所述第二噪声的第一图片集和第二图片集;
计算所述第一噪声和所述第二噪声的均值,均值计算使用均方差纠错作为损失函数,以得到中间噪声,将所述第一噪声和所述第二噪声以及所述特征标签拼接,再输入到生成对抗网络的生成器进行处理,得到第三图片集;
将所述第一图片集、所述第二图片集、所述第一噪声、所述第二噪声、所述中间噪声以及所述第三图片集输入到多样化模式损失函数进行处理,以使得所述生成器生成的所述第一图片集、所述第二图片集与所述第三图片集之间的矩阵距离最大化,避免所述生成器生成所述第一图片集、所述第二图片集、所述第三图片集时的表现趋势过于单一;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市安软科技股份有限公司;深圳市安软慧视科技有限公司,未经深圳市安软科技股份有限公司;深圳市安软慧视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110707279.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序