[发明专利]一种基于多层级特征的对抗图像生成方法有效
申请号: | 201810541722.6 | 申请日: | 2018-05-30 |
公开(公告)号: | CN108765512B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 袁春;贲有成 | 申请(专利权)人: | 清华大学深圳研究生院 |
主分类号: | G06T11/00 | 分类号: | G06T11/00 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 方艳平 |
地址: | 518055 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 特征 对抗 图像 生成 方法 | ||
本发明公开了一种基于多层级特征的对抗图像生成方法,包括以下步骤:S1:在层级框架的不同生成器之间引入稠密连接以构建密集堆叠的生成式对抗网络DSGAN模型;S2:对DSGAN模型进行训练;S3:将图像的标签信息输入到DSGAN模型,采样得到最终图像。本发明提出的基于多层级特征的对抗图像生成方法,得到的图像更加真实。
技术领域
本发明涉及生成式对抗网络对自然图像数据集建模的技术,尤其涉及一种基于多层级特征的对抗图像生成方法。
背景技术
理解自然图像的分布一直是一个热门的研究课题。在各类机器学习方法中,深度生成模型显得尤为重要,因为在理论上它们能够以相对较少的模型参数来生成各种逼真的图像,这意味着它们有能力抓住自然图像的本质。生成式对抗网络(GAN)作为一类生成模型已经引起了广泛的关注,它们有能力捕获自然图像的内在结构,并被广泛应用于各种图像生成任务,如图像修补、超分辨率、图像到图像的转换和未来的帧预测。
作为生成模型中很有前景的一个分支,GAN将训练过程视为生成器G和判别器D这两位竞争者之间的零和博弈。具体而言,G旨在生成逼真的图像,而D则尝试区分真实图像与G生成的假图像。训练GAN等价于优化如下目标:
其中表示求期望值,h表示真实图像,其服从分布pData(h),z表示噪声,服从分布pNoise(z),噪声z是生成器G的输入。
训练GAN是为了取得G和D之间的纳什平衡。由于高维图像空间包含的变化太多,G总是可以产生既能混淆D同时又不接近真实分布的样本。因此,模型的训练常常会遇到不稳定和模式崩塌的问题。解决复杂问题的一个实用规则是将其分解成更容易解决的子问题,这在图像生成任务上也很实用。尽管完整的生成过程是困难的,可以将其划分为多个易处理的子步骤。事实上,最近的一些生成模型(S2-GAN,SGAN)已经基于这一想法并利用一堆GAN来生成不同层级的特征表达,其中每个GAN基于较高层级的特征表达来生成较低层级的特征表示。对于这些层级模型的一个自然的疑问是,随着堆叠GAN数量的增加,模型是否能够得到很好的训练。当下评估真实的与生成的中间层特征表达之间的差异性方法存在一定的局限性,对于GAN模型来说,特征表达的层级越低,越难对其实际分布进行建模,因为低层的特征表达位于更高维度的表达空间流形上。因此在自上而下的生成序列中,真实的与生成的特征表达之间的偏差越来越大,从而导致通过现有的一些生成模型(例如S2-GAN,SGAN)最终得到的图像不够真实。
以上背景技术内容的公开仅用于辅助理解本发明的构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利申请的申请日已经公开的情况下,上述背景技术不应当用于评价本申请的新颖性和创造性。
发明内容
为解决上述技术问题,本发明提出一种基于多层级特征的对抗图像生成方法,得到的图像更加真实。
为了实现上述目的,本发明采用以下技术方案:
本发明公开了一种基于多层级特征的对抗图像生成方法,包括以下步骤:
S1:在层级框架的不同生成器之间引入稠密连接以构建密集堆叠的生成式对抗网络DSGAN模型;
S2:对DSGAN模型进行训练;
S3:将图像的标签信息输入到DSGAN模型,采样得到最终图像。
优选地,步骤S2具体为采用对抗性损失、熵损失和条件特征损失三种损失函数来对DSGAN模型进行训练。
优选地,对抗性损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳研究生院,未经清华大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810541722.6/2.html,转载请声明来源钻瓜专利网。