[发明专利]一种基于生成式对抗网络的虚拟视点图像生成方法有效
申请号: | 201810054216.4 | 申请日: | 2018-01-19 |
公开(公告)号: | CN108495110B | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 侯春萍;莫晓蕾;杨阳;管岱;夏晗 | 申请(专利权)人: | 天津大学 |
主分类号: | H04N13/111 | 分类号: | H04N13/111;H04N13/161;H04N13/261;H04N13/275 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于生成式对抗网络的虚拟视点图像生成方法,包括下列步骤:第一步,制作数据集,获得训练生成式对抗网络所需要的图像对;构建模型:生成器和判别器使用的结构均为卷积层后接批量归一化层BatchNorm以及非线性运算单元ReLU激活函数的形式,所有的卷积层使用4×4的卷积核大小,并将步长设置为2,对特征图像进行降采样时长宽均缩小为原来的一半,上采样时长宽均放大至2倍,Dropout层将Dropout率设置为50%;RelU激活函数选用LeakyReLu;定义损失;进行模型的训练和测试。 | ||
搜索关键词: | 一种 基于 生成 对抗 网络 虚拟 视点 图像 方法 | ||
【主权项】:
1.一种基于生成式对抗网络的虚拟视点图像生成方法,包括下列步骤:第一步,制作数据集:对于立体图像,根据双目图像的特点,采用数据增强手段,获得训练生成式对抗网络所需要的图像对,将一一对应的左眼视图与右眼视图水平拼接成一张图片,从而得到训练图像和测试图像,生成数据集。第二步,构建模型:生成器和判别器使用的结构均为卷积层后接批量归一化层BatchNorm以及非线性运算单元ReLU激活函数的形式,所有的卷积层使用4×4的卷积核大小,并将步长设置为2,对特征图像进行降采样时长宽均缩小为原来的一半,上采样时长宽均放大至2倍,Dropout层将Dropout率设置为50%;RelU激活函数选用LeakyReLu;搭建生成器时,在编码器‑解码器架构的基础上,在编码模块与解码模块的对应层之间加入跳跃链接,使得对应的特征图能够按通道连接起来,在解码器的最后一层卷积层中,使用Tanh函数代替ReLU作为卷积层的激活函数;搭建判别器,采用不同大小感受野的网络架构,以综合得到更好的判别结果,在判别器的最后一层卷积层中,使用Sigmoid函数代替ReLU作为卷积层的激活函数,特征图被映射到一维的输出,表示判别虚拟视点图像为真实的概率;第三步,定义损失:将生成式对抗网络损失函数与损失函数一范数损失L1相结合,并将L1权重设置为100;第四步,进行模型的训练和测试训练与测试过程中将batch size设置为1,将第一步得到的数据集,每次随机选择一对训练图像,随机裁剪为256×256大小,输入到网络中进行训练调整训练参数,在训练的过程中首先固定生成器,更新判别器的网络权重,然后固定判别器,根据判别器的判别结果更新生成器的权重,如此反复,交替迭代训练,直到双方达到一个动态平衡;训练完成后,经测试集的图像输入训练好的生成器网络中,测试虚拟视点图像的生成效果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810054216.4/,转载请声明来源钻瓜专利网。