[发明专利]基于生成对抗网络的跨视角图像翻译方法在审

专利信息
申请号: 202111292146.4 申请日: 2021-11-03
公开(公告)号: CN114092587A 公开(公告)日: 2022-02-25
发明(设计)人: 范佳媛;陈涛;吴克 申请(专利权)人: 复旦大学
主分类号: G06T11/00 分类号: G06T11/00;G06T9/00;G06N3/04;G06N3/08
代理公司: 上海正旦专利代理有限公司 31200 代理人: 王洁平
地址: 200433 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 生成 对抗 网络 视角 图像 翻译 方法
【权利要求书】:

1.一种基于生成对抗网络的跨视角图像翻译方法,其特征在于,包括以下步骤:

1)构建图像翻译网络

图像翻译网络包括跨视角图像生成器Gcoarse、多尺度鉴别器Ds、编码器E和残差估计网络;跨视角图像生成器Gcoarse选用U-net网络作为骨干网络,接受空中视角图像Ia、全景语义图像Spano为输入,合成粗糙的地面全景图像I′pano;残差估计网络由残差图生成器和残差图鉴别器Dr组成,残差图生成器由多个残差细化模块Ri依次级联而成,残差细化模块Ri由多层卷积神经网络组成,用以预测输入图像的残差图,并通过将跨视角图像生成器Gcoarse和残差图求和,进一步合成细化精炼的地面全景图像经过残差细化模块,残差估计网络生成最终细化的地面全景图像I″pano,残差图鉴别器Dr用来判断各个残差细化模块Ri生成残差图的真实性,并将结果反馈给残差细化模块Ri;多尺度鉴别器Ds以不同尺度图像块判断真实地面图像Ipano和最终细化的地面全景图像I″pano的真实性,并将结果反馈给跨视角图像生成器Gcoarse和残差估计网络;编码器E由数层基于残差的卷积神经网络组成,其作用为将输入图像编码为接近高斯分布的潜码zrec,以实现网络的多样化生成;

2)训练阶段

同时对图像翻译网络进行两个模式的训练;第一种训练模式中,将真实地面图像Ipano作为编码器E的输入生成的符合高斯分布的潜码ze、空中视角图像Ia、全景语义图像Spano输入图像翻译网络中进行训练;在第二种训练模式中,采用随机采样的潜码zr合并空中视角图像Ipano、全景语义图像Spano输入图像翻译网络进行训练,编码器E连接在图像翻译网络的末端,从生成的图像I″pano生成重构潜码zrec,以损失函数约束E将真实地面图像和生成图像的编码映射到相同的高斯分布;

3)测试阶段

以待测试空中视角图像、全景语义图像和在高斯分布上随机采样的不同的潜码输入到训练好的图像翻译网络,获得最终细化的底面全景图,得到多样化的生成结果。

2.根据权利要求1所述的跨视角图像翻译方法,其特征在于,残差估计网络中,将全景语义图像和空中视角图像与前一个残差细化模块的细化输出合并起来作为后续精炼的输入;第i阶段细化的全景图像的生成定义为:

其中和表示第(i-1)和第i块的细化图像输出,Ri表示第i级残差细化模块。

3.根据权利要求1所述的跨视角图像翻译方法,其特征在于,步骤2)中,

①第一种训练模式中,真实地面图像Ipano与最终生成的地面全景图像I″pano之间的重建损失设计如下:

其中代表期望运算,Ia代表了空中视角图像;

采用KL散度,通过如下的损失函数LKL来优化编码器:

其中E()表示编码器,表示高斯分布;

②第二种训练模式中,重构潜码zrec由于另一重构损失而被迫接近随机潜码zr,其表达式为:

③使用多尺度鉴别器Ds鉴别残差估计网络预测的中间的残差图,将跨视角图像生成器生成的粗糙全景图像I′pano的对抗损失公式表示为:

其中,Ds表示多尺度鉴别器;

经过多级细化后,网络生成了中间图像包括最终细化的图I″pano,空中视角图像和生成的中间图像对的对抗性损失公式如下:

由以上两式得到总的多级对抗损失为:

其中λrefine为平衡粗糙损失和精细损失贡献的权重因子,N为级联细化的阶段总数;

④估计的残差图用于填补生成的中间图像与真实地面图像之间的空白,因此,给定生成的中间图像将真实的残差图定义为则残差重构损失为:

其中Dr为残差图的鉴别器,为第i级残差细化模块生成的残差图,总残差重构损失是所有中间残差重构损失的总和:

⑤总体损失

将损失函数的加权求和作为整个图像翻译网络的总体损失,记为:

其中是λ1、λ2、λ3、λ4是控制每个损失在总体损失函数中所占比例超参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111292146.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top