[发明专利]一种基于新型生成对抗网络的眼部图像修复方法在审
申请号: | 201810078940.0 | 申请日: | 2018-01-26 |
公开(公告)号: | CN108269245A | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06K9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 修复 眼部图像 对抗 参考图像 网络 生成器 参考图像区域 参考数据 代码描述 额外信息 面部图像 模型架构 图像相关 信息指导 样本信息 原始照片 原图像 感知 姿势 个性化 图像 引入 保留 创建 | ||
1.一种基于新型生成对抗网络的眼部图像修复方法,其特征在于,主要包括眼部图像修复(一);新型生成对抗网络(二);模型架构(三)。
2.基于权利要求书1所述的眼部图像修复(一),其特征在于,使用参考图像区域内的样本信息进行修复,使用一个感知代码描述该对象,在对抗网络中的多个点上插入额外信息,增加其描述能力,产生更真实的修复效果。
3.基于权利要求书1所述的新型生成对抗网络(二),其特征在于,引入新型生成对抗网络(ExGAN),生成器创建图像后,得到第二个图像,使用第二个图像的相关信息指导生成器,随着越来越多的数据集被开发,假设特定对象的第二图像合理存在,修复面部图像时,采用同一个人在不同时间或不同姿势的第二图像作为参考图像,网络通过学习,将这些信息合并为一个语义指南,生成正确的修复结果,ExGAN在保留原始照片特征的同时,利用参考数据,在ExGAN中提出两种独立的方法来修复图像:首先是基于参考图像进行修复的方法,在生成器G中参考图像ri作为向导,在鉴别器D中使用参考图像ri作为附加信息来确定所生成的图像是否为真;其次是基于代码的修复方法,在信息区域创建感知代码ci,将人眼图像的压缩版本存储在向量中,其中每个目标都以附加信息ri和ci为条件,为目标添加额外的内容损失项。
4.基于权利要求书3所述的鉴别器,其特征在于,鉴别器处理整个人脸图像和放大的眼睛图像,全局对抗性损失强化整体语义的一致性,局部对抗性损失确保所生成输出的细节以及清晰度,全局卷积分支和局部卷积分支的输出通过连接形成一个S形函数,在鉴别器D中输入参考图像,将额外的全局卷积分支添加到鉴别器中,把三个分支的输出连接起来。
5.基于权利要求3所述的基于参考图像进行修复,其特征在于,训练集xi中的每个图像都存在一个对应的参考图像ri,训练集X被定义为一个元组X={(x1,r1)},在眼部图像修复中,ri是xi中同一个人不同姿态的图像,在xi中移除修补程序生成新图像zi,将学习目标定义为:
为了更好的普遍化,在训练集xi中对应地给定一组参考图像集合Ri,将训练集扩展到一个元组集合:X={x1×R1,…,xn×Rn},该集合由每个需要的修复图像及其参考图像之间的笛卡尔乘积组成。
6.基于权利要求3所述的基于代码的修复,其特征在于,数据集中每个图像的像素数为|I|,假设存在一个压缩函数其中N<<|I|,对于每个需要修复的图像zi及其相应的参考图像ri,使用ri生成代码ci=C(ri),鉴于已编码的样本信息,将对抗目标定义为:
其中,压缩函数是一个将实例投影到某个流形上的通用深度网络,等式(2)中的最后一项是感知区域中的生成图像G(zi,ci)与原始参考图像ri距离的可选损失,与测量低维流形中生成图像和参考图像之间的距离相对应,如果生成器G是完全卷积的,当输入ci时,需要修改其架构以便处理任意数量的向量。
7.基于权利要求书6所述的压缩函数,其特征在于,为了生成感知代码ci,为压缩函数C训练一个单独的自动编码器,在训练C期间,编码器选取单只眼睛作为输入,自动编码器的解码器分成左右分支,分别对应左右眼不同的目标,以确保编码器学习双眼的共同特征时没有重复,通过编码对特征进行区分,每只眼睛都用128维度的浮点向量进行编码,通过组合这些编码形成256维度的眼图编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810078940.0/1.html,转载请声明来源钻瓜专利网。