[发明专利]一种文本引导的图像修复方法和系统有效
| 申请号: | 202010993094.2 | 申请日: | 2020-09-21 |
| 公开(公告)号: | CN111861945B | 公开(公告)日: | 2020-12-18 |
| 发明(设计)人: | 赵洲;童鑫远;蔡登;何晓飞 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/08;G06N3/02 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
| 地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文本 引导 图像 修复 方法 系统 | ||
1.一种文本引导的图像修复方法,其特征在于,包括以下步骤:
1)获取源图像及引导文本,将源图像预处理为待修复图像序列,将引导文本预处理为引导文本特征序列;
2)建立由修复模块和重构模块组成的神经网络模型;
修复模块将待修复图像序列及引导文本特征序列作为输入,编码图像与文本特征,并解码得到待修复图像与引导文本的跨模态联合表征,最终输出修复图像序列;
重构模块将修复图像序列及随机蒙板的引导文本特征序列作为输入,生成预测引导文本;
3)将修复模块作为生成对抗网络的生成器,构建一个判别器对生成的修复图像序列进行判别,输出判别结果;
4)根据生成对抗网络的判别结果、修复模块生成的图像修复序列以及重构模块生成的预测引导文本,计算判别器和神经网络模型的多任务损失函数并更新网络参数,得到训练好的网络模型;
5)根据训练好的网络模型的修复模块,将要修复的图像与对应的引导文本特征序列作为修复模块的输入,采用自回归的方式逐步生成最终的修复图像。
2.根据权利要求1所述的一种文本引导的图像修复方法,其特征在于,所述的修复模块包括第一编码-解码网络,以及n个并行独立的Unet编码-解码网络,所述的第一编码-解码网络由文本编码器、视觉解码器构成,Unet编码-解码网络由n个Unet编码器、n个Unet解码器构成;
由文本编码器对引导文本特征序列进行编码,获得编码后的文本特征;
由n个UNet编码器提取待修复图像序列的特征图;
由视觉解码器对编码后的文本特征与特征图进行解码,得到跨模态联合表征fc;
将UNet编码器生成的特征图复制到对应的Unet解码器中,并采用Unet解码器对跨模态联合表征fc进行解码,得到修复图像序列。
3.根据权利要求2所述的一种文本引导的图像修复方法,其特征在于,在待修复图像序列的特征图中添加未来掩码,当Unet解码器生成第i幅修复图像时无法获取第i幅之后的待修复图像信息。
4.根据权利要求2所述的一种文本引导的图像修复方法,其特征在于,所述重构网络包括第二编码-解码网络,以及n个并行独立的Unet编码器,所述的第二编码-解码网络由视觉编码器、文本解码器构成;
对引导文本进行随机蒙板处理;
由n个UNet编码器提取修复图像序列的修复特征图,其中使用修复模块的UNet编码网络中的后n-1个UNet编码器提取修复图像序列中前n-1个修复图像的修复特征图,并新添加一个仅用于重构模块的UNet编码器来提取修复图像序列中第n个修复图像的修复特征图;
由视觉编码器对修复特征图进行编码,获得编码后的修复特征图;
由文本解码器对随机蒙板的引导文本特征序列与编码后的修复特征图进行解码,得到跨模态联合表征fp,并通过全连接层计算随机蒙板的引导文本中的每个蒙版位置在词汇表上的能量分布,生成预测引导文本。
5.根据权利要求4所述的一种文本引导的图像修复方法,其特征在于,所述的第一编码-解码网络和第二编码-解码网络采用基于Transformer模型的编码器与解码器,且视觉编码器与视觉解码器共享参数,文本编码器与文本解码器共享参数;所述的UNet编码器和Unet解码器均由激活函数层-卷积层-BatchNorm层构成的模块组成。
6.根据权利要求1所述的一种文本引导的图像修复方法,其特征在于,所述的UNet编码-解码网络使用带有残差连接的对称7层向下编码结构和7层向上解码结构,并使用最后一个编码层的特征图与编码后的文本特征进行交互。
7.根据权利要求1所述的一种文本引导的图像修复方法,其特征在于,使用一个模糊度递减的方框模糊滤波器生成待修复图像序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010993094.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





