[发明专利]文本图像合成模型的训练、合成方法、装置、设备及介质在审
| 申请号: | 202210908809.9 | 申请日: | 2022-07-29 | 
| 公开(公告)号: | CN115619903A | 公开(公告)日: | 2023-01-17 | 
| 发明(设计)人: | 王健宗;李泽远;司世景 | 申请(专利权)人: | 平安科技(深圳)有限公司 | 
| 主分类号: | G06T11/60 | 分类号: | G06T11/60;G06V30/18;G06V30/19 | 
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 廖慧贤 | 
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 文本 图像 合成 模型 训练 方法 装置 设备 介质 | ||
本申请实施例提供了一种文本图像合成模型的训练、合成方法、装置、设备及介质,属于图像处理技术领域。该训练方法包括:获取训练图像文本和训练目标图像;将训练图像文本输入生成器进行图像合成,得到训练合成图像;将训练合成图像和训练目标图像输入判别器进行图像判别,得到图像判别结果;根据图像判别结果确定图像判别损失;根据训练图像文本和训练合成图像,确定图像合成损失;根据图像判别损失和图像合成损失,对生成器的参数和判别器的参数进行更新,得到文本图像合成模型;本申请实施例能够降低文本图像合成模型的复杂度,可广泛应用于图像处理技术领域。
技术领域
本申请涉及图像处理技术领域,尤其涉及文本图像合成模型的训练、合成方法、装置、设备及介质。
背景技术
随着元宇宙、虚拟现实等技术的发展,文本驱动图像合成任务得到了很大的发展,它可以应用于增强现实,虚拟现实,图像增强等应用场景。文本驱动图像合成任务是指从一句描述性文本生成与之对应的图片,而合成连贯、清晰、逼真的图像是文本驱动合成图像系统的目标,尤其是在对条件文本描述具有高语义保真度的逼真场景。
但是,当前文本驱动图像合成方法的训练过程比较费时,且模型相对比较复杂,因此,如何降低文本图像合成模型的复杂度,成为了亟待解决的技术问题。
发明内容
本申请实施例的主要目的在于提出一种文本图像合成模型的训练、合成方法、装置、设备及介质,旨在降低模型的复杂度。
为实现上述目的,本申请实施例的第一方面提出了一种文本图像合成模型的训练方法,所述训练方法包括:
获取训练图像文本和训练目标图像;
将所述训练图像文本输入生成器进行图像合成处理,得到训练合成图像;
将所述训练合成图像和所述训练目标图像输入判别器进行图像判别处理,得到图像判别结果;
根据所述图像判别结果确定图像判别损失;
根据所述训练图像文本和所述训练合成图像,确定图像合成损失;
根据所述图像判别损失和所述图像合成损失,对所述生成器的参数和所述判别器的参数进行更新处理,得到文本图像合成模型,其中,所述文本图像合成模型包括所述生成器和所述判别器。
在一些实施例,所述将所述训练图像文本输入生成器进行图像合成处理,得到训练合成图像,包括:
通过预训练的语言表征模型对所述训练图像文本进行特征提取处理,得到文本特征;
对所述文本特征进行加噪处理,得到文本加噪特征;
对所述文本加噪特征进行编码处理,得到隐编码;
对所述隐编码进行门控卷积处理,得到门控卷积编码;
对所述门控卷积编码进行解码处理,得到训练合成图像。
在一些实施例,所述将所述训练合成图像和所述训练目标图像输入判别器进行图像判别处理,得到图像判别结果,包括:
提取所述训练图像文本的句子特征;
将所述训练合成图像和训练目标图像,以及句子特征输入判别器进行图像判别处理,得到图像判别结果。
在一些实施例,所述根据所述图像判别结果确定图像判别损失,其中,所述图像判别损失包括生成器损失和判别器损失,包括:
根据所述图像判别结果对所述生成器进行损失计算处理,得到生成器损失;
根据所述图像判别结果对所述判别器进行损失计算处理,得到判别器损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210908809.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
 - 图像编码/图像解码方法以及图像编码/图像解码装置
 - 图像处理装置、图像形成装置、图像读取装置、图像处理方法
 - 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
 - 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
 - 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
 - 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
 - 图像形成设备、图像形成系统和图像形成方法
 - 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
 - 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
 





