[发明专利]图像生成模型的训练方法和设备以及图像生成方法和设备在审
| 申请号: | 202110966233.7 | 申请日: | 2021-08-23 |
| 公开(公告)号: | CN113590800A | 公开(公告)日: | 2021-11-02 |
| 发明(设计)人: | 牛天睿;冯方向;王小捷;袁彩霞 | 申请(专利权)人: | 北京邮电大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/583;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 孙清然;王琦 |
| 地址: | 100876 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 生成 模型 训练 方法 设备 以及 | ||
1.一种交互式递增图像生成模型的训练方法,其特征在于,包括:
获取对话样本数据,所述对话样本数据包括对话文本数据、标准图像、图像描述文本和对话总轮数;
采用随机重放训练的方式,利用所述对话样本数据和预先训练的异构循环神经网络编码器,对交互式递增图像生成模型进行训练,以使所述交互式递增图像模型能够基于人机对话文本和图像描述文本生成具有交互递增性的图像;其中,基于在对话的最终时刻获得的所有对话文本数据以及在对话的中间时刻获得的所有对话文本数据,进行所述训练。
2.根据权利要求1所述的方法,其特征在于,所述训练包括
采用随机采样的方式,确定当前采用的对话轮数t,其中,2≤t≤T,T为所述对话总论数;
将所述图像描述文本和所述对话文本数据输入至所述异构循环神经网络编码器进行编码,并将编码最后输出的特征表示作为第一文本表示X′T;将所述第一文本表示输入至交互式递增图像生成模型的图像生成器进行图像生成,得到第一图像Y′T;
基于所述第一文本表示X′T和所述第一图像Y′T,利用所述交互式递增图像生成模型的判别器,计算主对抗损失;利用所述主对抗损失,更新所述交互式递增图像生成模型的图像生成器和判别器的累计梯度;所述主对抗损失包括图像生成器和判别器的损失函数值;
将所述图像描述文本和所述对话文本数据中的前t轮对话数据输入所述异构循环神经网络编码器进行编码,并将编码最后输出的特征表示作为第二文本表示X′t;将所述第二文本表示输入至所述图像生成器进行图像生成,得到第二图像Y′t;
将所述图像描述文本和所述对话文本数据中的前t-1轮对话数据输入所述异构循环神经网络编码器进行编码,并将编码最后输出的特征表示作为第三文本表示X′t-1;将所述第三文本表示输入至所述图像生成器进行图像生成,得到第三图像Y′t-1;
基于所述第二文本表示X′t和所述第二图像Y′t,构造第一正例;
基于所述第三文本表示X′t-1和所述第三图像Y′t-1,构造第二正例;
基于所述第一正例,利用所述判别器,计算第一辅对抗损失;基于所述第一辅对抗损失,更新所述图像生成器和所述判别器的累计梯度;所述第一辅对抗损失包括图像生成器和判别器的损失函数值;
基于所述第二正例,利用所述判别器,计算第二辅对抗损失;基于所述第二辅对抗损失,更新所述图像生成器和所述判别器的累计梯度;所述第二辅对抗损失包括图像生成器和判别器的损失函数值;
基于当前所述图像生成器的累计梯度,更新所述图像生成器的参数;基于当前所述判别器的累计梯度,更新所述判别器的参数。
3.根据权利要求2所述的方法,其特征在于,所述训练方法进一步包括:
基于所述第三文本表示X′t-1和所述第二图像Y′t,构造第一负例;
基于所述第二文本表示X′t和所述第三图像Y′t-1,构造第二负例;
所述计算第一辅对抗损失包括:
基于所述第一正例和所述第一负例,利用所述判别器,计算所述第一辅对抗损失;
所述计算第二辅对抗损失包括:
基于所述第二正例和所述第二负例,利用所述判别器,计算所述第二辅对抗损失。
4.根据权利要求2所述的方法,其特征在于,所述异构循环神经网络编码器的训练包括:
获取编码训练样本数据,所述编码训练样本数据包括标准样本图像的图像描述文本和视觉对话文本;
利用所述编码训练样本数据对异构循环神经网络编码器进行训练,使所述异构循环神经网络编码器能够将输入数据中视觉对话文本中的指代关系与图像描述文本中的对应内容相关联。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110966233.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





