[发明专利]一种图像风格迁移模型训练方法、装置及电子设备有效
| 申请号: | 202110556271.5 | 申请日: | 2021-05-21 |
| 公开(公告)号: | CN113160042B | 公开(公告)日: | 2023-02-17 |
| 发明(设计)人: | 李丽香;张雅盟;彭海朋 | 申请(专利权)人: | 北京邮电大学 |
| 主分类号: | G06T3/00 | 分类号: | G06T3/00;G06V10/40;G06V10/774 |
| 代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;赵元 |
| 地址: | 100876 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 图像 风格 迁移 模型 训练 方法 装置 电子设备 | ||
1.一种图像风格迁移模型训练方法,其特征在于,所述方法包括:
将样本源域图像和样本目标域图像输入待训练的图像风格迁移模型,其中,所述图像风格迁移模型包括内容编码层和风格编码层;
通过所述内容编码层对所述样本源域图像和样本目标域图像进行特征提取,得到源内容张量和目标内容张量;
通过所述风格编码层对所述样本源域图像和样本目标域图像进行特征提取,得到源风格张量和目标风格张量;
通过预设损失函数,根据所述源内容张量、所述源风格张量、目标内容张量和目标风格张量计算所述待训练的图像风格迁移模型的当前损失;
根据所述当前损失对所述待训练的图像风格迁移模型的参数进行调整,返回所述将样本源域图像和样本目标域图像输入待训练的图像风格迁移模型的步骤继续执行,直至所述当前损失小于预设阈值,得到训练好的图像风格迁移模型;
所述通过预设损失函数,根据所述源内容张量、所述源风格张量、目标内容张量和目标风格张量计算所述待训练的图像风格迁移模型的当前损失,包括:
通过预设损失函数,根据所述源内容张量、所述源风格张量、目标内容张量和目标风格张量计算所述待训练的图像风格迁移模型的项目损失,其中,所述项目损失包括重构损失、潜在语义损失、循环重构损失、对抗损失、风格多样性损失和感知损失中的至少一种;
根据所述项目损失计算得到所述当前损失;
所述重构损失的计算方式包括:通过预设生成器,根据所述源内容张量和所述源风格张量计算得到源域域内重构图;通过预设生成器,根据所述目标内容张量和所述目标风格张量计算得到目标域域内重构图;根据所述源域域内重构图和所述目标域域内重构图,通过第一预设损失函数计算得到重构损失;
所述潜在语义损失的计算方式包括:通过预设生成器,根据所述源内容张量和所述目标风格张量计算得到源域生成图;通过预设生成器,根据所述目标内容张量和所述源风格张量计算得到目标域生成图;将所述目标域生成图输入所述内容编码层,得到重构目标内容张量;将所述目标域生成图输入所述风格编码层,得到重构目标风格张量;将所述源域生成图输入所述内容编码层,得到重构源内容张量;将所述源域生成图输入所述风格编码层,得到重构源风格张量;根据所述重构目标内容张量和所述重构目标风格张量,通过第二预设损失函数计算得到第二潜在语义损失;根据所述重构源内容张量和所述重构源风格张量,通过第二预设损失函数计算得到第一潜在语义损失;计算所述第一潜在语义损失和所述第二潜在语义损失之和,得到所述潜在语义损失;
所述循环重构损失的计算方式包括:通过预设生成器,根据所述重构源内容张量和所述重构源风格张量计算得到循环重构源域图;通过预设生成器,根据所述重构目标风格张量和所述重构目标内容张量计算得到循环重构目标域图;根据所述循环重构源域图和所述循环重构目标域图,通过第三预设损失函数计算得到所述循环重构损失;
所述对抗损失的计算方式包括:随机生成风格张量,得到第一随机风格张量;通过所述预设生成器,根据所述随机风格张量和所述源内容张量生成第一虚假源域图;通过所述预设生成器,根据所述随机风格张量和所述目标内容张量生成第一虚假目标域图;根据所述第一虚假目标域图和所述样本目标域图像,通过第四预设损失函数计算得到第二对抗损失;根据所述第一虚假源域图和所述样本源域图像,通过第四预设损失函数计算得到第一对抗损失;计算所述第一对抗损失和所述第二对抗损失之和,得到所述对抗损失;
所述风格多样性损失的计算方式包括:随机生成四种不同的风格张量,得到第二随机风格张量、第三随机风格张量、第四随机风格张量和第五随机风格张量;通过所述预设生成器,根据所述第二随机风格张量和所述源内容张量,生成第二虚假源域图;通过所述预设生成器,根据所述第三随机风格张量和所述源内容张量,生成第三虚假源域图;通过所述预设生成器,根据所述第四随机风格张量和所述目标内容张量,生成第二虚假目标域图;通过所述预设生成器,根据所述第五随机风格张量和所述目标内容张量,生成第三虚假目标域图;根据所述第二虚假源域图和所述第三虚假源域图,通过第五预设损失函数计算得到第一风格多样性损失;根据所述第二虚假目标域图和所述第三虚假目标域图,通过第五预设损失函数计算得到第二风格多样性损失;计算所述第一风格多样性损失和所述第二风格多样性损失之和,得到所述风格多样性损失;
所述感知损失的计算方式包括:根据所述样本源域图像、所述源域域内重构图、所述第一虚假源域图、所述循环重构源域图、所述样本目标域图像、所述目标域域内重构图、所述第一虚假目标域图和所述循环重构目标域图,通过第六预设损失函数计算得到所述感知损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110556271.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种门锁开关
- 下一篇:基于深度学习耦合建模的飞机发动机剩余寿命预测方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





