[发明专利]一种具有高保形性的快速风格迁移方法有效
申请号: | 202111217043.1 | 申请日: | 2021-10-19 |
公开(公告)号: | CN113989102B | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 范益波;黄宇杰;荆明娥;曾晓洋 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06T9/00;G06N3/04;G06N3/08 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 王洁平 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 具有 高保形性 快速 风格 迁移 方法 | ||
1.一种具有高保形性的快速风格迁移方法,其特征在于,具体步骤如下:
1)构建用于完成风格迁移的神经网络模型;神经网络采用编码-解码架构,其包括提取内容图的内容特征的内容编码器、提取风格图的风格特征的风格编码器、根据风格特征风格化内容特征的多层自适应实例正则化模块、以及将多层自适应实例正则化模块获得的风格化的特征映像成风格化后的图像的解码器,其中,内容编码器由三层卷积层构成,风格编码器由三组卷积构成,每组卷积包含三层卷积层,多层自适应实例正则化模块在三个特征层级根据风格特征对内容特征进行自适应实例正则化,自适应实例正则化AdaIN( )的公式如下:
式(1)
其中x表示内容特征,y表示风格特征,是按通道求取标准差,是按通道求取均值;
解码器的结构和内容编码器对称,包括三层卷积层,解码器的卷积层中间穿插最邻近上采样层;
用
内容编码器的三层卷积层分别是:
风格编码器中的三组卷积,其中第一组由三个
解码器的结构如下:
2)根据损失函数训练用于完成风格迁移的神经网络,训练完成后的网络参数适用于任意的风格和内容图片;其中:神经网络的损失函数为:
式(3)
其中和分别表示内容损失和加权风格损失的权重,权重分别为1和0.2;
所述加权风格损失如式(2)所示:
) 式(2)
其中和分别表示风格图和生成的风格化的图片,指的是VGG19不同网络层的输出,是对应的权重,这里给
所述内容风格损失如式(4)所示:
式(4)
其中和分别表示内容图和生成的风格化的图片,指的是VGG19网络
3)训练完成后的网络先分别将内容图送入训练好的神经网络中的内容编码器,提取内容特征,风格图送入风格编码器,提取出风格特征,再由多层自适应实例正则化模块根据风格特征对内容特征进行风格化,获得风格化的特征,最后解码器将风格化的特征映射成风格化的图片。
2.根据权利要求1所述的快速风格迁移方法,其特征在于,多层自适应实例正则化模块根据风格特征对内容特征进行风格化的过程如下:
首先,将风格编码器的第三组卷积输出的风格特征和内容编码器第三卷积层输出的内容特征由多层自适应实例正则化模块风格化,再经过解码器的第一层卷积层部分解码;
然后,将解码器的第一层卷积层解码后数据和风格编码器的第二组卷积输出的风格特征由多层自适应实例正则化模块风格化,再经过解码器的第一个上采样层和第二层卷积层进一步解码;
最后,将解码器的第一个上采样层和第二层卷积层解码后数据和风格编码器的第一组卷积输出的风格特征由多层自适应实例正则化模块风格化,再经过解码器的第二个上采样层和第三层卷积最终解码,获得风格化后的图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111217043.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种幼驴养殖专用饲料
- 下一篇:一种差速器总成转向角检测装置及检测方法