[发明专利]一种人像风格迁移方法在审
| 申请号: | 202011427405.5 | 申请日: | 2020-12-07 |
| 公开(公告)号: | CN112529771A | 公开(公告)日: | 2021-03-19 |
| 发明(设计)人: | 张娟;续兆攀;周明全 | 申请(专利权)人: | 陕西师范大学 |
| 主分类号: | G06T3/00 | 分类号: | G06T3/00;G06T5/50;G06T5/30;G06T7/194;G06T7/136;G06T7/90;G06N3/04;G06N3/08 |
| 代理公司: | 西安创知专利事务所 61213 | 代理人: | 卫苏晶 |
| 地址: | 710119 陕西*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 人像 风格 迁移 方法 | ||
1.一种人像风格迁移方法,其特征在于,该方法包括以下步骤:
步骤一、获取内容图像:
步骤101、采用摄像机在纯色背景下对人物进行拍摄,获取人物图像;其中,人物图像的大小为A×C个像素点,且A大于C,A和C均为正整数,其中,A表示行,C表示列;
步骤102、计算机对人物图像进行背景和前景分离,得到优化后的二值化人物图像;其中,优化后的二值化人物图像为人物图像;
步骤103、从计算机的背景图像库中选择背景图像;其中,背景图像的大小为A×C个像素点;
步骤104、计算机根据优化后的二值化人物图像,将人物图像中的人物区域与背景图像合成,得到合成人物图像,并将合成人物图像作为内容图像;
步骤二、风格迁移总损失函数的建立:
步骤201、随机生成白噪声图像作为初始的生成图像;
步骤202、选取卷积神经网络VGG19作为原始模型;其中,卷积神经网络VGG19包括16个卷积层和5个池化层,16个卷积层分别为Relu1_1卷积层,Relu1_2卷积层;Relu2_1卷积层,Relu2_2卷积层;Relu3_1卷积层,Relu3_2卷积层,Relu3_3卷积层,Relu3_4卷积层;Relu4_1卷积层,Relu4_2卷积层,Relu4_3卷积层,Relu4_4卷积层;Relu5_1卷积层,Relu5_2卷积层,Relu5_3卷积层,Relu5_4卷积层;
步骤203、计算机获取内容损失,具体过程如下:
步骤2031、将内容图像和初始的生成图像输入原始模型,并设定内容图像经Relu4_1卷积层输出第4_1层内容特征图,内容图像经Relu5_1卷积层输出第5_1层内容特征图;
设定初始的生成图像经Relu4_1卷积层输出第4_1层生成特征图,初始的生成图像经Relu5_1卷积层输出第5_1层生成特征图;其中,第4_1层内容特征图、第5_1层内容特征图、第4_1层生成特征图和第5_1层生成特征图的数量均为N,且N=512;
步骤2032、计算机根据公式得到第n个第4_1层内容特征图和第n个第4_1层生成特征图之间的内容损失Ln,4;其中,表示第n个第4_1层内容特征图中(i,j)处的特征值,表示第n个第4_1层生成特征图中(i,j)处的特征值,i,j,n均为正整数,且1≤i≤I,1≤j≤J,I表示第4_1层内容特征图或者第4_1层生成特征图的总列数,J表示第4_1层内容特征图或者第4_1层生成特征图的总行数,1≤n≤N;
计算机根据公式得到第n个第5_1层内容特征图和第n个第5_1层生成特征图之间的内容损失Ln,5;其中,表示第n个第5_1层内容特征图中(i′,j′)处的特征值,表示第n个第5_1层生成特征图中(i′,j′)处的特征值,i′,j′均为正整数,且1≤i′≤I′,1≤j′≤J′,I′表示第5_1层内容特征图或者第5_1层生成特征图的总列数,J′表示第5_1层内容特征图或者第5_1层生成特征图的总行数;
步骤2033、计算机根据公式得到内容损失Lc;
步骤204、计算机获取风格损失,具体过程如下:
步骤2041、计算机将第一遮罩层覆盖在风格图像上,生成第一遮罩风格图像;计算机将第二遮罩层覆盖在风格图像上,生成第二遮罩风格图像;其中,第一遮罩层中人物区域的透明度设置为100%,第一遮罩层中背景区域的透明度设置为0;第二遮罩层中人物区域的透明度设置为0,第二遮罩层中背景区域的透明度设置为100%,第一遮罩层和第二遮罩层中背景区域均为白色,第一遮罩层中和第二遮罩层中人物区域均为黑色;
步骤2042、计算机将第一遮罩层覆盖在初始的生成图像上,生成第一遮罩生成图像,计算机将第二遮罩层覆盖在初始的生成图像上,生成第二遮罩生成图像;
步骤2043、计算机将第一遮罩风格图像、第二遮罩风格图像、第一遮罩生成图像和第二遮罩生成图像输入原始模型,且分别经Relu1_1卷积层、Relu2_1卷积层、Relu3_1卷积层、Relu4_1卷积层和Relu5_1卷积层输出的特征图进行风格损失的获取方法相同,其中,对经Relu c_1卷积层输出的特征图进行风格损失的获取,具体过程如下:
步骤20431、设定第一遮罩风格图像、第二遮罩风格图像、第一遮罩生成图像和第二遮罩生成图像分别经Relu c_1卷积层输出第c_1层第一遮罩风格特征图、第c_1层第二遮罩风格特征图、第c_1层第一遮罩生成特征图和第c_1层第二遮罩生成特征图;且第c_1层第一遮罩风格特征图,第c_1层第二遮罩风格特征图、第c_1层第一遮罩生成特征图和第c_1层第二遮罩生成特征图的数量均为Nc;其中,c为正整数,且1≤c≤5;
步骤20432、计算机获取Nc个第c_1层第一遮罩风格特征图的格拉姆矩阵且中第ac行第bc列元素值记作且表示Nc个第c_1层第一遮罩风格特征图中第ac个第c_1层第一遮罩风格特征图和第bc个第c_1层第一遮罩风格特征图之间的互相关程度,ac和bc均为正整数,且1≤ac≤Nc,1≤bc≤Nc;
获取Nc个第c_1层第二遮罩风格特征图的格拉姆矩阵且中第ac行第bc列元素值记作且表示Nc个第c_1层第二遮罩风格特征图中第ac个第c_1层第二遮罩风格特征图和第bc个第c_1层第二遮罩风格特征图之间的互相关程度;
获取Nc个第c_1层第一遮罩生成特征图的格拉姆矩阵且中第ac行第bc列元素值记作且表示Nc个第c_1层第一遮罩生成特征图中第ac个第c_1层第一遮罩生成特征图和第bc个第c_1层第一遮罩生成特征图之间的互相关程度;
获取Nc个第c_1层第二遮罩生成特征图的格拉姆矩阵且中第ac行第bc列元素值记作且表示Nc个第c_1层第二遮罩生成特征图中第ac个第c_1层第二遮罩生成特征图和第bc个第c_1层第二遮罩生成特征图之间的互相关程度;
步骤20433、计算机根据公式,得到第c_1层生成特征图的风格损失Ls,c-1;
步骤20434、计算机根据公式得到风格损失Ls;
步骤205、计算机根据公式得到总变差正则化损失Ltv;其中,Ri″,j″、Gi″,j″和Bi″,j″表示初始的生成图像中(i″,j″)像素坐标处的R分量、G分量和B分量,Ri″,j″+1、Gi″,j″+1和Bi″,j″+1表示初始的生成图像中(i″,j″+1)像素坐标处的R分量、G分量和B分量,Ri″+1,j″、Gi″+1,j″和Bi″+1,j″表示初始的生成图像中(i″+1,j″)像素坐标处的R分量、G分量和B分量,i″,j″均为正整数,且1≤i″≤C,1≤j″≤A;
步骤206、计算机根据公式得到正则惩罚项Lm;
其中,e为正整数,且e取值为1,2和3,当e=1,表示初始的生成图像的R通道,V1(o)表示初始的生成图像的R分量矩阵经PCA降维的向量化;当e=2,表示初始的生成图像的G通道,V2(o)表示初始的生成图像的G分量矩阵经PCA降维的向量化;当e=3,表示初始的生成图像的B通道,V3(o)表示初始的生成图像的B分量矩阵经PCA降维的向量化,MI表示内容图像的拉普拉斯矩阵;
步骤207、计算机根据公式Ltotal=αLc+ρLs+γLtv+Lm,得到总损失函数Ltotal;其中,α表示内容损失的加权系数,ρ表示风格损失的加权系数,γ表示总变差正则化损失的权重;
步骤三、生成图像的迭代优化:
步骤301、计算机采用梯度下降法,利用总损失函数对初始的生成图像进行迭代优化;
步骤302、重复步骤301迭代优化直至满足迭代优化预设次数,得到风格迁移图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011427405.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加强安全保护电动压制机
- 下一篇:一种双面防沉、平衡控制且能够速停的船





