[发明专利]一种基于代价敏感学习的人脸属性编辑方法在审
申请号: | 202210006417.3 | 申请日: | 2022-01-05 |
公开(公告)号: | CN114494529A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 张亮 | 申请(专利权)人: | 电子科技大学长三角研究院(衢州) |
主分类号: | G06T11/60 | 分类号: | G06T11/60;G06V40/16;G06V10/82;G06N3/04;A63F13/63 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 陈一鑫 |
地址: | 324000 浙江省衢*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 代价 敏感 学习 属性 编辑 方法 | ||
1.一种基于代价敏感学习的人脸属性编辑方法,该方法包括:
步骤1:对数据集进行预处理;
获取真实人脸图像,并将这些真实图像按照其中人脸显示的属性进行标注,对所有图片像素值进行归一化;
步骤2:构建生成对抗网络的判别器网络和生成器网络;
1)判别器网络构建
判别器网络输入为图片,输出为一个标量和一个向量;判别器网络D分为三个模块:特征提取模块De、对抗损失模块Dadv和属性分类模块Dcls;特征提取模块De的输入为图片,输出为图片的特征向量,特征提取模块De由5层卷积网络块依次连接而成;对抗损失模块Dadv的输入为特征提取模块De提取的特征,输出为标量,值越大表示图像越真实,对抗损失模块D2采用两层线性网络块构成;属性分类模块Dcls的输入为特征提取模块De的提取的特征,输出为属性分类向量,属性分类模块Dcls由两层线性网络块构成;
2)生成器网络构建
生成器网络输入为原始图像和图像的属性编辑向量,输出为属性编辑后图像;生成器网络G主要由三个部分构成:编码器模块Genc、解码器模块Gdec、滤波模块GF;其中编码器模块Genc的输入原始图像,输出为图像特征,由5层卷积网络块依次连接而成;解码器模块Gdec的输入为图像特征和图像的过滤特征,输出为编辑后人脸图像,由5层转置卷积网络块依次连接而成,并且编码器和解码器之间采用了Unet网络中的对称跳跃连接;滤波模块GF的输入为图像特征,输出为图像的过滤特征,采用STU结构构成,主要用于选择性过滤编码器和解码器之间的对称跳跃连接中传递的图像特征;
步骤3:设计人脸属性编辑模型训练过程中的属性编辑操作;
本发明采取小批量梯度下降算法对模型进行优化,分批次向模型输入数据集中的N个图像样本-属性标签对:(x,l),属性标签l是一个长度为M二进制向量,每一位的0或1分别表示对应属性的无或有;属性编辑向量构造方式如下:以图像样本x本身的属性标签作为它的原始标签ls,并为每个图像样本x随机挑取其他图像样本的属性标签作为目标属性标签lt,以保证属性编辑操作不会存在冲突,以Δl=lt-ls作为图像x的属性编辑向量;当Δli=1时,表示为图像x增加第i个属性;当Δli=0时,表示不改变图像x的第i个属性;当Δli=-1时,表示为图像x去掉第i个属性;
步骤4:设计错分代价和错误编辑代价
1)首先统计数据集中的人脸属性分布概率P=[p1 p2 … pM],其中M为人脸属性个数,第i个属性在数据集中的分布概率为其中表示第i个属性在数据集中出现的次数,Ndata为数据集的样本数量;然后根据人脸属性的分布概率P可以计算得到训练过程中第i个属性发生编辑的概率为2pi(1-pi);
2)计算错分代价其中将第i个属性由1分类为0的代价为Ci1=1/pi;将第i个属性由0分类为1的代价为Ci2=1/(1-pi);即可得
3)计算错误编辑代价当未对图像的第i个属性进行编辑时,而发生了错误编辑的代价为Ai1=1/(1-2pi(1-pi));当对图像的第i个属性进行编辑时,而未发生编辑的代价为Ai2=1/(2pi(1-pi));即可得到
步骤5:设计损失函数;
1)从训练公平性角度出发,针对判别器网络设计损失函数,以均衡不平衡数据集的影响:设由生成器编辑后的图像xg~pg,pg为生成器拟合的图像分布;设真实图像——属性标签对(xr,lr)~pdata,pdata为真实图像数据集的分布;利用判别器的特征提取模块De来提取查询图像xr的图像特征:fr=De(xr),将真实图像的特征fr送到判别器的对抗损失模块Dadv中计算图像的真实度估计:Dadv(xr);按照上述过程,可以得到生成图像xg的真实度估计Dadv(xg);这样可以构造生成对抗网络的判别器的对抗损失:
其中,Dadv(xg)表示判别器的对抗损失模块对编辑图像的输出值,输出值越大表明编辑图像越真实,表示对该输出值的期望,Dadv(xr)表示判别器的对抗损失模块对编辑图像的输出值,表示对该输出值的期望;即分布为数据集分布pr和生成图像分布pg的线性混合,∈表示线性混合系数,表示判别函数关于混合图像求梯度,为梯度惩罚项,用来约束判别器模型的参数符合lipschitz连续条件,λgp为梯度惩罚系数;
将真实图像的特征fr送到判别器的属性分类模块Dcls中预测图像的属性分类,输出表示为Dcls(xr);结合步骤4的2)中计算得到的错分代价C,可以为判别器构造具有代价敏感的分类损失函数:
其中,Dcls(xr)表示判别器的属性分类模块对原始图像xr的属性预测向量,表示对图像xr的第i个属性的预测值,要求与原始属性标签的第i个分量越一致越好;所以,判别器的总损失函数为:
其中,为判别器的对抗损失,为判别器的分类损失,λcls为属性分类损失函数的权重;
2)从训练公平性角度出发,针对生成器网络设计损失函数,以均衡不平衡数据集的影响:设从数据集中抽取的原始图像——属性标签对为(xs,ls)~pdata,同时按照步骤3的方法为每一张图片抽取目标属性标签lt,构造属性编辑向量Δl;首先利用生成器的编码器提取原始图像的特征fs=Denc(xs),将原始图像特征fs和属性编辑向量Δl进行拼接得到带有条件的图像特征ft,将原始图像特征fs和0向量(长度为M)进行拼接得到不带条件的图像特征fr以用于图像重建;然后分别将ft,fr送入滤波模块DF中得到过滤特征f′t,f′r,然后将图像特征和过滤特征送入解码器Ddec中,分别得到编辑人脸图像xt=Ddec(ft,f′t)和重建人脸图像xr=Ddec(fr,f′r),为了方便表示,这里简记为xt=G(xs,Δl),xr=G(xs,0);然后按照步骤5的1)中的过程得到编辑人脸xt的真实度Dadv(xt),然后构造生成器的对抗损失函数:
其中,G(xs,Δl)为生成器关于属性编辑向量Δl对原始图像xs进行编辑后的图像,D(G(xs,Δl))为判别器关于编辑图像xt=G(xs,Δl)的真实度预测值,该值越高,表明编辑后图像越真实;表示对编辑后图像xt的真实度的数学期望;
按照步骤5的1)中的过程得到编辑人脸xt的属性预测向量Dcls(xt),结合步骤4的3)中计算的错误编辑代价A,构造生成器的属性编辑损失函数:
其中,1[·]为指示函数,当Δl=0时,1[Δl]=1,即Ail[Δl]=Ai1;当Δl≠0时,1[Δl]=2,即Ai[Δl]=Ai2;Dcls(xt)表示判别器的属性分类模块对编辑人脸xt的属性预测向量,表示对图像xt的第i个属性的预测值,要求与目标属性标签的第i个分量越一致越好;
同时,为了保证生成器G能够保留人脸的基本信息,要求重建人脸图像xr=G(xs,0)和原始人脸图像xs越一致越好,构造生成器的图像重建损失函数:
其中,||·||1为矩阵1范数,当重建图像xr=G(xs,0)与原始图像xs的每个像素点的取值越一致的时候,||xs-G(xs,0)||1越小;所以,生成器的总损失函数为:
其中,λop为属性编辑损失的权重,λrec为图像重建损失的权重;
步骤6:训练步骤2中构建的生成对抗神经网络,利用步骤5构建的损失函数进行网络训练,在更新生成器网络G时固定判别器网络D的参数,而更新判别器网络D时则固定生成器网络G的参数,每次迭代更新判别器5次然后更新生成器一次;
步骤7:采用训练完成的生成器网络G来对测试集中的人脸图像进行属性编辑,并用属性编辑成功率来衡量本发明提出的模型的属性编辑效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学长三角研究院(衢州),未经电子科技大学长三角研究院(衢州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210006417.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:工业数据安全传输方法、系统、设备及存储介质
- 下一篇:六自由度双板滑雪模拟器