[发明专利]一种基于生成对抗网络的多姿态人脸图像正面化方法有效
申请号: | 201910806159.5 | 申请日: | 2019-08-29 |
公开(公告)号: | CN110543846B | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 张星明;容昌乐;林育蓓 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 对抗 网络 多姿 态人脸 图像 正面 方法 | ||
1.一种基于生成对抗网络的多姿态人脸图像正面化方法,其特征在于,包括以下步骤:
1)收集各个姿态的人脸图像作为训练集和测试集,必须确保输入的每一张任意姿态的人脸图像Ia,都能在数据集中找到同一人物非合成的正脸图像Ig;
2)在训练阶段,把训练集中的任意姿态的人脸图像Ia输入生成器G,得到修正编码X2和合成的正脸图像If,把非合成的正脸图像Ig输入生成器G,得到正脸编码X3;
3)把合成的正脸图像If或非合成的正脸图像Ig输入判别网络D,判别网络D判断输入的人脸图像是合成的还是非合成的,再把合成的正脸图像If或非合成的正脸图像Ig输入人脸身份特征提取器F,通过F提取人脸图像的人物身份特征;
4)把步骤3)的判别结果和提取的人物身份特征、合成的正脸图像If、非合成的正脸图像Ig、修正编码X2和正脸编码X3带入各个预先设计好的损失函数,交替训练生成器G和判别网络D直至训练结束;
5)在测试阶段,把任意姿态的人脸图像Ia输入已经训练完成的生成器G,能够得到一张合成的正脸图像If,通过直接观测合成的正脸图像If的质量来验证效果。
2.根据权利要求1所述的一种基于生成对抗网络的多姿态人脸图像正面化方法,其特征在于:在步骤1)中,所述数据集使用的各个姿态的人脸图像全部来源于数据集Multi_Pie;数据集中的图片数目超过75万,包含了337个人的20种光照和15种姿态下的图像;图片的光照由光照标号01到20从暗变亮,其中光照标号07为标准光照条件;把数据集所有人脸图像标记为Ia,对每一张图像Ia,在数据集中找到同一个人、人脸偏转角为0°并且光照标号为07的图像,把它们标记为Ig。
3.根据权利要求1所述的一种基于生成对抗网络的多姿态人脸图像正面化方法,其特征在于:在步骤2)中,所述生成器G由姿态估算器P、编码器En,编码残差网络R和解码器De组成;所述姿态估算器P采用了PnP算法估算人脸姿态,进而求取人脸在yaw方向上的偏转角,由开源的opencv库的函数cv2.solvePnP()实现;所述编码器En是卷积神经网络,所述编码残差网络R是两层全连接神经网络,所述解码器De是反卷积神经网络;
所述生成器G合成图片的过程为:对生成器G输入任意姿态的人脸图像Ia,编码器En把它转化为初始编码X1,编码残差网络R通过初始编码X1估算出编码残差R(X1),姿态估算器P求取输入图像中人脸在yaw方向上的精确偏转角度γ,偏转角γ输入函数Y,得到编码残差的权重Y(γ),初始编码X1和编码残差融合得到修正编码X2,其中X2=X1+Y(γ)×R(X1),把修正编码X2输入到解码器De,通过反卷积生成正脸图像If。
4.根据权利要求1所述的一种基于生成对抗网络的多姿态人脸图像正面化方法,其特征在于:在步骤3)中,所述判别网络D是一个以卷积神经网络为基础的二分类器,用来判断输入的图像来源于生成器G还是原始图像数据;所述人脸身份特征提取器F采用已经开源的Light-CNN-29,Light-CNN29是一个轻量级卷积神经网络,深度为29层,参数数量有1200万。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910806159.5/1.html,转载请声明来源钻瓜专利网。