[发明专利]一种基于生成对抗网络改进结构的偏转人脸转正方法有效
| 申请号: | 202010269281.6 | 申请日: | 2020-04-08 |
| 公开(公告)号: | CN111523406B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 达飞鹏;胡惠雅 | 申请(专利权)人: | 东南大学 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/82;G06N3/0475 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 罗运红 |
| 地址: | 210000 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 生成 对抗 网络 改进 结构 偏转 转正 方法 | ||
1.一种基于生成对抗网络改进结构的偏转人脸转正方法,其特征在于,该方法包括以下步骤:
步骤1,对输入偏转人脸Iin进行特征点检测,并提取固定大小的人脸区域分块,即双眼、鼻部、嘴部;
步骤2,将步骤1得到的人脸区域分块与整体人脸分别输入局部通道和整体通道,得到二者转正后的结果;
步骤3,将局部通道的输出的转正后的人脸区域与整体通道的输出的整体人脸轮廓进行融合,将重叠区域的像素设定为该区域上的最大值,得到最终的生成人脸Ipred;
步骤4,将生成人脸Ipred与对应的正面人脸Igt先后输入判别器中,保证生成人脸的准确性,其中Igt是输入偏转人脸对应的正面人脸;
步骤5,将生成人脸Ipred与对应的正面人脸Igt同时输入分类器中,保证生成人脸与输入偏转人脸的身份一致性;
步骤6,将训练得到的生成对抗网络模型保存,测试时可对偏转人脸进行转正。
2.根据权利要求1所述的一种基于生成对抗网络改进结构的偏转人脸转正方法,其特征在于,步骤1具体为:
步骤1.1,将人脸尺寸大小统一归一化为128×128,并构建caffe深度学习环境;
步骤1.2,在caffe深度学习环境下,对人脸进行特征点检测,并定位出双眼中心点、鼻尖点、嘴角两侧点共五个特征点;
步骤1.3,根据步骤1.2中得到的五个特征点,得到人脸中的各个区域分块,即嘴部、鼻部、双眼,其中,将不同人脸之间的区域分块大小保持恒定,其中眼部区域大小设定为40×40,鼻部和嘴部则分别设定为32×40和32×48。
3.根据权利要求2所述的一种基于生成对抗网络改进结构的偏转人脸转正方法,其特征在于,步骤2具体为:
步骤2.1,对正面人脸Igt同样提取眼睛、鼻部、嘴部区域人脸分块,分别得到Eyelgt、Eyergt、Nosegt、Mouthgt;
步骤2.2:针对局部通道以及整体通道,设计生成器结构为U-Net结构,以保证生成前后图片的大小保持不变;
步骤2.3:对于局部通道,将步骤1得到的人脸区域分块输入局部通道生成器中,得到转正后的人脸区域分块,分别为Eyelpred、Eyerpred、Nosepred、Mouthpred,其中,局部通道的损失函数设计为L1损失函数,由以下几个部分组成:
其中,Weyel、Weyer、Wnose、Wmou分别对应左眼、右眼、鼻部、嘴部区域的宽度,数值上分别等于40、40、32、32,Heyel、Heyer、Hnose、Hmou则对应的是高度,数值上分别等于40、40、40和48,分别为转正后的左眼、右眼、鼻部、嘴部位于(x,y)坐标处的灰度值,则为对应正面人脸中各区域分块位于(x,y)坐标处的灰度值;
局部通道的损失函数则为各区域分块的损失之和,设定λ2为局部通道损失的权重值,那么局部通道的损失函数local_loss可表述如下:
local_loss=λ2*(eyel_loss+eyer_loss+nose_loss+mouth_loss)
步骤2.4:对于整体通道,将偏转人脸Iin输入到含3×3卷积核的编码器结构中,得到与原始人脸大小一样的128×128维正面人脸轮廓。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010269281.6/1.html,转载请声明来源钻瓜专利网。





