[发明专利]一种基于分布独立性的3D人脸解耦表示学习方法有效
申请号: | 202010023676.8 | 申请日: | 2020-01-09 |
公开(公告)号: | CN111259745B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 余璀璨;张子辉;李慧斌;孙剑 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/82;G06V10/84;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 李晓晓 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分布 独立性 人脸解耦 表示 学习方法 | ||
一种基于分布独立性的3D人脸解耦表示学习方法,收集3D人脸数据集,将数据集分为训练集和测试集;根据训练目标对数据集全体数据进行预处理及配准;构造用于解耦表示学习的图卷积神经网络模型;使用训练集训练用于解耦表示学习的图卷积神经网络模型;训练完成后,用于解耦表示学习的图卷积神经网络模型将输入的3D人脸解耦为身份和表情两个部分。与基于3DMM的3D人脸解耦方法相比,本发明采用非线性表示,具有更强的3D人脸表示能力。与借助2D几何图像的3D人脸解耦方法相比,本发明直接作用于3D人脸网格,避免了将3D映射成2D图像造成的信息损失。
技术领域
本发明涉及一种学习方法,具体涉及一种基于分布独立性的3D人脸解耦表示学习方法。
背景技术
人脸的形状主要由身份及表情决定,由于人脸的表情丰富并且多变,易造成复杂的非线性形变,因此建立鲁棒的3D人脸模型是一项具有挑战性的任务。而学习身份、表情解耦的3D人脸模型对于人脸属性迁移、人脸重建、识别以及人脸动画等具有重要意义。
目前3D人脸解耦表示学习的方法主要分为两类:3D人脸的线性解耦表示;3D人脸的非线性解耦表示。3D人脸线性解耦表示方法一般基于3D可形变模型(3DMM),其通过主成分分析(PCA)分别学习一组3D人脸身份基底和表情基底后,可以优化3DMM参数以拟合任意3D人脸的形状。然而,这类方法局限于其线性性,PCA学习的基底表示能力有限,难以表达3D人脸细节以及夸张的表情。
现有的3D人脸非线性解耦表示方法多采用现将3D人脸映射成2D几何图像,再使用深度卷积神经网络实现解耦表示学习,而将3D人脸映射成2D图像的过程势必会造成信息损失。
发明内容
针对现有3D人脸解耦表示方法的不足,本发明的目的在于提供一种基于分布独立性的3D人脸解耦表示学习方法。
为实现上述目的,本发明采用如下的技术方案:
一种基于分布独立性的3D人脸解耦表示学习方法,包括以下步骤:
步骤1:收集3D人脸数据集,将数据集分为训练集和测试集;
步骤2:根据训练目标对数据集全体数据进行预处理及配准;
步骤3:构造用于解耦表示学习的图卷积神经网络模型;
步骤4:使用训练集训练用于解耦表示学习的图卷积神经网络模型;
步骤5:训练完成后,用于解耦表示学习的图卷积神经网络模型将输入的3D人脸解耦为身份和表情两个部分。
本发明进一步的改进在于,步骤2中,配准后,每个3D人脸样本用若干节点和边构成的网格M={V,A}表示;|V|=n代表3D欧氏空间中的n个节点,V∈Rn×3;稀疏邻接矩阵A∈{0,1}n×n表示节点之间的连接关系,Aij=0表示节点vi和vj之间没有连接,反之,Aij=1表示节点vi和vj之间有连接。
本发明进一步的改进在于,步骤3中,用于解耦表示学习的图卷积神经网络模型包括三个部分,分别为编码器、解码器和判别器;编码器输入3D人脸网格,输出对应的身份表示和表情表示,解码器的输入层为编码器的输出层的结果,解码器将身份表示和表情表示重建出3D人脸,判别器的输入层也连接编码器的输出层,用于判别身份表示与表情表示是否分布独立。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010023676.8/2.html,转载请声明来源钻瓜专利网。