[发明专利]一种抗网格效应的人脸深度预测方法有效
| 申请号: | 201810333873.2 | 申请日: | 2018-04-13 |
| 公开(公告)号: | CN108629291B | 公开(公告)日: | 2020-10-20 |
| 发明(设计)人: | 王兴政;章书豪;王好谦;方璐;戴琼海 | 申请(专利权)人: | 深圳市未来媒体技术研究院;清华大学深圳研究生院 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T7/50;G06N3/04 |
| 代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 刘莉 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 网格 效应 深度 预测 方法 | ||
1.一种人脸深度预测方法,其特征在于,所述人脸深度预测方法用于抗网格效应,包括如下步骤:
S1:搭建抗网格效应的卷积神经网络,所述卷积神经网络包括编码网络和解码网络,其中编码网络包括多个空洞卷积,以及每个空洞卷积串联连接的规范化操作和激励操作,所述解码网络包括多个像素反卷积,像素反卷积的数量与空洞卷积的数量相等,每个像素反卷积输出的特征图的大小是输入的特征图大小的两倍,所述像素反卷积充分考虑了上采样时像素之间的关系以用于消除网格效应;
S2:建立所需的人脸数据集,所述人脸数据集包括训练集和测试集,并且设置所述卷积神经网络的训练参数;
S3:对所述卷积神经网络进行权重初始化,将所述训练集输入初始化后的卷积神经网络中,根据所述卷积神经网络及其初始化的权重值,以最小化代价函数为目标来训练所述神经网络形成人脸图像深度预测神经网络模型;
S4:将所述测试集输入到所述人脸图像深度预测神经网络模型,输出能够反映人脸图像深度信息的图像。
2.如权利要求1所述的人脸深度预测方法,其特征在于:所述编码网络中的数个空洞卷积依次串联连接,每个空洞卷积的输出端依次串联规范化操作和激励操作,激励操作的输出端连接后一个空洞卷积的输入端,如此连接,在最后一个空洞卷积后依次串联多个像素反卷积;所述规范化操作采用Batch Normalization,所述激励操作采用Leaky Relu函数。
3.如权利要求1所述的人脸深度预测方法,其特征在于:所述空洞卷积的数量至少为4个,空洞卷积的空洞率服从锯齿波分布,并逐渐增大。
4.如权利要求3所述的人脸深度预测方法,其特征在于:所述空洞卷积为四个,其空洞率分别为1,2,5,9。
5.如权利要求1所述的人脸深度预测方法,其特征在于:所述步骤S3中的代价函数由正则项和损失项组成,如下:
其中,为正则项,为损失项,yi,yi*分别表示所述训练集中的第i张人脸图像经过所述卷积神经网络训练后所得到的像素的深度值,像素的ground truth值,n表示所述训练集的图像中有深度信息的像素点的个数,λ表示损失项的正则系数。
6.如权利要求1所述的人脸深度预测方法,其特征在于:所述步骤S2中还包括:对人脸数据集中的各RGB图像,生成其的深度信息ground truth图。
7.如权利要求1所述的人脸深度预测方法,其特征在于:所述卷积神经网络的输入为RGBD四通道的数据;其中D通道的数据的获取方式为:对深度信息ground truth图进行关键点检测,将这些关键点处的深度保留,其余舍去,所述关键点为人脸的眼睛、嘴巴和鼻子。
8.如权利要求5所述的人脸深度预测方法,其特征在于:所述正则系数λ在(0,1]范围内。
9.如权利要求1所述的人脸深度预测方法,其特征在于:所述步骤S3中对卷积神经网络进行权重初始化采用一维高斯分布,并利用AdamOptimizer方法来最小化所述代价函数。
10.如权利要求1所述的人脸深度预测方法,其特征在于:所述步骤S3中通过不断地最小化代价函数来更新卷积神经网络的权重值,直到代价函数的值不再减小,就停止更新,训练结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市未来媒体技术研究院;清华大学深圳研究生院,未经深圳市未来媒体技术研究院;清华大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810333873.2/1.html,转载请声明来源钻瓜专利网。





