[发明专利]一种基于渐进校准式网络的实时多姿态人脸检测算法有效

专利信息
申请号: 202010471082.3 申请日: 2020-05-28
公开(公告)号: CN111739070B 公开(公告)日: 2022-07-22
发明(设计)人: 吴渊;金城;李雨晴 申请(专利权)人: 复旦大学
主分类号: G06T7/33 分类号: G06T7/33;G06T7/00;G06N3/04;G06N3/08;G06K9/62;G06V10/774
代理公司: 上海正旦专利代理有限公司 31200 代理人: 王洁平
地址: 200433 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 渐进 校准 网络 实时 多姿 态人脸 检测 算法
【权利要求书】:

1.一种基于渐进校准式网络的实时多姿态人脸检测算法,其特征在于,具体步骤如下:

(1)基于CASIAWebFace数据集,先进行遮挡物标注和人脸关键点定位,然后依次遮挡人脸合成和图像旋转,构造有遮挡、旋转的人脸数据集SOR;

(2)对步骤(1)中获得的SOR中的图像进行处理,对得到的人脸候选框进行由粗到细三个阶段的检测,每一个阶段都将人脸进行一定范围的角度校准,在最后一个阶段再对校准后的人脸图像进行最终的检测和精确角度判定;具体如下:

一)第一阶段,通过由输入层、卷积核大小为3*3步长为2的第一卷积层、卷积核大小为3*3步长为2的第二卷积层、卷积核大小为3*3步长为2的第三卷积层和全连接层组成的第一阶段网络模型对大量的候选人脸框进行粗略的筛选,同时对人脸候选框进行第一次角度判别,将所有人脸都校准至正脸方向,即角度范围[-90°,90°];

第一阶段网络模型的输入图像是对原图像使用滑动窗口的方式取得的,对于每一个滑动窗口所取得的图像,第一阶段有3个检测任务,分别是人脸/非人脸的分类、包围盒回归、旋转角度分类,如公式(1)所示:

[f,t,g]=F1(x) (1)

其中F1为第一阶段的人脸检测器,f为人脸置信度得分,通过对f设置阈值即可以去除置信度低的候选人脸框,t为表示人脸包围盒的特征向量,g为人脸方向的得分,即人脸为正脸的概率;

1)人脸/非人脸分类任务:对候选框进行人脸/非人脸的预测分类,该分类任务的损失函数使用了softmax损失函数,如公式(2)所示:

2)人脸包围盒回归任务:目标是回归精准的人脸包围盒,即长宽相等的正方形,其特征向量t由包围盒左上角坐标(a,b)和宽度w三个参数组成,其具体的计算方式如公式(3)所示:

其中带*上标的为该参数对应的真实值;

对于包围盒的特征向量t的回归任务,损失函数使用了smooth L1损失函数,如公式(4)所示:

3)旋转角度分类任务:在第一阶段中,将人脸的方向进行简单的二分类处理,即朝上和人脸或朝下和倒立,其损失函数如公式(5)所示:

根据上述三个任务的损失函数,得到第一阶段整个检测任务的总体损失函数如公式(6)所示:

其中λreg和λcal均为用于调整各个损失函数间比重的平衡因子;

通过对这个损失函数的迭代优化,第一阶段的网络模型即可实现过滤大量非人脸窗口的功能,余下则作为此阶段输出的人脸候选框,同时,可依据人脸方向的得分g,如公式(7)所示,将此阶段的人脸角度θ1做以下判别:

0°代表人脸朝上,180°代表人脸朝下;

经过第一阶段,将判断为朝下的人脸旋转180°,使得人脸被校准至朝上,即人脸旋转角度的范围从[-180°,180°]缩小为[-90°,90°];

二)第二阶段,第二阶段网络模型由输入层、卷积核大小为3*3步长为1的第一卷积层、卷积核大小为3*3步长为2的第一激活层、卷积核大小为3*3步长为1的第二卷积层、卷积核大小为3*3步长为2的第二激活层、卷积核大小为2*2步长为1的第三卷积层和全连接层组成;

第二阶段的人脸旋转角分类为3类,即[-90°,45°],[-45°,45°],[45°,90°]三个范围,对应的人脸旋转角3个分类如公式(8)所示:

其中gi为经过softmax计算后的旋转角分类概率;

经第二阶段,对于旋转角度不为0的两个分类,对人脸再次做相应的旋转校准,即对[-90°,45°]内的人脸旋转90°,对[45°,90°]内的人脸旋转-90°,使得所有的人脸都将处于[-45°,45°]的正脸角度范围内;

三)第三阶段,采用由输入层、卷积核大小为3*3步长为1的第一卷积层、卷积核大小为3*3步长为2的第一激活层、卷积核大小为3*3步长为1的第二卷积层、卷积核大小为3*3步长为2的第二激活层、卷积核大小为2*2步长为1的第三卷积层、卷积核大小为2*2步长为2的第三激活层、卷积核大小为2*2步长为1的第四卷积层和全连接层组成的第三阶段网络模型对候选人脸框进行精确的人脸检测、包围盒回归以及计算确切的人脸偏转角度;经过第三阶段网络模型对候选人脸框的处理,得到该阶段对旋转角度的精确预测值θ3,再结合前两阶段的校准角度θ1和θ2,计算出人脸完整的平面旋转角度θRIP,如公式(9)所示:

θRIP=θ123 (9)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010471082.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top