[发明专利]一种基于可变形卷积网络的人脸检测方法及系统有效
申请号: | 201810542168.3 | 申请日: | 2018-05-30 |
公开(公告)号: | CN108764164B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 邹腊梅;李晓光;熊紫华;陈婷;杨卫东;李长峰;张松伟;黎云 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 曹葆青;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 变形 卷积 网络 检测 方法 系统 | ||
本发明公开一种基于可变形卷积网络的人脸检测方法及系统,包括:接收输入的图像,所述图像中包括待检测的人脸信息;通过主干网络提取图像的特征,所述特征包括语义特征和偏移量特征;通过可变形卷积分别输出图像的语义特征和偏移量特征;根据图像的语义特征,通过分类子网络输出锚点框包含人脸的概率;根据图像的语义特征,通过IOU预测分支输出各个预测框与人脸的重叠程度IOU;根据图像的偏移量特征,通过位置回归子网络输出各个预测框对应的人脸大小和位置。本发明可以准确预测图像中的人脸。
技术领域
本发明涉及图像处理、计算机视觉技术交叉领域,更具体地,涉及一种基于可变形卷积网络的人脸检测方法及系统。
背景技术
人脸检测是计算机视觉领域的热门研究方向,是许多与人脸相关的任务基础,如人脸识别,人脸属性识别,人脸关键点定位等。人脸检测在计算机视觉领域的应用十分广泛,包括视频安防、商场监控、门禁系统和通讯娱乐等。传统的人脸检测主要关注于设计复杂的图像特征并训练分类器,从而实现人脸检测。但是,人工设计特征的方法需要专家知识,检测效果也有待提高。深度学习通过多层卷积计算,将原始图像数据逐层抽象成自身任务所需的特征表示,实现端到端的学习。人脸检测的精度也随着深度学习的发展得到大幅的提高。
基于卷积神经网络(Convolutional Neural Network,CNN)的人脸检测通常包含人脸背景分类任务和人脸位置回归任务,两个任务共用卷积网络提取的语义特征。共用特征的形式存在缺陷,没有考虑到位置回归任务所需特征的特殊性,位置回归需要含有偏移信息的特征,导致人脸检测框的不准确。同时,普通卷积的采样方法固定,同一层感受野范围相同,对人脸的形变建模不足,仅仅输出人脸预测框概率会将一些背景分类为人脸,导致错误的检测。
发明内容
针对现有技术的缺陷,本发明的目的在于解决现有基于卷积神经网络的人脸检测没有考虑到位置回归任务所需特征的特殊性,位置回归需要含有偏移信息的特征,导致人脸检测框不准确,且对人脸的形变建模不足,仅仅输出人脸预测框概率会将一些背景分类为人脸,导致错误检测的技术问题。
为实现上述目的,第一方面,本发明提供一种基于可变形卷积网络的人脸检测方法,包括:
接收输入的图像,所述图像中包括待检测的人脸信息;
通过主干网络提取图像的特征,所述特征包括语义特征和偏移量特征;
通过可变形卷积分别输出图像的语义特征和偏移量特征;
根据图像的语义特征,通过分类子网络输出锚点框包含人脸的概率,所述锚点框为预设位置和预设大小的框,所述锚点框可以为多个;
根据图像的语义特征,通过IOU(intersection over union)预测分支输出各个预测框与人脸的重叠程度IOU,所述预测框为预测包含人脸信息的框;
根据图像的偏移量特征,通过位置回归子网络输出各个预测框对应的人脸大小和位置。
可选地,该方法还包括:根据人脸置信度对各个预测框排序,通过非极大值抑制NMS去除重复的预测框,所述人脸置信度为锚点框包含人脸的概率和各个预测框与人脸的重叠程度IOU的乘积。
可选地,设predbox为预测框面积,truthbox为真实框面积,IOU的计算公式为:
其中,真实框为真实包含人脸的框,是在制作数据集时,人工在图像上标注的人脸框。
可选地,可变形卷积网络用来输出人脸概率和人脸位置,其第一层为可变形卷积,可变形卷积的偏移特征图作为位置回归子网络的输入特征,位置回归子网络由一个3×3大小的卷积层负责,可变形卷积的语义特征后面接三个3×3大小的卷积,用于对人脸和背景分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810542168.3/2.html,转载请声明来源钻瓜专利网。