[发明专利]一种基于眼鼻嘴分类的人脸定位方法在审
申请号: | 201711494703.4 | 申请日: | 2017-12-31 |
公开(公告)号: | CN107958238A | 公开(公告)日: | 2018-04-24 |
发明(设计)人: | 容李庆;袁亚荣;罗杰;林锴;汤俊杰;陈纯敏 | 申请(专利权)人: | 广州二元科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 广州凯东知识产权代理有限公司44259 | 代理人: | 姚迎新 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 眼鼻嘴 分类 定位 方法 | ||
技术领域
本发明涉及一种基于眼鼻嘴分类的人脸定位方法。
背景技术
在数字化技术和人工智能普遍开始实现的当下,人脸定位技术和人脸识别技术得到了很大的发展和进步。在由Paul Viola与Michael Jones于2001年发表的论文《Rapid Object Detection using a Boosted Cascade of Simple》论文中提出了一种基于哈尔特征级联(V-J级联)实现的人脸定位方法。在该方法中使用哈尔特征对人脸和非人脸进行分类,利用积分图像的方法加速对哈尔特征的统计,使用多层哈尔特征分类器对数字图像中的人脸进行定位。该方法提出的级联分类器的方式为后面的人脸定位技术奠定了基础。并且使用积分图像加速哈尔特征的计算,使得该方法可以在实时的场景下得以应用。
但是通过哈尔特征对人脸和非人脸进行分类存在较大的局限性,一方面哈尔特征的准确度相对较低(神经网络),另一方面在侧脸或者人脸形态较多的情况下得到的分类效果更显得差强人意。
为了满足现实世界中人脸形态各异的分类和定位,提高人脸非人脸分类器的准确性,目前较为通用的实现方法是利用深度学习中的神经网络形成级联,对数字图像中的人脸进行分类以及定位。如《Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks》论文中提出的基于三个神经网络形成级联的方式对数字图像中的人脸进行分类和定位。
神经网络相对于哈尔特征而言,其计算量更大,算法更为复杂,但是可以得到更好的准确率。在使用神经网络进行级联形成的人脸定位中,由于存在多层神经网络,每张待检测的数字图像均经过多级的神经网络进行计算,最终得到结果。
无论是使用哈尔特征还是神经网络进行的级联,由于需要经过多级的神经网络计算,在实现速度上均有所影响。而且在级联的系统中为了得到更好的分类效果,尤其是为了提高分类的鲁棒性,往往需要加入各种形态的人脸(数字图像)样本加入训练。因为级联中越高级的分类器将更具有对样本的拟合性。这样就给训练实施工作带来很大的开支。
在利用五官进行人脸定位的文献《From Facial Parts Responses to Face Detection:A Deep Learning Approach》中提出了一种基于对头发、眼部、鼻、嘴部和下巴进行识别进而推算出人脸位置的方法。在该方法中训练神经网络和识别的过程需要对图像进行逐像素计算,对输入图像的每个像素进行分类,进而构建一张关于头发、眼部、鼻、嘴部和下巴的平面映射图,利用该映射图和头发、眼部、鼻、嘴部和下巴的空间比例(训练得来)分类和推算人脸部位。该方案由于使用为全卷积的神经网络,并且输入尺寸较大(256x256),使用的卷积神经网络结构较为复杂,一方面在执行效率上无法达到实时的效果,特别地是在当前移动终端中,如智能手机、平板电脑和嵌入式体验终端中需要更长的时间对单张原图进行运算和定位。另一方面,由于该方法训练中为逐像素进行分类,给训练特别是样本的收集和处理带来了很大的成本开销,而且在组合头发、眼部、鼻、嘴部和下巴的比例中也使用到了神经网络进行对比例的训练和运算,整体执行效率和时间又有所拖延。
发明内容
本发明提出一种在数字图像中对眼、鼻和嘴进行分类,进而推断是否包含人脸的基于眼鼻嘴分类的人脸定位方法,利用眼、鼻和嘴这几个特征部位的坐标位置推算人脸位置的坐标,最终达到对人脸定位的目的。
为解决上述技术问题,本发明所采用的技术方案是:
一种基于眼鼻嘴分类的人脸定位方法,包括以下步骤:
训练部分:训练眼鼻嘴三个部位的分类器,步骤如下:
1)收集和标记眼部、鼻、嘴部的训练样本以及不包含这三个部位的分类样本,数据样本共为四种,亦即为四分类的分类器;
2)定义一个神经网络;
3)输入样本进入神经网络进行训练,得到训练后的模型;
4)对样本的人脸进行对眼部、鼻、嘴部三个部位比例的分析和统计,得到一个符合大部分人脸中眼部、鼻、嘴部比例的位置结构;
5)为了在组合后得到更好的人脸框效果,还进行人脸框位置的校准神经网络模型;
6)组合校准神经网络所需要的样本数据训练得到校准的神经网络模型;
人脸定位流程:组合分类器对数字图像中的眼部、鼻、嘴部分类位置进行实现,步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州二元科技有限公司,未经广州二元科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711494703.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种指纹识别模组及电子设备
- 下一篇:一种基于图像的文本录入方法