[发明专利]一种基于眼鼻嘴分类的人脸定位方法在审
申请号: | 201711494703.4 | 申请日: | 2017-12-31 |
公开(公告)号: | CN107958238A | 公开(公告)日: | 2018-04-24 |
发明(设计)人: | 容李庆;袁亚荣;罗杰;林锴;汤俊杰;陈纯敏 | 申请(专利权)人: | 广州二元科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 广州凯东知识产权代理有限公司44259 | 代理人: | 姚迎新 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 眼鼻嘴 分类 定位 方法 | ||
1.一种基于眼鼻嘴分类的人脸定位方法,其特征在于包括以下步骤:
训练部分:训练眼鼻嘴三个部位的分类器,步骤如下:
1)收集和标记眼部、鼻、嘴部的训练样本以及不包含这三个部位的分类样本,数据样本共为四种,亦即为四分类的分类器;
2)定义一个神经网络;
3)输入样本进入神经网络进行训练,得到训练后的模型;
4)对样本的人脸进行对眼部、鼻、嘴部三个部位比例的分析和统计,得到一个符合大部分人脸中眼部、鼻、嘴部比例的位置结构;
5)为了在组合后得到更好的人脸框效果,还进行人脸框位置的校准神经网络模型;
6)组合校准神经网络所需要的样本数据训练得到校准的神经网络模型;
人脸定位流程:组合分类器对数字图像中的眼部、鼻、嘴部分类位置进行实现,步骤如下:
1)定义最小能定位的人脸尺寸,即最小人脸,根据最小人脸以及图像金字塔的缩放比例为基础对原图像进行缩放,形成图像金字塔;
2)定义滑窗的尺寸大小和步长,使用滑窗对图像金字塔中的所有图像进行扫描;
3)滑窗直至扫描所有金字塔中的图像,得到筛选框;
4)遍历待筛选框,寻求使用同一个鼻或嘴部的待筛选框,并将其合并;
5)对所有待筛选框应用非极大值抑制运算,得到待还原的人脸框;
6)将待还原的人脸框输入到校准神经网络中,得到最终的人脸位置坐标。
2.根据权利要求1所述的一种基于眼鼻嘴分类的人脸定位方法,其特征在于:
使用滑窗对图像金字塔中的所有图像进行扫描,其中扫描的处理情况又分为以下几种:
a)当扫描到的窗口存在眼部的时候,根据附图所示构建向左边和向右边的T字形状的框体,输入与之相对的矩形框中的矩阵数据入神经网络,判断是否为眼部;
b)根据附图所示抽取鼻位置的矩阵内容输入到神经网络,得到预测值,如果预测值大于阈值则认为该区域存在鼻;
c)当b)中确后在其下边缘构建一个矩形框,将框内的矩阵数据输入到神经网络中进行预测,当预测值大于阈值的时候则认为该区域存在嘴部;
d)如c)中确认后构建一个包含眼部、鼻和嘴部的矩形包围框,并加入到待筛选框中,在待筛选框中分别储存眼部、鼻和嘴部的位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州二元科技有限公司,未经广州二元科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711494703.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种指纹识别模组及电子设备
- 下一篇:一种基于图像的文本录入方法