[发明专利]基于深度神经网络的人脸识别方法有效
| 申请号: | 201810048222.9 | 申请日: | 2018-01-18 |
| 公开(公告)号: | CN108304788B | 公开(公告)日: | 2022-06-14 |
| 发明(设计)人: | 王峰;高新波;王楠楠 | 申请(专利权)人: | 陕西炬云信息科技有限公司 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06K9/62;G06N3/04;G06V10/74 |
| 代理公司: | 西安新思维专利商标事务所有限公司 61114 | 代理人: | 李罡 |
| 地址: | 710065 陕西省西安市高新区唐延南都市*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 神经网络 识别 方法 | ||
1.一种基于深度神经网络的人脸识别方法,其特征在于:其方法步骤包括人脸检测,人脸对齐,特征提取和身份比对;
所述的人脸检测、对齐的方法为:
采用由粗到细的自动编码网络(CFAN)检测5个面部关键点,根据检测到的5个面部关键点旋转裁剪校准成256×256×3像素的正姿态人脸图片,通过级联多个栈式自编码网络,在越来越高分辨率的人脸图像上逐步优化人脸对齐结果;
所述的特征提取和身份比对的方法为:
采用10层深度人脸网络来提取人脸特征,所述的10层深度人脸网络包括7个卷积层和3个全连接层,通过训练和测试两部分进行区别;
具体的操作步骤为:
在训练部分先将裁剪校准后的人脸图像经过数据扩张输入第一个卷积层得到初级的图像特征,该图像特征经过ReLU非线性函数激活后通过池化Pooling操作在空间维度宽度和高度上进行降采样,之后输入到第二个卷积层得到新的特征,重复卷积步骤6次,直到网络到达最后一个卷积层,在重复的6次卷积步骤中,在第三个卷积层之后加入池化操作,将最后一个卷积层输出的高级特征通过两个全连接层和dropout随机失活操作进行逐层降维,之后输入最后一个全连接层做人脸的分类,最后一个全连接层即为一个softmax分类器;
卷积层和全连接层中的参数随着梯度下降被不断训练,直到网络收敛成一个能正确识别人脸特征的深度网络模型;在测试部分将对齐后的测试图像经过数据扩张输入至训练好的网络模型并提取第二个全连接层输出的2048维向量作为每个人脸图像的特征表示,身份比对使用余弦函数度量每个人脸特征之间的相似度,通过计算不同人脸图像特征的夹角余弦来进行特征比较,夹角余弦值越大,就越为同一人;
所述的数据扩张具体操作为:从大小为256×256图像中随机提取大小为225×225的块及其水平反射,提取得到的块上训练网络,在测试阶段,网络通过从输入图像中提取5个大小为225×225的块,5个分别为图像的四个角块和中心块,并提取它们的水平反射块,即共10个块进行预测,平均10个块在softmax层的输出作为预测结果;
所述的ReLU非线性激活函数为f(x)=max(0,x),该函数将小于0的神经元输出映射为0。
2.根据权利要求1所述的一种基于深度神经网络的人脸识别方法,其特征在于:所述的5个面部关键点为左右眼的中心,鼻尖,以及左嘴角和右嘴角。
3.根据权利要求1或2所述的一种基于深度神经网络的人脸识别方法,其特征在于:所述的池化操作指将特征图在空间维度宽度和高度上进行降采样,池化步长为2,尺寸大小为3×3。
4.根据权利要求3所述的一种基于深度神经网络的人脸识别方法,其特征在于:所述的dropout随机失活方法为神经元输出以0.5的概率被设置为0。
5.根据权利要求4所述的一种基于深度神经网络的人脸识别方法,其特征在于:所述的夹角余弦相似度度量为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西炬云信息科技有限公司,未经陕西炬云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810048222.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于卷积神经网络的道路目标检测方法
- 下一篇:脸部识别方法及装置





