[发明专利]基于神经网络进行识别的算法的人脸识别方法无效
申请号: | 200710042383.9 | 申请日: | 2007-06-21 |
公开(公告)号: | CN101329722A | 公开(公告)日: | 2008-12-24 |
发明(设计)人: | 杜凤 | 申请(专利权)人: | 上海北控智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200033上海市青浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 进行 识别 算法 方法 | ||
1.基于部件的多特征识别算法的人脸识别方法为了克服现有的人脸识别主要因人脸作为生物特征的特点所带来的难以实现的状况,本发明提供一种基于部件的多特征识别算法的人脸识别方法,该发明实现了一种基于部件的多特征识别算法的人脸识别方法过程的准确性,其特征是:
它的主要步骤包括:
1、人脸检测:判断输入图像中是否存在人脸,如果有,给出每个人脸的位置,大小;
2、面部特征定位:对找到的每个人脸,检测其主要器官的位置和形状等信息;
3、人脸比对:根据面部特征定位的结果,与库中人脸对比,判断该人脸的身份信息;
2.如1中所述,人脸检测的特征是:
人脸检测的原理是:识别人脸主要依据人脸上的特征,也就是说依据那些在不同个体之间存在较大差异而对于同一个人则比较稳定的度量.由于人脸变化复杂,因此特征表述和特征提取十分困难.在对人脸图像进行特征提取和分类之前一般需要做几何归一化和灰度归一化.几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大小,灰度归一化是指对图像进行光照补偿等处理,光照补偿能够一定程度地克服光照变化的影响而提高识别率。
3.如1中所述,面部特征定位的特征是:
面部特征定位的原理是:人脸识别技术是一种依据人的面部特征来自动进行身份鉴别的先进生物识别技术。系统通过摄像头获取人像面部的最重要特征,如人脸的突起部位,眉骨、双眼、鼻和嘴等在五官轮廓中的距离、位置、角度和大小,然后计算出它们的几何特征量,再与模板库中的人像进行比对和确认。这种技术与传统使用身份证、密码乃至虹膜识别、指纹、掌形扫描相比,具有识别精度高、直观性突出、基础资料容易获得和成本低等特点。
设计要素
之一:输入编码问题
显然,ANN的输入必然是图象的某种表示,因此采用怎样的方式对图象进行编码就成为设计的一大关键。我尝试对图象进行预处理,来分解出边缘、亮度、一致的区域或其他局部图象特征,然后把这些特征输入网络。实践中发现这种设计出现了每幅图象有不同数量的特征参数的问题,ANN要求输入单元的数量是固定的。经过反复探索,我把图象编码成固定的30×32亮度值,每个像素对应一个网络输入。并且把亮度是0~255的亮度值按比例缩放到0到1的区间内,以使网络输入与隐藏单元和输出单元在同样的区间取值。这里的30×32是原来120×128的低分辨率概括,每个低分辨率像素有与之对应的若干高分辨率像素亮度的均值计算得到。使用这样的低分辨率图象,把输入个数和权值的数量减少到了一个更易于处理的规模,从而降低了运算要求,但同时也保留了足够用于正确分类图象的分辨率。
之二:输出编码问题。ANN必须输出四个值中的一个来表示输入图象中人脸的朝向。我使用了n取1(1-of-n)方法来编码这四种情况的分类,即:四个不同的输出单元每一个对应四种可能性中的一种,取具有最高可能性的输出作为网络的预测值。选择n取1方法能为网络表示目标函数提供了更大的自由度;
此外在n取1编码中,最高输出和次高值输出间的差异可以作为对网络预测的置信度。这四个输出单元的目标值定为:<0.9,0.1,0.1,0.1>;编码脸向前<0.1,0.1,0.1,0.9>;编码脸向右<0.1,0.1,0.9,0.1>;编码脸向左<0.1,0.9,0.1,0.1>编码脸向后。避免使用0和1作为目标值是因为sigmoid单元对于有限权值不能产生这样的输出。如果企图训练网络来匹配目标值0和1,梯度下降会迫使权值无限增长。
之三:网络结构图。反向传播算法最普遍的一种网络结构是分层网络,一层的每个单元向前连接到下一层的每一个单元。我的设计也选择了这样的结构,使用了两层,包含一个隐藏层和一个输出层的分层前馈神经网络。
之四:学习算法的其他参数。在这个实验中,学习速率η被设定为0.3,冲量α被设定为0.3。赋予这两个参数更低的值会产生大体相当的泛化精度,但需要更长的训练时间。如果这两个值被设定得太高,训练将不能收敛到一个具有可接受误差的网络。在整个试验中我使用了完全的梯度下降。输出单元的网格权值被初始化为小的随机值。然而输入单元的权值被初始化为0,因为这样可以使学习到的权值可视化更易于理解,而对泛化精度没有明显的影响。训练的迭代次数的选择可以通过分割可用的数据为训练集合和独立的验证集合来实现。梯度下降方法被用于最小化训练集合上的误差,并且每隔50次梯度下降迭代根据验证集合评估一次网络的性能。最终选择的网络是对验证集合精度最高的网络。
之五:学习到的隐藏表示。分析网络中得到的2899个权值。考虑图中紧挨人脸图象下的四个矩形,每一个矩形描绘了网络中四个输出单元(编码了左、前、右、上)中的一个权值。每个矩形中的四个小方形表示和这个输出单元关联的四个权值——最左边是权w。,它决定单元的阈值;然后是连接三个隐藏单元到这个输出的三个权值。方形的亮度表示权值,亮白表示较大的正权值,暗黑表示较大的负权值,介于中间的灰色阴影表示中等的权值。
4.如1中所述,人脸比对的特征是
人脸比对的原理是:通过现场采集比对人脸图像,自动提取人脸特征后与人脸数据库进行比对,用来进行个人身份认证或相似人群查找。分析人脸关键特征点定位的结果,如果仅利用灰度图积分投影的峰谷来判定特征点的Y坐标位置,对于多样化的人脸结构和图像质量来说不够鲁棒,个别情况会发生较大误差。因此本文充分利用人脸结构的视觉先验知识,在对关键特征点定位时加入了经过训练的先验比例尺关系,即从额头到眼睛、眼睛到鼻孔、鼻孔到嘴巴和嘴巴到下颌的Y坐标比例关系,以嵌入式系统为平台,开发出人脸识别算法,在此基础上形成脱机应用的人脸自动识别产品。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海北控智能科技有限公司,未经上海北控智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710042383.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多用组合式体育器材
- 下一篇:电动工具轴承的防护片