[发明专利]基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统在审

申请号：	201710087134.5	申请日：	2017-02-17
公开（公告）号：	CN106897685A	公开（公告）日：	2017-06-27
发明（设计）人：	陈文胜;李育高;潘彬彬;陈波	申请（专利权）人：	深圳大学
主分类号：	G06K9/00	分类号：	G06K9/00
代理公司：	深圳市科吉华烽知识产权事务所(普通合伙)44248	代理人：	于标
地址：	518000 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于核非负矩阵分解字典学习稀疏特征表示识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及人脸识别技术领域，尤其涉及基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统。

背景技术

近年来，在计算机视觉与模式识别领域中，人脸识别已经成为最热门的研究方向之一。人脸识别系统被广泛地应用于我们的生活当中，例如公安刑侦破案、门禁系统、摄像监视系统、身份辨识、网络应用等。人脸识别服务于人们活动的各个重要方面，给人们带了便利、轻松的生活环境。

人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。在人脸识别当中，表示一张人脸图像最流行的方法是通过一组基图像的线性组合。非负矩阵分解(NMF)是一种典型的人脸识别方法，能够有效地提取人脸的局部化特征。对于一个非负矩阵X，NMF是为了找到两个非负矩阵W和H使得X≈WH，其中W和H分别被称为基图像矩阵和系数矩阵。W的每一列被叫作基图像，这些基图像是一些人脸的局部化特征，比如说鼻子、眼睛、耳朵、嘴巴等等。H的每一列是一个特征，这些特征是由非负的系数组成。如果X的每一列代表一张人脸图像，那么NMF能通过W中的局部化特征的线性组合来学习X中的每一整张人脸图像，这与通过组合物体部分来形成总体这一直观概念相符合。然而，非负矩阵分解算法是一种线性特征提取方法。由于人脸图像受到不同光照、不同姿势、不同表情等因素的影响，人脸图像的数据在模式空间中分布十分复杂，往往呈现出非线性结构，所以，当我们应用线性的算法(比如NMF)到人脸识别上时，就很难取得比较好的识别效果。为此，许多研究人员提出了一些非线性方法来克服这类问题。其中，核方法是一种流行的方法，它能够有效地提取模式的非线性特征，从而克服人脸图像数据呈现的非线性问题。核方法的基本思想是首先通过利用非线性映射φ将原始空间中的数据X映射到一个高维核空间中，使得新的数据φ(X)线性可分，然后在高维核空间中应用线性方法对新的数据φ(X)进行处理。在核方法中，核空间的维数一般远大于原始样本空间的维数，甚至有些是无穷维。作为一种非线性的方法，核非负矩阵分解(KNMF)是NMF的核方法，它克服了图像数据非线性问题。KNMF算法的主要思路是首先将通过非线性映射后的样本φ(X)，然后用高维核空间中的一组基近似地线性表出φ(X)，即φ(X)≈φ(W)H，系数矩阵H的每一列将作为原始样本X的新特征。在人脸识别上，实验结果表明KNMF优于线性NMF方法。

研究表明，提取的特征越稀疏，越有利于模式分类。因此，在人脸识别上，一些具有稀疏特征的非负矩阵分解算法被提出用来提高算法的识别性能。为了提高KNMF特征的稀疏度和判别力度，我们前面工作提出了一种分块核非负矩阵分解算法(BKNMF)。BKNMF通过利用了分块技巧，首先是对每一类的训练样本执行一种核非负矩阵分解，然后合并所有类的分解得到总的分解。在BKNMF执行的核非负矩阵分解与KNMF有所不同，前者通过利用每类的判别信息来减小类间的距离，因此比后者有更好的判别力度。BKNMF能够提取稀疏的非线性特征，并且来自不同类的特征是相互正交的。但是BKNMF的特征稀疏度还可以进一步提高，从而使识别性能提升。非负稀疏表示(NSR)方法是提取非负稀疏特征的有效方法。NSR的主要任务是解决一个带有l₀范数正则项的平方最小化问题。然而，这个最小化问题是一个NP难度问题。幸运的是，对非负稀疏表示的深入研究表明：当这个NP难度问题的解充分稀疏时，它能够用l₁范数正则项代替l₀范数正则项，从而转化成一个带有l₁范数正则项的凸优化问题。当数据呈现出非线性结构时，非线性的NSR通常比线性的NSR取得的分类会效果更好。作为一种非线性的NSR方法，基于核的非负稀疏表示(KNSR)有效地克服了数据呈非线性结构问题。KNSR的关键在于其稀疏学习字典，一般直接用映射后的训练样本矩阵作为稀疏表示字典，基于该字典在高维核空间中来提取新数据的非负稀疏特征。虽然KNSR能够提取数据的稀疏非线性特征，但是它的字典没有利用到模式的类标信息，即它是一种无监督的方法。因此，KNSR的性能在分类任务中会受到影响。本专利拟通过利用训练样本的类标信息来构造高性能稀疏学习字典，以提升KNSR的识别性能。

总之，在人脸识别中，虽然有各种各样方法被提出来克服各种问题，但是这些现有的方法都普遍存在一些问题：(1)当数据在模式空间中呈非线性分布时，线性算法的效果并不理想；(2)许多算法都是无监督的方法，即没有用到样本的类标信息，通常有监督的方法都会比无监督的方法取得的效果好；(3)许多方法提取的特征不足够稀疏，这会降低算法分类能力。

关键词解释：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳大学，未经深圳大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710087134.5/2.html，转载请声明来源钻瓜专利网。

上一篇：指纹识别组件及终端
下一篇：一种机载LIDAR电力巡检点云分类方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统在审

专利文献下载