[发明专利]人脸数据验证的方法和系统在审

申请号：	201480077293.1	申请日：	2014-03-28
公开（公告）号：	CN106663184A	公开（公告）日：	2017-05-10
发明（设计）人：	汤晓鸥;陆超超	申请（专利权）人：	华为技术有限公司
主分类号：	G06K9/00	分类号：	G06K9/00
代理公司：	暂无信息	代理人：	暂无信息
地址：	518129 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	数据验证方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种人脸数据验证的方法及其系统。

背景技术

人脸验证是一项确定一对人脸图像是否来自同一个人的任务，其数十年来在计算机视觉领域中一直是一个活跃的研究课题。它有很多重要应用，包括个人计算机或移动设备的监控、访问控制、图像获取以及自动登录。然而，各种视觉混乱降低了人脸验证的性能。对自然界中真实人脸图像的许多研究尤其证明了这点。

现代人脸验证方法主要分为两类：提取底层特征以及构建分类模型。尽管这些现有方法在人脸验证方面取得了巨大进步，但是它们大多数在处理复杂数据分布时缺乏灵活性。对于第一类中的方法，手工制作底层特征，等等。甚至对于从数据中得到的特征，算法参数(诸如随机投影树的深度，或者k-means的中心的数目)也需要由用户指定。类似地，对于第二类中的方法，神经网络架构(例如，层的数目、每层节点的数目，等等)以及模型的参数(例如，高斯的数目、分类器的数目，等等)也必须提前确定。由于大多数现有方法需要对数据结构做出假设，所以它们在假设无效的情况下无法很好地执行。而且，由于假设存在，使用这些方法很难捕获数据的内在结构。

大多数现有的人脸验证方法适用于根据下面的基本假设来处理验证任务：训练数据和测试数据从相同特征空间提取并遵循相同分布。当分布改变时，这些方法的性能可能下降很多。然而，许多实际场景涉及从不同人脸外观分布中提取的跨域数据。在新场景中很难重新收集必要的训练数据和重建模型。而且，指定的目标域中通常没有足够的训练数据来训练足够好的模型以进行高准确的人脸验证，这是因为源数据不够多样化而导致过度拟合这一事实。在这些情况下，利用多个源域中的更多数据来提高目标域中人脸验证方法的性能变得尤其重要。

发明内容

为了解决这些问题，本发明提出了基于判别高斯过程隐变量模型的多任务学习方法(Multi-Task Learning approach based on Discriminative Gaussian Process Latent Variable Model，MTL-DGPLVM)用于人脸验证。所述MTL-DGPLVM模型以高斯过程(Gaussian Process，GP)为基础，所述GP是一种非参数贝氏核方法。

本发明采用GP方法，主要是因为以下三个显著优点中的至少一个。首先，它是一个非参数方法，这意味着它很灵活且能够覆盖现实中的复杂数据分布。其次，GP方法能够高效计算，因为它的边缘概率是一个封闭形式的表达式。此外，其超参数能够在不使用交叉确认等模型选择方法的情况下自动从数据中得到，从而避免了高计算成本。最后，GP的推理以基于贝氏法则为基础，从而导致抗过拟合性。

根据本发明一项实施例，判别信息约束用于增强GP的判别能力。考虑到GP依赖于协方差函数，将核Fisher判别分析(Kernel Fisher Discriminant Analysis，KFDA)作为判别正则化项采用是符合逻辑的。为了利用多个源域中的更多数据来提高目标域中的性能，本发明还将多任务学习约束引入到GP中。这里，本发明研究非对称多任务学习，因为本发明仅注重目标任务的性能提高。从信息理论的角度来看，这种约束是为了使目标域数据与多个源域数据的分布之间的交互信息最大化。所述MLT-DGPLVM模型能够使用梯度下降方法进行有效优化。

所提出的MLT-DGPLVM模型能够以两种不同方式应用于人脸验证：作为二元分类器以及作为特征提取器。在第一种方式中，假如有一对人脸图像，直接计算每类的后验似然以做出预测。在第二种方式中，自动提取每对人脸图像的高维特征，然后将它们传送到分类器以做出最终决定。

一方面，公开了一种人脸数据验证的方法，包括以下步骤：

从第一数据库中获取多个源域数据集以及从不同于所述第一数据库的第二数据库中获取目标域数据集；

确定与目标域数据集最佳匹配的隐子空间以及根据所述目标域数据集和所述源域数据集确定所述确定的隐子空间的后验分布；

确定在所述目标域数据集和所述源域数据集之间共享的信息；以及

根据所述后验分布P以及关于所述目标域数据集和所述源域数据集的所述共享信息M建立多任务学习模型。

本发明的另一方面，公开了一种人脸数据验证的装置，包括模型建立模块，其中所述模型建立模块包括：

获取单元，用于从第一数据库中获取多个源域数据集以及从不同于所述第一数据库的第二数据库中获取目标域数据集；以及

模型建立器，用于：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华为技术有限公司，未经华为技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】