[发明专利]人脸识别方法和装置有效
申请号: | 201580074278.6 | 申请日: | 2015-01-27 |
公开(公告)号: | CN107209864B | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 汤晓鸥;王晓刚;孙祎 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 北京天健君律专利代理事务所(普通合伙)11461 | 代理人: | 罗延红,赵海娇 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 方法 系统 | ||
1.一种人脸识别装置,包括:
提取器,具有多个深度特征提取层,所述深度特征提取层被配置为从一个或多个输入图像提取识别特征;和
识别器,与提取器电连接,用于根据提取的识别特征识别输入图像中的人脸图像,
其中,每个深度特征提取层包括多个多卷积模块和多个池化模块,并且至少一个深度特征提取层还包括多个多路复合卷积模块,多路复合卷积模块包括一个或多个串接的复合卷积层;
其中,首个多卷积模块或者多路复合卷积模块从输入图像提取局部特征,并且后续的多卷积模块和多路复合卷积模块从与其连接的池化模块的模块输出的特征中提取进一步的局部特征,并且其中,每个池化模块从各自的多卷积模块和多路复合卷积模块接收局部特征并降低接收的特征的维度,和
其中,连接从各提取层获得的特征,作为所述识别特征的特征向量。
2.根据权利要求1所述的装置,其中,每个池化模块被设置在相邻的两个多卷积模块之间、一个多卷积模块和一个相邻的多路复合卷积模块之间,或者设置在相邻的两个多路复合卷积模块之间。
3.根据权利要求1所述的装置,其中,每个多路复合卷积模块对从为其设置的池化模块接收的特征,执行多尺度卷积操作,并且降低接收的特征的维度,
其中,除了每个深度特征提取层中的最后一个池化模块、最后一个多卷积模块或最后一个多个多路复合卷积模块以外,在每个深度特征提取层中的每个多卷积模块和每个多路复合卷积模块分别地跟随有一个池化模块,并且每个池化模块后跟随有一个多卷积模块或者一个多路复合卷积模块。
4.根据权利要求1或3所述的装置,其中,每个复合卷积层被配置为对输入特征图执行1×1卷积,以在更大的卷积操作之前和池化操作之后压缩输入特征图的数量。
5.根据权利要求4所述的装置,其中,每个复合卷积层包括:
一个或多个第一1×1卷积操作层,被配置为从在前的复合卷积层中的一个接收输入特征图,并对接收的特征图执行1×1卷积操作,以压缩接收的特征图的数量;
一个或多个多尺度卷积操作层,被配置为对从各自的1×1卷积操作层接收的压缩的特征图,执行N×N卷积操作,以形成多个第一输出特征图,其中N>1;
一个或多个池化操作层,被配置为从所述在前的复合卷积层接收输入特征图,以针对接收的特征图的局部区域进行池化,从而形成局部恒定的特征图;
一个或多个第二1×1卷积操作层,被配置为对所述局部恒定的特征图执行1×1卷积操作,以压缩所述特征图的数量从而获取多个第二输出特征图;和
一个或多个第三卷积操作层,被配置为从在前的复合卷积层接收输入特征图,并且对接收的特征图执行1×1卷积操作以所述压缩特征图的数量从而获取多个第三特征图;
其中第一特征图、第二特征图和第三特征图堆叠到一起,以形成用于输入下一复合卷积层的特征图。
6.根据权利要求1所述的装置,其中,每个多卷积模块包括一个或多个串接的卷积层,每个卷积层接收从前一卷积层输出的特征作为它的输入,并且每个卷积层被配置为对输入特征执行局部卷积操作,其中,所述卷积层仅在输入图像的局部区域中共享用于卷积操作的神经权重。
7.根据权利要求4所述的装置,其中,所述池化模块、多卷积模块或者多路复合卷积模块中的一个或多个跟随有全连接模块,所述全连接模块用于从相应的与其连接的池化模块、多卷积模块或者多路复合卷积模块提取全局特征。
8.根据权利要求7所述的装置,还包括:
训练器,与提取器电连接,用于在训练期间对一个或多个所述池化模块、所述多卷积模块、所述多路复合卷积模块和所述全连接模块施加监督信号,从而通过将所述监督信号反向传输到串接的多卷积模块和池化模块,或者到串接的多卷积模块、池化模块和多路复合卷积模块,调整深度特征提取层中的神经权重。
9.根据权利要求8所述的装置,其中,所述监督信号包括一个识别监督信号和一个验证监督信号,
其中,所述识别监督信号通过以下方式生成:将每个被监督模块的特征分类到训练数据集中的N个身份中的一个,并且将分类误差作为监督信号,所述特征从输入人脸区域提取,和
其中,所述验证信号通过以下方式生成:对每个被监督模块中的特征进行比较,并且将验证误差作为监督信号,所述特征分别从两个输入人脸图像提取并且用于确定它们是否来自同一人。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580074278.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有高效率的扩膜机
- 下一篇:玻璃盖板组件及3D显示装置