[发明专利]一种基于多尺度池化的卷积神经网络人脸识别方法有效

申请号：	201610288560.0	申请日：	2016-05-04
公开（公告）号：	CN105975931B	公开（公告）日：	2019-06-14
发明（设计）人：	刘云海;吴斯	申请（专利权）人：	浙江大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06N3/08
代理公司：	杭州求是专利事务所有限公司 33200	代理人：	邱启旺
地址：	310027 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于多尺度池化的卷积神经网络人脸识别方法。该方法利用多尺度池化的卷积神经网络来提取人脸图像的特征以实现人脸识别。在构建卷积神经网络的过程中，采用卷积和最大值采样交替的方法对特征进行深度提取，另外对每层卷积层采用了多尺度池化的策略和步骤，一并输入到全连接层，使其具有多尺度的、固定大小的特征列向量。本发明不需要对输入的人脸图像做截取或调整尺寸，不同尺寸的图像都能使用同一个网络进行训练和识别。基于多尺度池化的卷积神经网络不但解决了输入图像尺寸可以不固定的问题，使得网络能够提取多尺度的人脸特征，而且对网络性能带来极大的提升，将会促进多尺度池化的卷积神经网络在人脸识别中的广泛应用。
搜索关键词：	一种基于尺度卷积神经网络识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于多尺度池化的卷积神经网络人脸识别方法，其特征在于，该方法包括以下步骤：(1)采集t个人的标准人脸灰度图，其中每个人采集d张，得到d×t张标准人脸灰度图作为训练图像；每张训练图像对应一个t×1维的二值人脸类别标签向量y_lable＝[y₁ y₂ y₃ … y_t]^T，其中第n个人脸图像的类别标签向量y_lable中元素y_i应满足以下条件：(2)卷积神经网络参数初始化：所述卷积神经网络包含输入层I1、卷积层C2、池化层S3、卷积层C4、池化层S5、卷积层C6、多尺度池化层S7、多尺度池化层S8、多尺度池化层S9、全连接层L10、输出层O11；按照0为均值，0.01为标准方差的高斯分布来随机初始化卷积层C2的k个a×a像素的小块作为卷积核模板，定义为权重此外对应位置的偏置初始化为0；类似的，随机初始化卷积层C4的p个b×b大小的卷积核模板，定义为权重和对应位置的偏置随机初始化卷积层C6的q个c×c大小的卷积核模板，定义为权重和对应位置的偏置所有的权重K_ij和偏置b_j都是可训练的网络参数；(3)输入层I1：对输入大小为w×h的图像X(w,h不固定)的所有像素x_i进行减均值和归一化的预处理，将预处理后的图像X_in作为输入层；(4)卷积层C2：由k个不同的特征图谱组成，每个特征图谱由输入图像X_in分别与k个卷积核模板K_ij进行卷积运算，卷积结果加上偏置b_j，再经过一个激活函数ReLU(·)得到；每个特征图谱具体计算公式为：其中代表步长为1的卷积运算，激活函数ReLU(x)＝max(0,x)；的大小均为(h‑a+1)×(w‑a+1)；(5)池化层S3：采用最大值采样对卷积层C2得到的结果进行统计计算；采样尺寸为m，采样方法为取采样区域的最大值，采样区域不重叠；池化层S3的每个特征图谱由卷积层C2的每个特征图谱下采样得到；采样后的水平和垂直空间分辨率变为原来的1/m，大小为(h‑a+1)/m×(w‑a+1)/m；(6)卷积层C4：特征图谱通过卷积操作，由k个扩展至p个；特征图谱之间采用完全连接的机制，即卷积层C4的每个特征图谱都与前一层的k个特征图谱连接，相连接的区域进行卷积操作，卷积结果加和并且加入偏置，再经过激活函数ReLU(·)得到；每个特征图谱具体计算公式为：其中代表步长为1的卷积运算，激活函数ReLU(x)＝max(0,x)；(7)池化层S5：采用最大值采样，采样尺寸为n，采样方法为取采样区域的最大值，采样区域不重叠，采样后得到的p个特征图谱的水平和垂直空间分辨率变为原来的1/n；(8)卷积层C6：特征图谱通过卷积操作，由p个扩展至q个；特征图谱之间采用完全连接的机制，每个特征图谱具体计算公式为：其中代表步长为1的卷积运算，激活函数ReLU(x)＝max(0,x)；(9)多尺度池化层S7：对卷积层C6的q个特征图谱进行三种不同尺度size和步长stride的采样，使得输出空间块大小固定为1×1×q，2×2×q，3×3×q，具体计算公式如下：其中，分别表示向上取整和向下取整，r×s为输入图像经过卷积层C6后得到的每个特征图谱的大小；按照列的顺序展开得到1×q，4×q，9×q的特征矩阵，最后依次级联，成为固定尺寸的(14×q)×1特征列向量；(10)多尺度池化层S8：类似步骤(9)对卷积层C2的k个特征图谱进行三种不同尺度和步长的采样，使得成为固定尺寸的(14×k)×1特征列向量；(11)多尺度池化层S9：类似步骤(9)对卷积层C4的p个特征图谱进行三种不同尺度和步长的采样，使得成为固定尺寸的(14×p)×1特征列向量；(12)全连接层L10：3个多尺度池化层得到的特征列向量均通过全连接方式得到输出表达列向量X_fc，大小为f×1,f<(14×k)；(13)输出层O11：全连接层L10得到的输出表达列向量X_fc，输入至t维的soft‑max分类器，得到分类结果标签向量y_output，最大值元素所在标号表示该图像属于该类别标签的人脸；(14)对于步骤(1)采集的d×t张人脸训练图重复步骤(3)～步骤(13)，分别得到各自的t×1维的分类结果标签向量y_output，与步骤(1)中的y_lable构成均方差误差代价函数，利用BP反向传播算法进行有监督训练，当均方差误差代价达到要求后完成训练，得到完整的多尺度池化卷积神经网络；(15)采集步骤(1)中t个人中任一个人的人脸图像作为测试人脸图像，通过步骤(3)～步骤(13)得到t×1维分类结果标签向量y_output，其最大值元素所在标号即为该测试人脸图像的类别标签，从而实现人脸识别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大学，未经浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610288560.0/，转载请声明来源钻瓜专利网。

上一篇：一种智能动态人脸识别社区管家服务系统
下一篇：带阻流板结构的1/4椭圆折面螺旋折流板换热器

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多尺度池化的卷积神经网络人脸识别方法有效

专利文献下载