[发明专利]一种基于多尺度池化的卷积神经网络人脸识别方法有效
申请号: | 201610288560.0 | 申请日: | 2016-05-04 |
公开(公告)号: | CN105975931B | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 刘云海;吴斯 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多尺度池化的卷积神经网络人脸识别方法。该方法利用多尺度池化的卷积神经网络来提取人脸图像的特征以实现人脸识别。在构建卷积神经网络的过程中,采用卷积和最大值采样交替的方法对特征进行深度提取,另外对每层卷积层采用了多尺度池化的策略和步骤,一并输入到全连接层,使其具有多尺度的、固定大小的特征列向量。本发明不需要对输入的人脸图像做截取或调整尺寸,不同尺寸的图像都能使用同一个网络进行训练和识别。基于多尺度池化的卷积神经网络不但解决了输入图像尺寸可以不固定的问题,使得网络能够提取多尺度的人脸特征,而且对网络性能带来极大的提升,将会促进多尺度池化的卷积神经网络在人脸识别中的广泛应用。 | ||
搜索关键词: | 一种 基于 尺度 卷积 神经网络 识别 方法 | ||
【主权项】:
1.一种基于多尺度池化的卷积神经网络人脸识别方法,其特征在于,该方法包括以下步骤:(1)采集t个人的标准人脸灰度图,其中每个人采集d张,得到d×t张标准人脸灰度图作为训练图像;每张训练图像对应一个t×1维的二值人脸类别标签向量ylable=[y1 y2 y3 … yt]T,其中第n个人脸图像的类别标签向量ylable中元素yi应满足以下条件:
(2)卷积神经网络参数初始化:所述卷积神经网络包含输入层I1、卷积层C2、池化层S3、卷积层C4、池化层S5、卷积层C6、多尺度池化层S7、多尺度池化层S8、多尺度池化层S9、全连接层L10、输出层O11;按照0为均值,0.01为标准方差的高斯分布来随机初始化卷积层C2的k个a×a像素的小块作为卷积核模板,定义为权重
此外对应位置的偏置
初始化为0;类似的,随机初始化卷积层C4的p个b×b大小的卷积核模板,定义为权重
和对应位置的偏置
随机初始化卷积层C6的q个c×c大小的卷积核模板,定义为权重
和对应位置的偏置
所有的权重Kij和偏置bj都是可训练的网络参数;(3)输入层I1:对输入大小为w×h的图像X(w,h不固定)的所有像素xi进行减均值和归一化的预处理,将预处理后的图像Xin作为输入层;(4)卷积层C2:由k个不同的特征图谱
组成,每个特征图谱由输入图像Xin分别与k个卷积核模板Kij进行卷积运算,卷积结果加上偏置bj,再经过一个激活函数ReLU(·)得到;每个特征图谱
具体计算公式为:
其中
代表步长为1的卷积运算,激活函数ReLU(x)=max(0,x);
的大小均为(h‑a+1)×(w‑a+1);(5)池化层S3:采用最大值采样对卷积层C2得到的结果进行统计计算;采样尺寸为m,采样方法为取采样区域的最大值,采样区域不重叠;池化层S3的每个特征图谱
由卷积层C2的每个特征图谱
下采样得到;采样后的水平和垂直空间分辨率变为原来的1/m,大小为(h‑a+1)/m×(w‑a+1)/m;(6)卷积层C4:特征图谱
通过卷积操作,由k个扩展至p个;特征图谱之间采用完全连接的机制,即卷积层C4的每个特征图谱
都与前一层的k个特征图谱连接,相连接的区域进行卷积操作,卷积结果加和并且加入偏置,再经过激活函数ReLU(·)得到;每个特征图谱
具体计算公式为:
其中
代表步长为1的卷积运算,激活函数ReLU(x)=max(0,x);(7)池化层S5:采用最大值采样,采样尺寸为n,采样方法为取采样区域的最大值,采样区域不重叠,采样后得到的p个特征图谱
的水平和垂直空间分辨率变为原来的1/n;(8)卷积层C6:特征图谱
通过卷积操作,由p个扩展至q个;特征图谱之间采用完全连接的机制,每个特征图谱
具体计算公式为:
其中
代表步长为1的卷积运算,激活函数ReLU(x)=max(0,x);(9)多尺度池化层S7:对卷积层C6的q个特征图谱
进行三种不同尺度size和步长stride的采样,使得输出空间块大小固定为1×1×q,2×2×q,3×3×q,具体计算公式如下:![]()
其中,
分别表示向上取整和向下取整,r×s为输入图像经过卷积层C6后得到的每个特征图谱
的大小;按照列的顺序展开得到1×q,4×q,9×q的特征矩阵,最后依次级联,成为固定尺寸的(14×q)×1特征列向量;(10)多尺度池化层S8:类似步骤(9)对卷积层C2的k个特征图谱
进行三种不同尺度和步长的采样,使得成为固定尺寸的(14×k)×1特征列向量;(11)多尺度池化层S9:类似步骤(9)对卷积层C4的p个特征图谱
进行三种不同尺度和步长的采样,使得成为固定尺寸的(14×p)×1特征列向量;(12)全连接层L10:3个多尺度池化层得到的特征列向量均通过全连接方式得到输出表达列向量Xfc,大小为f×1,f<(14×k);(13)输出层O11:全连接层L10得到的输出表达列向量Xfc,输入至t维的soft‑max分类器,得到分类结果标签向量youtput,最大值元素所在标号表示该图像属于该类别标签的人脸;(14)对于步骤(1)采集的d×t张人脸训练图重复步骤(3)~步骤(13),分别得到各自的t×1维的分类结果标签向量youtput,与步骤(1)中的ylable构成均方差误差代价函数,利用BP反向传播算法进行有监督训练,当均方差误差代价达到要求后完成训练,得到完整的多尺度池化卷积神经网络;(15)采集步骤(1)中t个人中任一个人的人脸图像作为测试人脸图像,通过步骤(3)~步骤(13)得到t×1维分类结果标签向量youtput,其最大值元素所在标号即为该测试人脸图像的类别标签,从而实现人脸识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610288560.0/,转载请声明来源钻瓜专利网。