[发明专利]基于卷积神经网络的多通道人眼闭合识别方法有效
申请号: | 201711429165.0 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108038466B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 刘凡;李逸云;刘森斌;李雪宜;辛仰鑫 | 申请(专利权)人: | 河海大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 姜慧勤 |
地址: | 211100 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 通道 闭合 识别 方法 | ||
1.基于卷积神经网络的多通道人眼闭合识别方法,其特征在于,包括如下步骤:
步骤1,获取人眼训练图像,包括RGB彩色图像和近红外图像,分别对RGB彩色图像和近红外图像进行归一化处理后,融合成四通道图像,将四通道图像作为卷积神经网络的输入进行训练,且输入图像的大小为28*28像素;
步骤2,卷积神经网络依次包括第一卷积层、第一池化层、第二卷积层、第二池化层、全连接层;第一卷积层采用5个5*5的感受器对输入图像进行卷积,步长为1,得到20个24*24的特征图,将20个24*24的特征图经过Relu激活函数处理后,得到20个具有非线性因素的特征图;
步骤3,第一池化层采用最大池化方式对步骤2得到的20个具有非线性因素的特征图进行池化,其中,过滤器的大小为2*2,步长为2,得到20个12*12的特征图;
步骤4,第二卷积层采用20个5*5的感受器对步骤3得到的20个12*12的特征图进行卷积,得到20个8*8的特征图,将20个8*8的特征图经过Relu激活函数处理后,得到20个具有非线性因素的特征图;
步骤5,第二池化层采用最大池化方式对步骤4得到的20个具有非线性因素的特征图进行池化,其中,过滤器的大小为2*2,步长为2,得到20个4*4的特征图;
步骤6,全连接层对步骤5得到的20个4*4的特征图进行分类,得到训练好的卷积神经网络;
步骤7,采用Kinect相机获取人脸测试图像,包括RGB彩色图像和近红外图像,对人脸测试图像进行归一化处理后,融合成四通道图像,将四通道图像输入训练好的卷积神经网络中识别,得到识别结果。
2.根据权利要求1所述基于卷积神经网络的多通道人眼闭合识别方法,其特征在于,所述Relu激活函数的具体形式如下:
其中,Relu(x)表示激活函数的输出,x表示激活函数的输入。
3.根据权利要求1所述基于卷积神经网络的多通道人眼闭合识别方法,其特征在于,步骤2所述第一卷积层的实现过程为:采用可训练的感受器对输入图像进行卷积,然后加一个偏置,即得到该卷积层的卷积结果。
4.根据权利要求1所述基于卷积神经网络的多通道人眼闭合识别方法,其特征在于,步骤3所述第一池化层的实现过程为:采用最大池化方式进行池化,其中,过滤器为正方形,过滤器的边长与步长保持一致,再通过标量加权,增加偏置,产生缩小四倍的特征图,从而达到降维的目的。
5.根据权利要求1所述基于卷积神经网络的多通道人眼闭合识别方法,其特征在于,步骤1所述获取人眼训练图像所采用的相机为Kinect相机。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711429165.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便于调节高度的翻土机
- 下一篇:柑橘嫁接育苗方法