[发明专利]一种基于多层卷积神经网络的人体左/右眼图像判断方法在审
| 申请号: | 201910542194.0 | 申请日: | 2019-06-21 |
| 公开(公告)号: | CN110223294A | 公开(公告)日: | 2019-09-10 |
| 发明(设计)人: | 张小亮;戚纪纲;王秀贞;其他发明人请求不公开姓名 | 申请(专利权)人: | 北京万里红科技股份有限公司 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00 |
| 代理公司: | 北京东正专利代理事务所(普通合伙) 11312 | 代理人: | 张亦华 |
| 地址: | 100081 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 检测器 卷积神经网络 多层 左/右眼图像 眼图像 预处理 概率计算 目标函数 判断结果 人眼图像 神经网络 图像训练 选择概率 再利用 概率 构建 右眼 左眼 申请 | ||
1.一种基于多层卷积神经网络的人体左/右眼图像判断方法,其特征在于,该方法包括:
(1)建立基于多层卷积神经网络的检测器,输入人体左/右眼图像进行训练获得满足神经网络目标函数的检测器;
(2)对待判断的人眼图像进行预处理后输入(1)步的检测器中;
(3)检测器通过计算获得该人眼图像分别是左眼概率及右眼概率,选择概率大的结果作为最终判断结果。
2.根据权利要求1所述的基于多层卷积神经网络的人体左/右眼图像判断方法,其特征在于,步骤(1)中用于训练检测器的左/右眼图像在输入前需要经过预处理步骤,其图像预处理包括图像灰度化,图像金字塔缩放、图像亮度调整(增加或缩小)、图像添加噪声、图像模糊化,图像尺寸调整以及图像归一化操作。
3.根据权利要求2所述的基于多层卷积神经网络的人体左/右眼图像判断方法,其特征在于,图像尺寸调整的最终大小为48*48,这里指横向、纵向的像素点数。
4.根据权利要求1所述的基于多层卷积神经网络的人体左/右眼图像判断方法,其特征在于,步骤(1)建立的基于多层卷积神经网络的检测器构成为:由4层卷积核及3次maxpooling转换后再通过全链接操作转换为全链接层,该全链接层再次通过全链接操作的神经网络结构。
5.根据权利要求4所述的基于多层卷积神经网络的人体左/右眼图像判断方法,其特征在于,基于多层卷积神经网络的检测器的神经网络具体为:输入48×48大小的图像通过16个3×3卷积核和3×3,stride=2的max pooling后转换为16个23×23特征图;再通过32个3×3卷积核和3×3,stride=2的max pooling后转换为32个10×10特征图;再通过32个3×3卷积核和3×3,stride=2的max pooling后转换为32个4×4特征图;最后经过64个2×2的卷积核转换为64个3×3特征图;得到的64个3×3特征图通过全链接操作转换为64大小的全链接层,该全链接层经过全链接操作生成大小为2的左、右眼分类特征,即左、右眼图像几率。
6.根据权利要求1、4或5所述的基于多层卷积神经网络的人体左/右眼图像判断方法,其特征在于,基于多层卷积神经网络的检测器的神经网络的目标函数为:min∑iL(yi,f(xi;ω))+λΩ(ω),其中,xi为输入图像;yi为图像的类型标签,即左或右;ω为神经网络的参数;L(yi,f(xi;ω))为损失函数;f(xi;ω)为检测器预测函数,其中Ω(ω)作为L2正则函数。λ作为超参数通常设置为接近0的值数。
7.根据权利要求6所述的基于多层卷积神经网络的人体左/右眼图像判断方法,其特征在于,损失函数L为交叉熵形式,具体为:这里的y是图像的类型标签,是通过预测函数得到的概率预测值。
8.根据权利要求1所述的基于多层卷积神经网络的人体左/右眼图像判断方法,其特征在于,步骤(1)中用于训练的人体左/右眼图像是包括有完整的上、下眼皮以及眼角图像。
9.根据权利要求1所述的基于多层卷积神经网络的人体左/右眼图像判断方法,其特征在于,步骤(2)中的人眼图像预处理是将图像尺寸调整为48*48的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京万里红科技股份有限公司,未经北京万里红科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910542194.0/1.html,转载请声明来源钻瓜专利网。





