[发明专利]一种基于强化学习的人脸识别方法有效
| 申请号: | 202010022574.4 | 申请日: | 2020-01-09 |
| 公开(公告)号: | CN111079717B | 公开(公告)日: | 2022-02-22 |
| 发明(设计)人: | 刘龙;罗彬;朱国华 | 申请(专利权)人: | 西安理工大学 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V20/40;G06V10/82;G06N3/04 |
| 代理公司: | 西安弘理专利事务所 61214 | 代理人: | 张皎 |
| 地址: | 710048 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 强化 学习 识别 方法 | ||
本发明公开一种基于强化学习的人脸识别方法,具体步骤包括:步骤1,采集多个包含人脸视频序列做为数据集;步骤2,对数据集中的所有视频序列做预处理后分为两部分,一部分为训练集、一部分为测试集;步骤3,建立强化学习网络,包括依次连接的输入层、3个卷积层和2个全连接层和输出层,所述输出层对应无遮挡、倾斜角度小的人脸图像;步骤4,采用步骤3建立的强化学习网络对训练集进行训练;步骤5,从测试集中选择一个视频序列,采用训练好的强化学习网络进行识别,输出无遮挡、倾斜角度小的人脸图像。解决了现有人脸识别技术中存在的人脸面部图像处于运动模糊、有遮挡、倾斜角度大、光照条件差等不利于识别的问题。
技术领域
本发明属于人脸识别技术领域,涉及一种基于强化学习的人脸识别方法。
背景技术
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。目前的人脸识别算法流程包含图像采集、人脸检测、人脸特征提取、人脸识别等。目前DeepFace、DeepID、FaceNet、Face++、SphereFace、CosFace等方法是深度人脸识别领域的主要方法。DeepFace、DeepID将人脸识别过程看作一个分类过程,只能识别固定类别的人脸。FaceNet、SphereFace、CosFace等通过网络学习两个人脸面部图像的相似度度量。后期人脸识别技术的研究重心就转向了损失函数的改进。
上述人脸识别方法均是对视频序列的每一帧中的人脸面部图像进行识别,在人脸面部图像处于运动模糊、有遮挡、倾斜角度大、光照条件差等不利于识别的情况时,不能对其进行充分的避免。
发明内容
本发明的目的是提供一种基于强化学习的人脸识别方法,解决了现有人脸识别技术中存在的人脸面部图像处于运动模糊、有遮挡、倾斜角度大、光照条件差等不利于识别的问题。
本发明所采用的技术方案是,
一种基于强化学习的人脸识别方法,具体步骤包括:
步骤1,采集多个包含人脸视频序列做为数据集;
步骤2,对数据集中的所有视频序列做预处理后分为两部分,一部分为训练集、一部分为测试集;预处理后的视频序列为去除非人脸帧后统一帧数,每一帧进行人脸分割并统一图像大小的视频序列;
步骤3,建立强化学习网络,强化学习网络包括依次连接的输入层、3个卷积层和2个全连接层和输出层,输入层对应整个视频序列Svideo和Sselect中的每一帧图像;输出层对应无遮挡、倾斜角度小的人脸图像;
强化学习网络的损失函数为:
θ为网络参数,N为一个batch的训练样本数,m为一次训练过程执行网络的次数,sj为第j次迭代所处的状态,aj为第j次迭代所执行的动作,πθ(sj,aj)是参数为θ的网络,输入是观察到的状态,输出执行动作的概率,h为输出层节点的个数;
步骤4,采用步骤3建立的强化学习网络对训练集进行训练,得到训练好的强化学习网络;
步骤5,从测试集中选择一个视频序列,采用训练好的强化学习网络进行识别,输出无遮挡、倾斜角度小的人脸图像。
本发明的特点还在于,
强化学习网络采用随机梯度下降法进行迭代更新;
输出层中采用Softmax函数作为输出;
强化学习网络的迭代次数与输出层节点个数的设置方法为:
设预处理之后的图像序列的帧数为a0,输出层节点数记为h,设置迭代次数为m,则存在
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010022574.4/2.html,转载请声明来源钻瓜专利网。





