[发明专利]一种基于mixup的人脸训练与识别方法有效
| 申请号: | 201910314170.X | 申请日: | 2019-04-18 | 
| 公开(公告)号: | CN110059625B | 公开(公告)日: | 2023-04-07 | 
| 发明(设计)人: | 马铁东;张云福 | 申请(专利权)人: | 重庆大学 | 
| 主分类号: | G06V40/16 | 分类号: | G06V40/16 | 
| 代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 | 
| 地址: | 400044 重*** | 国省代码: | 重庆;50 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 mixup 训练 识别 方法 | ||
本发明涉及一种基于mixup的人脸训练与识别方法,属于人工智能领域。该方法包括:S1:网络搭建;S2:人脸特征分类器的训练:构建虚拟训练样本来训练卷积神经网络;S3:人脸识别:包括摄像头的图像采集,人脸检测,人脸图像预处理,特征提取,人脸验证判断。本发明能够减少错误标签的开销,增强对抗样本的鲁棒性,稳定生成对抗网络的训练,最终提高网络训练的准确性,从而提高识别精度。
技术领域
本发明属于人工智能领域,涉及深度学习和人脸识别技术,尤其涉及一种基于mixup的人脸训练与识别方法。
背景技术
现如今人脸识别技术在移动支付、视频监控等多个领域有了广泛的应用,其中应用的深度学习技术也发展迅猛。为了提高人脸识别的准确率以及速率,当前主要有两个改进方向:(1)从改进神经网络结构入手,如增加网络深度和宽度,修改卷积和池化操作和修改激活函数等;(2)增加训练数据样本。大规模深度神经网络虽然具有强大的性能,但是会损耗巨大的内存,以及对对抗样本的敏感性不好。
并且训练神经网络时,一方面损失函数的ERM(经验风险最小化)允许大规模神经网络去记忆(而不是泛化)训练数据。另一方面,神经网络使用ERM方法训练后,在训练分布之外的测试样本上验证时会极大地改变预测结果。因此,ERM方法已不具有良好的解释和泛化性能。
本发明利用了基于mixup的训练方法能减缓这类问题。mixup规范神经网络,增强了训练样本之间的线性表达。
发明内容
有鉴于此,本发明的目的在于提供一种基于mixup的人脸训练与识别方法,减少错误标签的开销,增强对抗样本的鲁棒性,稳定生成对抗网络的训练,最终提高网络训练的准确性,从而提高识别精度。
为达到上述目的,本发明提供如下技术方案:
一种基于mixup的人脸训练与识别方法,包括以下步骤:
S1:网络搭建;
S2:人脸特征分类器的训练:构建虚拟训练样本来训练卷积神经网络;
S3:人脸识别:包括摄像头的图像采集,人脸检测,人脸图像预处理,特征提取,人脸验证判断。
进一步,步骤S2中,构建虚拟训练样本具体为:
其中,xi表示第i个样本图片,yi表示第i个样本图片的标签,代表训练网络的实际输入,代表网络的期望输出;且λ~Beta(α,α),mixup超参数α∈(0,∞);λ的值满足于Beta分布,是一种概率分布,使得在(0,1)上分布的概率密度积分等于1。
进一步,步骤S2中,所述人脸特征分类器的训练具体包括以下步骤:
S21:将卷积神经网络进行参数权值的初始化;
S22:对输入图片进行mixup操作,假设输入一张图片xi,同时在批训练样本中随机得到另一张图片xj,然后进行混合操作:将作为输入来训练神经网络;
S23:输入数据经过卷积层、池化层、全连接层等前向传播得到实际网络输出值y;
S24:将实际网络输出值y与期望输出值通过交叉熵代价函数计算误差LOSS;
S25:当误差超出允许范围时,将误差传回网络中,利用随机梯度下降法,依次求得全连接层、池化层、卷积层的参数误差,对网络参数进行权值更新,然后在转至步骤S22继续训练;当误差在允许范围内时,结束训练,保存参数。
进一步,步骤S3中,所述人脸识别具体包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910314170.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于检测活体的方法和装置
 - 下一篇:一种终端设备
 





