[发明专利]一种基于数据增强的三维人脸识别方法有效
| 申请号: | 202010406689.3 | 申请日: | 2020-05-14 |
| 公开(公告)号: | CN111753652B | 公开(公告)日: | 2022-11-29 |
| 发明(设计)人: | 于昊楠;张堃博;孙哲南;李加纬;胡清华 | 申请(专利权)人: | 天津大学;天津中科智能识别产业技术研究院有限公司 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V20/64;G06V10/82;G06V10/774;G06V10/26;G06V10/36;G06N3/04 |
| 代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 张义 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 数据 增强 三维 识别 方法 | ||
本发明公开了一种基于数据增强的三维人脸识别方法,该方法包括以下步骤:S1:数据增强;S2:数据预处理;S3:利用VGG‑16神经网络基础模型,进行参数和网络结构优化设计,构建针对三维人脸的专用识别网络;S4:将数据集划分为训练集与测试集,利用训练集对网络模型进行训练,在测试集上测验识别算法的性能;S5:利用训练好的识别网络模型,去掉最后一层全联接层,得到人脸特征向量,存储用于身份判定;S6:获取注册人脸的特征向量,与数据集中存储的特征进行比对,识别目标人物身份。本发明能够自动学习得到三维人脸的有效特征,特别是可解决在三维人脸识别中由于真实人脸三维数据难以获得而造成的识别网络过拟合、适用性差等学习难题。
技术领域
本发明涉及计算机视觉、人脸识别和机器学习等技术领域,特别是一种基于数据增强的三维人脸识别方法。
背景技术
人脸识别是一种高度非侵入性的生物识别技术,正迅速成为监视(例如边界控制,嫌疑犯跟踪,识别),安全性(例如系统登录,银行业务,文件加密),娱乐(例如人机交互,三维动画,虚拟现实)等领域的首选工具。深度学习的进步带来了各种计算机视觉任务的革命性改进,其中基于CNN的人脸识别被认为已经超越了人类的表现。
尽管二维人脸识别已经具有十分出色的性能和数据可用性,但二维人脸识别仍然受到光照,姿态和比例尺变化的挑战。此外,面部纹理对于身份而言并不总是稳定的,因为它会随着化妆和年龄而改变。三维人脸识别技术有能力解决这些问题,但是现有研究中并没有公开普遍认可的三维人脸数据的专用卷积神经网络模型。这主要是由于缺乏大量的三维人脸训练和测试数据,三维人脸数据无法像二维人脸数据一样通过网络爬虫自动获得,三维大规模数据集的采集和建设也需要花费巨大的时间和人力成本。目前已知最大的可公开使用的三维人脸数据集ND-2006(FRGCv2的超集)仅对888个唯一身份进行了13540次扫描,并且花费了两年多的时间进行收集和建设,而公开最大的二维人脸数据集包含近10万人的1000万张人脸图片。
数据增强是为了解决用于训练卷积神经网络的带标签三维人脸数据不足的问题。通过从现有的三维人脸模型创建合成的人脸仅限于特定模型的线性空间,从而导致人脸只有有限的形状变化。而通过引入表情变化的方法只能为每个对象生成更多扫描,而不会增加数据中唯一身份的数量。
近年来,人脸重建技术逐渐成熟,早期的基于3DMM模型重建系数的方法,迭代需要花费大量时间,而且基于模型的方法使得重建的人脸在几何形状上受限。为此,研究人员设计了新的UV位置图表示人脸,并使用卷积神经网络学习对应特征,实现基于单一图片的端到端的人脸重建过程。该方法可以达到实时转换的目的,并且可以得到完整的三维人脸信息。
因此充分利用以上方法的优势,我们可以将人脸重建技术用于增强三维人脸数据集,得到大量与二维数据相同身份的三维人脸数据,扩展现有的小规模三维人脸数据库。随后,我们可以使用增强的数据集训练卷积神经网络,来获取三维人脸的特征,从而实现高效可靠的三维人脸识别系统。
发明内容
基于上述,本发明的目的是提出一种基于数据增强的三维人脸识别方法,通过以单个人脸的三维点云数据作为输入数据可以直接获取目标人脸的三维特征信息,从而可以用来进行身份比对。本发明主要解决小规模数据库训练卷积神经网络易出现的过拟合和识别性能不佳等问题,从而获得可以在大规模数据场景中应用的三维人脸识别模型,更好的应对识别精确度对于人脸识别算法的要求。
为了实现上述目的,本发明提出的一种基于数据增强的三维人脸识别方法,所述方法包括如下步骤:
步骤S1,数据增强,基于容易获得的2D人脸图片重建三维人脸,从而增加原有三维数据集中的身份数量,实现三维人脸数据增强扩展;
步骤S2,数据预处理,利用人脸预处理方法,得到人脸区域内的点云数据,构建三通道数据,进行归一化处理,映射到RGB三通道数据,以三通道方式作为卷积神经网络的数据输入;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学;天津中科智能识别产业技术研究院有限公司,未经天津大学;天津中科智能识别产业技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010406689.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种涤纶高弹双色纱线及其制备方法
- 下一篇:一种黄精制品及其制备方法与应用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





