[发明专利]基于全卷积网络人脸五官定位与判别的方法及系统在审
申请号: | 201510980543.9 | 申请日: | 2015-12-23 |
公开(公告)号: | CN105354565A | 公开(公告)日: | 2016-02-24 |
发明(设计)人: | 石建萍;梁继;隋凌志 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 张晓霞 |
地址: | 100080 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 网络 五官 定位 别的 方法 系统 | ||
技术领域
本发明涉及图像处理的人脸识别领域,具体涉及一种基于全卷积网络人脸五官定位与判别的方法及系统。
背景技术
人脸作为人体的一个重要生物特征,近几年在图像处理,视觉技术,信息安全等领域有着越来越重要的作用。而人脸中,五官的判别与定位技术是人脸识别,人脸跟踪等应用的基础。现有的人脸五官定位技术主要通过预测一些预先设计的关键点,如眼角、眉梢、嘴角等实现。一般常见的人脸关键点个数为每张人脸21个关键点。而这种基于人脸关键点定位的方式由于关键点位置少,识别准确度和精度都不高,对于一些需要细节的应用,如美图、定妆等图像处理应用,则很难满足要求。
目前,利用人脸关键点定位的方式,为了达到美妆级别的精度,通常的做法是增加预测的关键点的数目,如将关键点个数增加为68个或106个。但该方法会遇到如下问题:1)增多的人脸关键点的标注数据仍不够多;2)68点或106点仍没有完全覆盖五官的边界,从关键点生成的五官区域通常是多边形,形状并不准确,依然难以达到美妆等应用的精度需求;3)人脸关键点会在边界上有小范围移动偏差(如眼睛中间的一点可能在前帧偏左,而后帧偏右),导致视频上的结果会有抖动。
发明内容
为了解决现有技术中,人脸五官识别的准确度和精度不高,无法满足多细节且高精度的应用需求的问题,本发明提出了一种基于全卷积网络人脸五官定位与判别的方法和系统。
该基于全卷积网络的人脸五官定位方法,包括:
步骤11:收集人脸图片并对人脸五官进行标注,形成一个训练数据集合;
步骤12:设计一个全卷积神经网络;
步骤13:利用步骤11中的训练数据集合对步骤12中设计的全卷积神经网络进行训练;
步骤14:利用步骤13已经训练好的全卷积神经网络,对人脸图片进行五官定位和标注。
该基于全卷积网络的人脸五官定位系统,包括:
收集标注模块,收集人脸图片并对人脸五官进行标注,形成一个训练数据集合;
神经网络设计模块,用于设计一个全卷积神经网络;
神经网络训练模块,用于利用收集标注模块中的训练数据集合对神经网络设计模块中设计的全卷积神经网络进行训练;
五官定位标注模块,利用神经网络训练模块中的已经训练好的全卷积神经网络,对人脸图片进行五官定位和标注。
本发明的基于全卷积网络的人脸五官定位方法与现有的基于人脸关键点定位的五官定位方法相比,本发明能够得到输入人脸图像每个像素点的类别,从而实现高精度的人脸五官识别,彻底解决了现有技术中关键点个数不足,生成的五官定位形状不准确,精度不高等问题。
本发明通过全卷积网络进行图像分割的方式,能够得到输入人脸每一点的预测类别,从而能够得到精确的五官位置,避免了基于人脸关键点的关键点不足以及关键点不够稳定的问题。
和公知的全卷积神经网络相比,本发明通过在卷积层之后增加两层反卷积层,将输出放大到与输入图片同样的大小。具体的,在第9层卷积化层之后,特征大小仅为原图的1/16,直接输出结果无法达到像素级别的精度。而通过之后的三层反卷积层,我们能够得到的输出具有像素级别精度的结果。通过学习反卷积的权重大小能够更好的得到更适宜的放大参数。利用该神经网络的分类结果如图3所示。
附图说明
图1是基于全卷积网络人脸五官定位与判别方法的流程图;
图2是全卷积网络的分层结构示意图;
图3是基于全卷积网络人脸五官定位与判别方法的结果示意图;
图4是基于全卷积网络人脸五官定位与判别系统的整体框架图。
具体实施方式
下面结合附图1-3和具体实施方式,对本申请中的基于全卷积网络人脸五官定位与判别方法做进一步详细的说明。
参见附图1所示,所述人脸五官定位与判别方法,包括如下步骤:
步骤11:收集人脸图片并对人脸五官进行标注,形成一个训练数据集合。
针对收集的人脸图片,手工标注五官类别。五官类别包括但不限于,脸部,左眼,右眼,左眉,右眉,鼻子,上嘴唇,下嘴唇,嘴中部,舌部,及背景。
为了获得更好的训练效果,优选的,手工标注为像素级别标注。针对收集的人脸图片,按照像素进行五官类别的标注,针对边界区域,按照最可能的归属类别进行标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510980543.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种收纳型圆筒凳
- 下一篇:一种用于厨房的餐具柜