[发明专利]一种人脸图片集的处理方法、装置、介质和计算设备有效
申请号: | 202110963419.7 | 申请日: | 2021-08-20 |
公开(公告)号: | CN113705650B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 刘弘业;洪伟;唐景群;姜波;胡光龙 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/762;G06V40/16 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片集 处理 方法 装置 介质 计算 设备 | ||
本公开的实施方式提供了一种人脸图片集的处理方法,包括:获取作为人脸识别的图片样本库的人脸图片集;对人脸图片集中的人脸图片分别进行头部姿态估计处理,确定对应的人脸偏转角度;对人脸图片集中的人脸图片分别进行图片质量评估,确定出对应的质量评分;将人脸偏转角度与质量评分作为聚类特征,构建对应的聚类特征向量;基于预设的无监督聚类算法,对聚类特征向量进行无监督聚类,并基于聚类结果删除人脸图片集中的低质量图片。通过以上技术方案,既无需大量人工参与,降低了人力成本,又加快了图片的清洗速度,缩短了清洗时间,极大的提高了数据清洗的效率;通过无监督聚类算法实现对图片的高低质量聚类,有效保证了图片筛选质量的可靠性。
技术领域
本公开的实施方式涉及人工智能技术领域,更具体地,本公开的实施方式涉及一种人脸图片集的处理方法、装置、介质和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
人脸识别技术,是一种基于人的脸部特征信息进行身份识别的技术。
目前,人脸识别技术主要由人脸检测、人脸对齐、人脸编码和人脸匹配四个部分组成。
举例来说,可以先通过人脸检测确定出人脸图像在图片中的位置信息,再通过人脸对齐将检测出的人脸图像对齐成统一标准的形状,然后通过人脸编码提取检测出的人脸图像的特征,最后通过人脸匹配将检测出的人脸图像的特征,与人脸数据样本库中预先存储的特征进行比对,根据相似度对人脸的身份信息进行判断。
由上述过程可知,人脸数据样本库的质量会直接影响人脸识别的准确性。因此,在构建人脸数据样本库时,需要对数据的质量进行筛选,这个过程也被称为数据清洗。
例如,可以采用人工的方式,获取图片,并对图片进行筛选,去除质量不佳的图片,再对筛选后的图片进行标注,截取出图片中的人脸图片来构建人脸数据样本库。
然而,在实际应用中,通常需要大批量的获取高质量人脸数据样本,如果仍采用人工进行数据清洗的方式,既费时又费力,效率过于低下。
发明内容
为此,非常需要一种省时省力的数据清洗方案,既可以降低人力成本,又可以提高数据清洗的效率。
在本上下文中,本公开的实施方式期望提供一种人脸图片集的处理方法及装置。
在本公开实施方式的第一方面中,提供了一种人脸图片集的处理方法,包括:
获取作为人脸识别的图片样本库的人脸图片集;
对所述人脸图片集中的人脸图片分别进行头部姿态估计处理,确定出所述人脸图片集中的人脸图片对应的人脸偏转角度;
对所述人脸图片集中的人脸图片分别进行图片质量评估,确定出与所述人脸数据集中的人脸图片对应的质量评分;
将所述人脸偏转角度与所述质量评分作为聚类特征,构建与所述人脸图片集中的人脸图片分别对应的聚类特征向量;
基于预设的无监督聚类算法,对所述与人脸图片集中的人脸图片分别对应的聚类特征向量进行无监督聚类,并基于聚类结果删除所述人脸图片集中的低质量图片。
在本公开的一个实施例中,所述方法还包括:
通过网络爬虫软件,从网络中爬取网络图片;
对爬取到的所述网络图片进行人脸检测,以确定所述网络图片中包含人脸特征的网络图片;
从所述包含人脸特征的网络图片中截取包含人脸特征的人脸图片,并基于截取出的人脸图片生成作为所述人脸识别的图片样本库的人脸图片集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110963419.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:耐高温宽频吸波/承载复合材料及其制备方法
- 下一篇:一种装配式护栏结构