[发明专利]一种无需标注的人脸分割方法及系统有效
| 申请号: | 202210087333.7 | 申请日: | 2022-01-25 |
| 公开(公告)号: | CN114445441B | 公开(公告)日: | 2022-09-09 |
| 发明(设计)人: | 褚一平;张雪妮;朱华山;陈建勇;郑义;郁星星;陈士春;唐志学;潘翔;赵小敏;郑河荣;黄叶珏 | 申请(专利权)人: | 杭州海量信息技术有限公司 |
| 主分类号: | G06T7/136 | 分类号: | G06T7/136;G06T3/40 |
| 代理公司: | 北京盛询知识产权代理有限公司 11901 | 代理人: | 方亚兵 |
| 地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 无需 标注 分割 方法 系统 | ||
本发明公开了一种无需标注的人脸分割方法及系统,包括:根据标准证件照片的先验知识,生成第一训练数据集,通过设计人脸分割网络的结构和损失函数,构建第一集成人脸分割网络模型;利用第一集成人脸分割网络模型对标准人脸图像数据进行分割生成第二训练数据集,并对人脸分割网络进行训练,构造第二集成人脸分割网络模型;利用第二集成人脸分割网络模型对标准人脸图像数据进行分割,生成第三训练数据集;利用第一集成人脸分割网络模型对标准证件照片图像数据进行分割,生成第四训练数据集;通过第三训练数据集和第四训练数据集,对人脸分割网络进行训练,得到统一人脸分割网络模型,本发明无需人工标注,大大节约了成本,降低了产品开发难度。
技术领域
本发明涉及人脸处理领域,尤其涉及一种无需标注的人脸分割方法及系统。
背景技术
近几年深度学习技术取得了长足的进步,在大多数高层次的视觉任务中,深度学习技术比传统的方法具有明显的优势。目前在人脸相关的任务中,深度学习技术已占据了统治地位。但是深度学习技术需要大量的训练数据来训练模型才能取得良好的效果,而高精度的人脸分割数据的标注难度大、标注成本高,需要花费标注人员大量的时间。
发明内容
为了解决现有的技术问题,本发明的目的是设计一种无需标注的人脸分割方法不但可以节约成本而且可以大大加快产品的落地时间。
为了实现上述技术目的,本发明提供了一种无需标注的人脸分割方法,包括以下步骤:
根据标准证件照片的先验知识,构造图像标签生成和过滤规则,对证件照片图像数据进行处理生成第一训练数据集。设计高容错的人脸分割网络结构和损失函数,在第一训练数据集上训练,并集成各阶段的训练结果构建第一集成人脸分割网络模型。
利用第一集成人脸分割网络模型对标准人脸图像数据进行分割,采用最优阈值搜索的方法生成第二训练数据集。使用第二训练数据集对人脸分割网络进行训练,并集成其各阶段的训练结果构造第二集成人脸分割网络模型。
利用第二集成人脸分割网络模型对标准人脸图像数据进行分割,采用最优阈值搜索的方法生成第三训练数据集。利用第一集成人脸分割网络模型对标准证件照片图像数据进行分割,采用最优阈值搜索的方法生成第四训练数据集。把第三训练数据集和第四训练数据集按一定比例混合,对人脸分割网络进行训练直至收敛,得到统一人脸分割网络模型。
优选地,根据标准证件照片的先验知识,构造图像标签生成和过滤规则,将标准证件照片转化为灰度图像;
根据灰度图像,获取灰度图像的直方图;
根据直方图,生成用于图像分割的阈值;
通过阈值,对标准证件照片进行分割,生成标签图像。
优选地,在生成阈值的过程中,阈值的表达式为:
t*=argmaxtabs(H(t)-H(t-1)),t∈[200,255]
式中,t*表示阈值,H表示直方图;
生成标签图像的表达式为:
式中,G表示灰度图像,i为像素位置。
优选地,在生成训练数据集的过程中,通过从上到下的方式,统计标签图像的每一行的像素值为255的像素个数,生成投影数据PA,其中,投影数据PA的长度sz;
通过投影数据PA和长度sz,生成训练数据集。
优选地,生成训练数据集的方法包括:
从头到尾对投影数据PA进行搜索,当PA(0)=0时,则继续搜索,否则标签图像不符合要求,停止搜索;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海量信息技术有限公司,未经杭州海量信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210087333.7/2.html,转载请声明来源钻瓜专利网。





