[发明专利]用于数据扩增的方法、装置和系统、计算机可读存储介质在审

专利信息
申请号: 201810044176.5 申请日: 2018-01-17
公开(公告)号: CN108256473A 公开(公告)日: 2018-07-06
发明(设计)人: 曾玲 申请(专利权)人: 北京绽放时代科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/04
代理公司: 北京康盛知识产权代理有限公司 11331 代理人: 张宇峰
地址: 100041 北京市石景山区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 扩增 深度特征 特征图 计算机可读存储介质 原始图像信息 数据集合 训练样本 原始图像 有效地实现 本质信息 人脸识别 分类器 图像 网络
【说明书】:

实施例公开一种用于数据扩增的方法,包括:接收原始图像信息,所述原始图像信息为一数据集合中的训练样本;获得所述原始图像的多张特征图;其中,每张特征图都包括所述原始图像的深度特征信息;对每张特征图进行扩展,获得每张特征图的多张扩展图;并,将所述多张特征图的所有扩展图作为训练样本加入所述数据集合。该实施例提出一种基于深度特征信息的数据扩增方式,由于在图像的深度特征信息的基础上进行的数据扩增,因此能从物体的深度特征出发找到物体本质信息。将基于深度特征信息的数据扩增技术和人脸识别网络相结合,能够更加有效地实现对识别分类器的训练。实施例还公开一种用于数据扩增的装置和系统,及计算机可读存储介质。

技术领域

发明涉及人工智能技术领域,特别涉及一种用于数据扩增的方法、装置和系统,及计算机可读存储介质。

背景技术

人脸识别技术是计算机视觉应用中的一个重要环节,在很多实际应用场景中有着广泛的使用前景。人脸识别技术主要可以分成两种任务:人脸验证技术和人脸归类技术。验证技术需要输入两张人脸,通过运算判断两张人脸是否为同一个人。归类技术和验证技术有一定的区别,其先对一张图片进行特征提取,然后将该图片的特征和数据库中所有图片特征进行比对,选出该照片是数据库中的哪一个人。随着深度学习的不断发展,针对人脸识别的深层神经网络结构越来越多。随之而来的是关于训练数据集的需求不断增大。

当前在用于训练人脸识别模型的公开数据集中,不可避免的存在一些样本含有的人脸数量比较少的问题。这会对人脸识别归类问题的训练过程造成很大的影响。在归类问题的训练过程中,会根据每一个人划分成不同的分类。只有每一个分类中有充分的数据,才能够保证该分类具有良好的区分性。数据集合不平衡会造成如果在训练集合中该人的照片特别少,会使得在该类别的训练不准确,从而不具有很好的区分性。这种存在某个样本类人脸数目过少的情况被称做数据集合的不平衡。

只有能够很好的解决数据集合不平衡的问题,才能够保证我们在训练过程中,充分地训练出具有较好区分性的人脸识别模型。因此提出了融合扩增技术的人脸识别算法,在进行人脸识别模型训练前,利用扩增技术平衡数据集合,然后在进行识别任务的训练和处理。

随着扩增技术对人脸识别任务的积极作用被证实,越来越多的扩增方式开始使用在识别过程中。其中广泛应用在人脸识别技术中的数据扩增方式包括:镜像(mirroring)、随机裁剪(random cropping)、旋转(rotating)等。镜像扩增方式,将输入的原图进行水平的镜像处理。新生成的图片作为扩增后的数据送入数据集合之中进行训练。裁剪扩增对图像边界上的像素进行随机的裁剪。旋转扩增在原图的基础上,选定一个旋转角度,对该图按照定的方向进行旋转。

含有传统数据扩增的人脸识别算法主要分成两个过程,第一个过程是数据扩增,第二个过程是识别网络的训练。数据扩增阶段对输入算法中的原图进行处理,通过镜像、随机裁剪或旋转之后得到图片。识别网络训练中,将扩增好的数据送入到神经网络中进行特征提取(Feature extraction),得到特征(Feature)信息之后再进行分类器(classifier)的训练。

这种含有传统方式数据扩增技术的人脸识别方案,能够一定程度上实现对数据规模上的增加,缓解数据不平衡的问题。但是在该识别算法的数据扩增技术中,增加了数据规模的同时,真正处于有效扩增范围内的数据有限,同时由于没能很好的结合数据的深层语义信息,很容易引起训练过程的收敛过慢等问题。下面将具体介绍现有结合数据扩增技术的人脸识别技术的局限性:

对输入原图进行操作,没有能够很好的结合出图片的深度特征信息。深度卷积神经网络中,原图信息会在之后的深度学习过程中转换成为深度特征信息。只对原图进行简单的变换处理作为数据扩增方式,忽略了图像本质的深度特征信息,在收敛速度和效果上都有一定的影响。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京绽放时代科技有限公司,未经北京绽放时代科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810044176.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top