[发明专利]一种样本生成方法、系统、设备及存储介质在审
申请号: | 202011329890.2 | 申请日: | 2020-11-24 |
公开(公告)号: | CN113516615A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 张鼎 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T5/50;G06T5/30;G06N3/08;G06N3/04 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 张爱;刘戈 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 样本 生成 方法 系统 设备 存储 介质 | ||
1.一种样本生成方法,其特征在于,包括:
获取原始样本集,所述原始样本集中的样本为第一类型样本,所述第一类型样本中包含指定类型的对象;
基于所述原始样本集对生成对抗网络进行训练,以供所述生成对抗网络中的对象生成器捕获所述原始样本集中指定类型的对象的特征分布信息;
利用所述对象生成器生成符合所述特征分布信息的若干对象图像;
为所述若干对象图像分别融合背景,以获得若干新的第一类型样本。
2.根据权利要求1所述的方法,其特征在于,所述原始样本集中包含多个第一类型样本及对应的对象特征标注信息,所述基于所述原始样本集对生成对抗网络进行训练,包括:
按照所述对象特征标注信息,分别从各第一类型样本中截取对象截图;
基于所述多个对象截图对所述生成对抗网络进行训练。
3.根据权利要求2所述的方法,其特征在于,所述基于所述多个对象截图对所述生成对抗网络进行训练,包括:
若第一对象截图的形状符合预设要求,则将所述第一对象截图填充至指定形状,以获得填充后对象截图;
基于所述第一对象截图对应的填充后对象截图,训练所述生成对抗网络;
其中,所述第一对象截图为所述多个对象截图中的任意一个。
4.根据权利要求3所述的方法,其特征在于,所述指定形状为正方形,所述预设要求包括长宽比值大于预设阈值。
5.根据权利要求4所述的方法,其特征在于,所述将所述第一对象截图填充至指定形状,包括:
以所述第一对象截图的短边作为横边,以所述第一对象截图的长边作为竖边;
在所述第一对象截图的两条竖边外侧填充指定像素,直至将所述第一对象截图填充为正方形。
6.根据权利要求2所述的方法,其特征在于,所述基于所述多个对象截图对所述生成对抗网络进行训练,包括:
以所述多个对象截图作为训练集,输入所述生成对抗网络中的对象判别器,以供所述对象判别器从所述多个对象截图中学习所述指定类型的对象的特征分布信息,并传播至所述对象生成器。
7.根据权利要求1所述的方法,其特征在于,所述生成对抗网络采用大规模对抗网络BigGAN、权重对抗网络WCGAN、循环对抗网络cycleGAN或星型对抗网络starGAN。
8.根据权利要求1所述的方法,其特征在于,所述利用所述对象生成器生成符合所述特征分布信息的若干对象图像,包括:
基于所述指定类型的对象的特征分布信息进行多次高斯采样,以获得多组噪声向量;
将所述多组噪声向量输入所述对象生成器;
在所述对象生成器中,基于所述指定类型的对象的特征分布信息,为所述多组噪声向量分别生成对象图像。
9.根据权利要求1所述的方法,其特征在于,所述为所述若干对象图像分别融合背景,包括:
利用掩码分割模型对所述若干对象图像分别进行掩码分割,以获得所述若干对象图像各自对应的掩码图;
基于所述掩码图从对应的对象图像中提取所述指定类型的对象,作为前景主体,以至少一张第二类型图像作为背景图,采用泊松融合技术,分别为所述若干对象图像融合背景;
其中,所述第二类型图像中不包含所述指定类型的对象。
10.根据权利要求9所述的方法,其特征在于,所述基于所述掩码图从对应的对象图像中提取所述指定类型的对象,包括:
对所述若干掩码图进行形态学膨胀;
分别基于若干形态学膨胀后的掩码图从对象的对象图像中提取所述指定类型的对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011329890.2/1.html,转载请声明来源钻瓜专利网。