[发明专利]一种基于生成式对抗网络的图像扩增方法及系统在审

申请号：	201910303315.6	申请日：	2019-04-15
公开（公告）号：	CN110070124A	公开（公告）日：	2019-07-30
发明（设计）人：	程子耀;单文龙	申请（专利权）人：	广州小鹏汽车科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/32;G06N3/04;G06N3/08
代理公司：	广州德科知识产权代理有限公司 44381	代理人：	万振雄;杨中强
地址：	510555 广东省广州市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	扩增初始数据集图像训练集模型训练前景区域识别系统训练图像生成式置信度预处理图像图像处理技术目标区域目标识别条件限制图像输入网络获取归一化图像集对抗网络采集提议
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于生成式对抗网络的图像扩增方法，其特征在于，所述方法包括:

对已采集的训练图像进行归一化和预处理，以得到所述训练图像的初始数据集；

通过目标区域提议网络获取所述初始数据集的目标前景区域的置信度，并根据所述置信度对所述目标前景区域进行几何形状二值消除，以得到WGAN模型训练集；

根据所述WGAN模型训练集对WGAN模型进行训练，以得到目标WGAN模型；

将待扩增图像输入所述目标WGAN模型，以获得目标扩增图像集。

2.根据权利要求1所述的方法，其特征在于，所述对已采集的训练图像进行归一化和预处理，以得到所述训练图像的初始数据集，包括：

对已采集的训练图像进行归一化处理，并将已执行归一化处理的训练图像缩放为预设分辨率的第一训练图像；

对所述第一训练图像分别进行三次不同预设角度的旋转操作，并在图像周围两像素范围内进行补零操作，以得到第二训练图像；

以预设的概率随机调整所述第二训练图像的对比度和亮度，以得到第三训练图像；

标记出所述第三训练图像的真实目标区域，以得到所述已采集的训练图像的初始数据集。

3.根据权利要求1所述的方法，其特征在于，所述通过目标区域提议网络获取所述初始数据集的目标前景区域的置信度，并根据所述置信度对所述目标前景区域进行几何形状二值消除，以得到WGAN模型训练集，包括：

通过目标区域提议网络生成目标框，以根据所述目标框生成所述目标框对应的候选框；

通过所述候选框生成至少一个所述初始数据集的候选目标区域和所述候选目标区域对应的置信度；

根据所述置信度，通过非极大值抑制算法消除至少一个所述初始数据集的候选目标区域中冗余的候选目标区域，以得到第一候选目标区域；

判断所述第一候选目标区域的面积是否大于或等于预设的面积阈值；

如果是，将所述第一候选目标区域确定为所述初始数据集的目标前景区域，并对所述初始数据集的目标前景区域进行几何形状二值消除，以得到WGAN模型训练集。

4.根据权利要求3所述的方法，其特征在于，所述目标区域提议网络由十七个卷积层、四个最大池化层和一个Softmax层构成。

5.根据权利要求1所述的方法，其特征在于，在根据所述WGAN模型训练集对WGAN模型进行训练，以得到目标WGAN模型之前，所述方法还包括：

结合以下公式计算出沃瑟斯坦距离，即：

其中，W(P_r,P_g)表示所述沃瑟斯坦距离，P_r(x)表示真实数据分布，P_g(x)表示生成数据分布，∏(P_r,P_g)表示P_r和P_g的联合分布的集合，γ表示∏(P_r,P_g)联合分布集合中的采样，||x-y||表示样本x和样本y的距离，inf表示对联合分布的集合∏(P_r,P_g)的距离期望值Ε_(x,y)～γ[||x-y||]取下界；

根据所述沃瑟斯坦距离构造WGAN模型，所述WGAN模型至少包括图像生成器和图像判别器。

6.根据权利要求5所述的方法，其特征在于，所述WGAN模型包括的图像生成器对应的最优图像判别器的表达式如下：

其中，表示所述最优图像判别器，P_r(x)表示真实数据分布，P_g(x)表示生成数据分布。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州小鹏汽车科技有限公司，未经广州小鹏汽车科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910303315.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种目标用户识别装置及服务器
下一篇：一种基于大数据分析的肝胆外科治疗方案筛选方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于生成式对抗网络的图像扩增方法及系统在审

专利文献下载