[发明专利]一种基于生成式对抗网络的图像扩增方法及系统在审
申请号: | 201910303315.6 | 申请日: | 2019-04-15 |
公开(公告)号: | CN110070124A | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 程子耀;单文龙 | 申请(专利权)人: | 广州小鹏汽车科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/32;G06N3/04;G06N3/08 |
代理公司: | 广州德科知识产权代理有限公司 44381 | 代理人: | 万振雄;杨中强 |
地址: | 510555 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 扩增 初始数据集 图像训练集 模型训练 前景区域 识别系统 训练图像 生成式 置信度 预处理 图像 图像处理技术 目标区域 目标识别 条件限制 图像输入 网络获取 归一化 图像集 对抗 网络 采集 提议 | ||
1.一种基于生成式对抗网络的图像扩增方法,其特征在于,所述方法包括:
对已采集的训练图像进行归一化和预处理,以得到所述训练图像的初始数据集;
通过目标区域提议网络获取所述初始数据集的目标前景区域的置信度,并根据所述置信度对所述目标前景区域进行几何形状二值消除,以得到WGAN模型训练集;
根据所述WGAN模型训练集对WGAN模型进行训练,以得到目标WGAN模型;
将待扩增图像输入所述目标WGAN模型,以获得目标扩增图像集。
2.根据权利要求1所述的方法,其特征在于,所述对已采集的训练图像进行归一化和预处理,以得到所述训练图像的初始数据集,包括:
对已采集的训练图像进行归一化处理,并将已执行归一化处理的训练图像缩放为预设分辨率的第一训练图像;
对所述第一训练图像分别进行三次不同预设角度的旋转操作,并在图像周围两像素范围内进行补零操作,以得到第二训练图像;
以预设的概率随机调整所述第二训练图像的对比度和亮度,以得到第三训练图像;
标记出所述第三训练图像的真实目标区域,以得到所述已采集的训练图像的初始数据集。
3.根据权利要求1所述的方法,其特征在于,所述通过目标区域提议网络获取所述初始数据集的目标前景区域的置信度,并根据所述置信度对所述目标前景区域进行几何形状二值消除,以得到WGAN模型训练集,包括:
通过目标区域提议网络生成目标框,以根据所述目标框生成所述目标框对应的候选框;
通过所述候选框生成至少一个所述初始数据集的候选目标区域和所述候选目标区域对应的置信度;
根据所述置信度,通过非极大值抑制算法消除至少一个所述初始数据集的候选目标区域中冗余的候选目标区域,以得到第一候选目标区域;
判断所述第一候选目标区域的面积是否大于或等于预设的面积阈值;
如果是,将所述第一候选目标区域确定为所述初始数据集的目标前景区域,并对所述初始数据集的目标前景区域进行几何形状二值消除,以得到WGAN模型训练集。
4.根据权利要求3所述的方法,其特征在于,所述目标区域提议网络由十七个卷积层、四个最大池化层和一个Softmax层构成。
5.根据权利要求1所述的方法,其特征在于,在根据所述WGAN模型训练集对WGAN模型进行训练,以得到目标WGAN模型之前,所述方法还包括:
结合以下公式计算出沃瑟斯坦距离,即:
其中,W(Pr,Pg)表示所述沃瑟斯坦距离,Pr(x)表示真实数据分布,Pg(x)表示生成数据分布,∏(Pr,Pg)表示Pr和Pg的联合分布的集合,γ表示∏(Pr,Pg)联合分布集合中的采样,||x-y||表示样本x和样本y的距离,inf表示对联合分布的集合∏(Pr,Pg)的距离期望值Ε(x,y)~γ[||x-y||]取下界;
根据所述沃瑟斯坦距离构造WGAN模型,所述WGAN模型至少包括图像生成器和图像判别器。
6.根据权利要求5所述的方法,其特征在于,所述WGAN模型包括的图像生成器对应的最优图像判别器的表达式如下:
其中,表示所述最优图像判别器,Pr(x)表示真实数据分布,Pg(x)表示生成数据分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州小鹏汽车科技有限公司,未经广州小鹏汽车科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910303315.6/1.html,转载请声明来源钻瓜专利网。