[发明专利]一种基于BlockGAN的图像生成和识别模块及方法有效
申请号: | 202010044383.8 | 申请日: | 2020-01-15 |
公开(公告)号: | CN111311702B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 张宝军;钱晓岚;王雪梅;卓荣庆;俞定国 | 申请(专利权)人: | 浙江传媒学院 |
主分类号: | G06T11/00 | 分类号: | G06T11/00;G06V10/26;G06V10/80;G06V10/82;G06N3/0475 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 陈升华 |
地址: | 310018 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 blockgan 图像 生成 识别 模块 方法 | ||
本发明公开了一种基于BlockGAN的图像生成和识别模块及方法,该模块包括:图像分割模块;模式分解模块;多个区块,多个区块形成一个BlockGAN(区块GAN),每个区块中包含一个生成器以及与所述生成器连接的多个判别器;第一融合模块;第二融合模块。该方法主要解决复杂图像生成过程中模式多样性的问题、识别过程中准确性的问题以及运行效率的问题。本发明每个区块由一个生成器和多个判别器组成,负责对一种类型的物体进行生成和识别,多个判别器可对同一物体的多个模态进行判别,以增加图像识别的准确性。多个区块可并行处理,生成器生成的单一物体可融合成复杂图像,判别器的判别结果融合后形成对复杂图像的准确识别。
技术领域
本发明涉及图像生成和识别技术领域,具体涉及一种基于BlockGAN的图像生成和识别模块及方法。
背景技术
GAN(Generative Adversarial Nets,生成式对抗网络)借鉴零和博弈的思想,通过生成器和判别器的博弈,使得生成器与判别器的性能在对抗过程中不断提升,最终生成器能够生成以假乱真的图像,而判别器无法判别生成图像的真伪。GAN的方法简单实用,被广泛应用于图像生成领域,近年来研究发现其在图像识别领域同样有着好的表现。
简单图像的生成和识别已经取得了瞩目的成绩,成果显著,而复杂图像的生成和识别仍存在较大问题,是目前研究的重点和难点,其困难主要体现在以下3个方面:1)复杂图像背景复杂,含有多种物体和模式,生成复杂图像往往存在模式多样性的问题,而用传统GAN去生成复杂图像则需要海量图像数据的训练和庞大的模型参数空间,运算量过大;2)复杂图像的识别是一个多标签图像分类问题,是图像分类领域最难的分支,而复杂图像的干扰信息过多,其识别的准确性存在较大问题;3)相比于简单图像,复杂图像的处理难度显著增加,处理过程更加复杂,无论是生成还是识别的开销都明显增大,因此模型训练和运行的效率也是不可忽视的问题。
发明内容
针对以上问题,本发明提供了一种基于BlockGAN的图像生成和识别模块及方法,该方法主要解决复杂图像生成过程中模式多样性的问题、识别过程中准确性的问题以及运行效率的问题。本发明方法由多个区块构成,每个区块由一个生成器和多个判别器组成,负责对一种类型的物体进行生成和识别,其中多个判别器可对同一物体的多个模态进行判别,以增加图像识别的准确性。多个区块可并行处理,其中生成器生成的单一物体可融合成复杂图像,判别器的判别结果融合后形成对复杂图像的准确识别。
本发明在GAN技术的基础上,提出了一种新的GAN的体系结构BlockGAN(区块GAN),用于复杂图像的生成和识别,有效解决复杂图像生成过程中模式多样性的问题、识别过程中准确性的问题以及模型运行效率的问题,其解决方法如下:
1.为解决复杂图像生成过程中模式多样性的问题,区块GAN由多个区块组成,每个区块由一个生成器和多个判别器组成,负责一种物体或模式的生成和识别;
2.为解决复杂图像识别过程中准确性的问题,采用多区块融合判别模式,首先每个区块由多个判别器组成,负责对同一物体的多种模态进行判别,提升了对同一物体识别的准确性;其次,每个判别器可根据自己判别的目标不同而采用不同的目标函数,进一步提升识别精度;最后,多个区块的判别器的输出形成判别矩阵,对判别矩阵融合处理后得到对复杂图像的准确识别,融合方式的多样性使得BlockGAN可适用于各种不同的应用;
3.为解决模型运行效率的问题,多个区块并行运行,每个区块各司其职,负责对复杂图像中的一个物体的生成和识别,生成和识别结果融合后生成复杂图像或得到对复杂图像的识别。BlockGAN(即区块GAN)具有很好的并发性,适合GPU的处理,具有很高的运行效率,其并发性主要体现在以下方面:
1)在训练阶段,每个区块只需学习对某类物体的生成和识别,用来训练的数据集相互独立,因此多个区块相互独立运行,可以并行训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江传媒学院,未经浙江传媒学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010044383.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:通话场景的识别方法和装置
- 下一篇:游戏中虚拟载具的状态同步方法和装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序