[发明专利]基于RRDB的生成对抗网络的图像去模糊算法在审
申请号: | 202011594945.2 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112651894A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 王娟;蔡霖康;刘子杉;陈关海;丁畅;袁旭亮;柯聪 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430068 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 rrdb 生成 对抗 网络 图像 模糊 算法 | ||
1.基于RRDB的生成对抗网络的图像去模糊算法,其特征在于,该算法基于DeblurGAN(盲去模糊生成对抗网络)模型,模型包括RRDB(嵌套残差密集块),模型中,损失函数包含对抗损失函数、由像素空间损失和感知损失构成的内容损失函数,即L=LGAN+aLpercep+bLpixel:
步骤1:采集模糊图像样本,输入基于RRDB的生成器中,生成去模糊后的清晰图像样本;
步骤2:利用判别器判别数据集中原始清晰样本和步骤1生成清晰样本,最终得到去模糊图像的真实样本;
步骤3:使用总体去模糊损失函数L对生成图像判别,进行损失计算;使用Wasserstein距离来衡量真实清晰样本图像与生成样本图像的相似性,从而实现对真实样本和生成样本的分类。
2.根据权利要求1所述的基于RRDB的生成对抗网络的图像去模糊算法,其特征在于,所述损失函数中,LGAN、aLpercep、bLpixel分别基于如下:
a为感知损失加权参数;b为像素空间损失加权参数;
对抗损失计算表达式为:
其中,为判别器D和判别器参数θD,为生成器G和生成器参数θG;IB为输入给生成器的模糊样本图像,IS为真实样本图像,N为样本数量;
像素空间损失表达式为:
其中,W和H分别为样本图像的长度和宽度;
感知损失表达式为:
其中,Wi,j和Hi,j分别是特征图的维度,φi,j是VGG19网络里第j个卷积层之前,第i个最大池化层之后的特征图。
3.根据权利要求1所述的基于RRDB的生成对抗网络的图像去模糊算法,其特征在于,所述步骤1具体包括:
生成器前端是一个7×7的和两个3×3的卷积层,对输入进来的图像进行卷积来实现对图像的下采样,从而得到图像的特征图;中间是使用跳跃连接的方式相互连接的9个RRDB网络单元;与普通的残差单元不同,RRDB结合了多层的残差网络和密集连接,可以进一步加强网络对图像的细节特征学习;末端是两个转置卷积层,对输入特征图进行反卷积来实现图像的上采样;最后再经过7×7的卷积层,输出清晰图像;整个过程来实现端对端的图像去模糊。
4.根据权利要求1所述的基于RRDB的生成对抗网络的图像去模糊算法,其特征在于,所述步骤2具体包括:
判别器实质是一个基于CNN的分类器,里面有4个4×4和一个1×1卷积层,每个卷积层包含一个实例归一化层IN(Instance Normalization)和带泄露整流激活函数(LReLU);判别器对输入的生成清晰样本和真实样本经5个卷积层处理后,将输入图像映射为N×N的概率矩阵;矩阵中的每一个元素Xij的值,代表每一个像素补丁为真实样本的概率;然后对每一个元素Xij进行均值计算,最终得到判别器的输出。
5.根据权利要求1所述的基于RRDB的生成对抗网络的图像去模糊算法,其特征在于,所述步骤3具体包括:
总体去模糊损失函数为三种损失函数加权求和,其表达式为:
L=LGAN+aLpercep+bLpixel
其中,对抗损失加权值参数取值1,感知损失加权参数取值100,像素空间损失加权值参数取值160;
Wasserstein距离用来衡量两个概率分布之间的距离,定义如下:
其中,П(P1,P2)是分布P1和P2的联合分布集合;在每一个可能的联合分布γ中采样一个样本x和y,计算这对样本的距离||x-y||,从而得到在联合分布γ下样本对距离的期望值E(x,y);取联合分布中期望值的下确界得到Wasserstein距离;从而衡量真实清晰样本图像与生成样本图像的相似性,最终实现对真实样本和生成样本的分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011594945.2/1.html,转载请声明来源钻瓜专利网。