[发明专利]基于深度神经网络的模糊图片清晰化处理方法及系统有效
| 申请号: | 201910405703.5 | 申请日: | 2019-05-16 |
| 公开(公告)号: | CN110223245B | 公开(公告)日: | 2021-07-16 |
| 发明(设计)人: | 唐珩膑;彭德智;舒琳;王岽然;张国雄;巫朝政;邢晓芬 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/04 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 裴磊磊 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 神经网络 模糊 图片 清晰 处理 方法 系统 | ||
1.一种基于深度神经网络的模糊图片清晰化处理方法,其特征在于,所述方法包括以下步骤:
通过模糊算法将原图像P进行模糊化处理得到图像
将原图像P与模糊化处理后的图像作为训练数据训练BiCycleGAN网络;
所述方法对原图像P进行模糊化处理的具体过程如下:
若原清晰图像P∈(X,Y,N),即是高为X像素,宽为Y像素,通道为N的图像数据,并且,原清晰图像中表征了某一像素点的所有特征,xi,y j 是图像像素位置信息,(n1,...,nN)对应了该像素的N个通道值,此处使用RGB三通道图像,即N=3;
在模糊化处理过程中,图像根据指定的方向THETA及模糊程度LEN为参数进行具体操作,其中模糊程度LEN以像素个数为单位,某一像素点(xi,y j )的色域通道值(n1,n2,n3)将在以其源点(xi,y j )为极坐标原点,沿线段l:
进行像素点重复,其中THETA是沿逆时针的方向角,LEN是模糊偏移的像素单位距离值,这体现了实际过程中的抖动,反映在某一像素点(xi,yj)的通道取值上,即是该点的色域通道值,满足:
在该表示方法中,第三个下标m标示了该值所属的通道,此处采用的是RGB三色通道,所以在表达式中m∈(1,2,3);式中,是对因抖动造成的被叠加到像素点(xi,y j )上的其他像素点的表述,这些点在线段-l(xi,y j )上,而其点上的色域通道值则因抖动而被覆盖到点(xi,y j )的通道上,构成了的组成部分之一,此处按照如上方法进行模糊生成;
所述模糊化处理的过程中,LEN的取值在范围内随机选取,X为原清晰图像P的高度,Y为原清晰图像P的宽度,THETA则在(0°,360°)范围内随机选取;
实际应用时,将需要处理的模糊图像传输到服务器,服务器接收到该模糊图像数据后,调用训练好的BiCycleGAN网络进行清晰化处理并将处理结果返回。
2.根据权利要求1所述的一种基于深度神经网络的模糊图片清晰化处理方法,其特征在于:所述方法使用PascalVOC数据集中的图像作为原清晰图像P。
3.根据权利要求1所述的一种基于深度神经网络的模糊图片清晰化处理方法,其特征在于:所述方法在训练BiCycleGAN网络的过程中,涉及到图像的输入域和输出域,考虑输入域图像集它与目标图像集相对应,在训练阶段,提供训练数据对对于一个输入实例A,能够根据联合分布p(A,B)对应多个合理配对实例B,但是实际训练时只提供一个配对实例,在测试阶段,如果提供一个输入实例A,实际会根据条件概率p(B|A)生成多个合理配对实例,此处记为为了表征输入与输出之间的差距,此处引入一个低维度的隐码向量来具体表达这种差距,由此,生成对抗网络中的生成函数G便能够写成G:(A,z)→B,其中,隐码向量z为生成函数提供了扰动和修正,这里令其服从正态分布,即p(z)~N(0,I)。
4.根据权利要求3所述的一种基于深度神经网络的模糊图片清晰化处理方法,其特征在于:所述方法训练的BiCycleGAN网络包括两个子网络cVAE-GAN和cLR-GAN。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910405703.5/1.html,转载请声明来源钻瓜专利网。





