[发明专利]基于CNN-Transformer混合自编码器的图像盲运动去模糊方法有效
申请号: | 202110778551.0 | 申请日: | 2021-07-09 |
公开(公告)号: | CN113570516B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 陈华;赵露露;孙纪康;张小刚;王炼红;潘政;李磊;谢冰心 | 申请(专利权)人: | 湖南大学;浦湘生物能源股份有限公司 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/11;G06T9/00;G06N3/04;G06N3/08 |
代理公司: | 长沙新裕知识产权代理有限公司 43210 | 代理人: | 刘加 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 cnn transformer 混合 编码器 图像 运动 模糊 方法 | ||
基于CNN‑Transformer混合自编码器的图像盲运动去模糊方法,所述方法包括两个阶段,分别为模型训练阶段和预测阶段,模型训练阶段包括以下步骤:步骤一:准备图像去模糊标准数据集;步骤二:实验数据预处理;步骤三:将图像去模糊标准数据集的训练集中的模糊图片输入混合自编码器部分进行恢复;步骤四:将混合自编码器生成的潜在清晰图像与其标准数据集中相对应的目标清晰图片一起输入判别器,判别器计算损失后返回梯度;步骤五:混合自编码器接收来自判别器的梯度进行参数更新;模型预测阶段包括一个步骤:将模糊图片输入训练好的混合自编码器,输出即是去模糊后的清晰图片。利用本发明,能得到更好的图像去模糊效果,对图像细节产生更清晰的恢复。
技术领域
本发明属于计算机视觉和图像处理技术领域,涉及一种基于CNN-Transformer混合自编码器的图像盲运动去模糊方法。
背景技术
图像作为传递信息的重要媒介,在人们的生活和工作中起到不可或缺的作用。但是图像模糊问题在生活中普遍存在:由于相机抖动、物体快速运动或失焦等问题,都会降低图像质量,使图像变得模糊。此外,各种原因:如深度变化,运动边界的闭塞使模糊更复杂。许多拍摄场景随时间不断改变,具有不可重复性,如果出现相机抖动或物体快速运动导致的模糊问题,极有可能导致图像不可用。如何有效的利用这些模糊图片,图像去模糊方法的研究就具有非常重要的意义。
图像去模糊一直是计算机视觉和图像处理中的一项重要工作。运动模糊是成像过程中普遍存在的现象。运动图像去模糊在各个领域的应用也越来越多。如普通照明时手的抖动、航空侦察时飞机相对地面的应用效率,就要从模糊图像中恢复成较为清晰的图片。去模糊的目标是恢复具有必要边缘结构和细节的清晰的潜在图像。早期的研究集中于消除由简单的平移或旋转摄像机运动引起的模糊,后来的工作试图处理动态环境中由深度变化、相机抖动和物体运动引起的不均匀模糊。这些方法大多基于模糊模型:模糊图像可以看作模糊核与清晰图像卷积附加上额外的噪声形成。于是早期的工作主要是关于非盲去模糊,假设模糊核已知。算法大多数依赖于启发式、图像统计和模糊来源的假设。这些方法通过考虑模糊在整个图像中是均匀的来掩饰由相机引起大的模糊。首先根据产生的模糊核估计摄像机的运动,然后通过反卷积获得清晰图像。因此,研究人员试图参数化模型并简单的假设模糊的来源。其中一些方法是基于迭代方法,利用参数先验模型改进了每次迭代对模糊核和清晰图像的估计。然而对于这类算法来说,运行时间和停止准则则是一个重要的问题。另一些则使用模糊函数的局部线性假设和简单的启发式来快速估计未知模糊核。这些方法速度很快,但只在一小部分图像上效果很好。近年来随着卷积神经网络在计算机视觉问题上的广泛应用,研究人员开发了一些利用卷积神经网络来估计模糊核的方法。
通常情况下,模糊函数是未知的,为每个像素找到一个模糊函数是一个不适定的问题,于是近年来研究人员开始进行盲去模糊算法的研究,这些方法无需估计模糊核,且能够处理不同来源的模糊。最近,一些研究人员开始利用多尺度卷积神经网络以及密集连接的卷积神经网络进行无内核盲运动图像去模糊。但是,大多数方法在空间纹理细节和高级上下文信息之间的平衡表现的不够好,视觉效果上欠佳。
发明内容
本发明所要解决的技术问题是,克服现有技术的不足,提供一种去模糊效果好、对图像细节恢复更清晰的基于CNN-Transformer混合自编码器的图像盲运动去模糊方法。
本发明解决其技术问题采用的技术方案是,基于CNN-Transformer混合自编码器的图像盲运动去模糊方法,所述方法包括两个阶段,分别为模型训练阶段和预测阶段,所述模型训练阶段包括以下步骤:
步骤一:准备图像去模糊标准数据集;
步骤二:实验数据预处理,在进入模型训练之前将实验数据随机切割为256x256大小;
步骤三:将图像去模糊标准数据集的训练集中的模糊图片输入混合自编码器部分进行恢复;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学;浦湘生物能源股份有限公司,未经湖南大学;浦湘生物能源股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110778551.0/2.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法