[发明专利]基于通道注意力机制和特征金字塔的图像去噪方法在审
| 申请号: | 201911003727.4 | 申请日: | 2019-10-22 |
| 公开(公告)号: | CN110766632A | 公开(公告)日: | 2020-02-07 |
| 发明(设计)人: | 赵逸云;鞠国栋;沈良恒 | 申请(专利权)人: | 广东启迪图卫科技股份有限公司 |
| 主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/04;G06N3/08 |
| 代理公司: | 44326 广州容大专利代理事务所(普通合伙) | 代理人: | 刘新年 |
| 地址: | 510000 广东省广州市番禺区番禺大*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 注意力机制 深度特征 图像去噪 原始特征 上采样 去噪 尺寸动态 含噪图像 局部信息 全局信息 特征通道 直接提取 多尺度 卷积核 双线性 下采样 自适应 池化 多路 级联 卷积 金字塔 图像 赋予 保证 学习 | ||
本发明涉及一种基于通道注意力机制和特征金字塔的图像去噪方法,包括:步骤1、在第一阶段,基于深度学习,使用卷积直接提取含噪图像的原始特征;步骤2、使用通道注意力机制对提取的原始特征赋予不同的重要性;步骤3、在第二阶段,使用池化核得到多尺度的深度特征;步骤4、使用连续的下采样和上采样对深度特征分别实现去噪,并且使用双线性插值对去噪的结果进行上采样级联;步骤5、在第三阶段,使用基于多路注意力机制的卷积核尺寸动态选择结构,自适应表达特征得到最终的干净图像。本发明设计合理,考虑了不同特征通道的重要性,兼顾全局信息和局部信息,并保证了图像去噪质量。
技术领域
本发明涉及计算机视觉图像技术领域,尤其是涉及一种基于通道注意力机制和特征金字塔的图像去噪方法。
背景技术
随着科学技术的进步,移动设备日益普及,图像的获取越来越便捷。由于使用了相对低成本的传感器和镜头,移动相机如手机相机捕捉到的图像通常会受到噪声的干扰,尤其是光线不足时,噪声的影响更加严重,这会导致图像质量下降,为后续的应用带来困难。保证图像质量是对图像进行高层次视觉应用如目标检测、语义分割等的基础。因此,如何高效地对真实图像进行去噪,进而提高图像的质量,是计算机视觉领域的一个重要的研究课题。
真实图像去噪技术(Real-Image Denoising)是指从观测到的来自真实世界的有噪声图像恢复出相应的无噪声图像,是从软件的角度解决图像噪声去除问题的重要技术手段。真实图像的噪声移除为使计算机能够更好地观察、分析、处理图片提供重要的技术支持,在高清晰度电视、医学影像、卫星成像、监控系统等很多领域都具有非常重要的应用价值。
传统的真实图像去噪算法将真实噪声建模成高斯分布,其中较为常用的包括非局部块匹配算法(BM3D)、稀疏编码算法(KSVD)等等,这些方法能够去除一定的噪声,但是使用阶段涉及复杂的优化步骤,时间代价较高,为快速应用带来麻烦,此外使用时涉及的可调参数过多,去噪效果无法保证。
卷积神经网络是一种专门用来处理具有类似网格结构的数据(例如图像即可以被视为二维的像素网格)的神经网络,已经在大量不同类型的计算机视觉处理任务(如图像分类、目标检测等)中取得成功。目前已经发展出很多基于卷积神经网络的实现真实图像去噪的解决方案,比如,通过几个参数化的线性滤波器以及几个参数化的影响函数来扩展传统的非线性反应扩散模型技术(TNRD),基于编解码及跳连的全卷积神经网络的高斯去噪技术(REDNet),融合残差学习和批归一化的卷积神经网络去噪技术(DnCNN),使用噪声估计图配合输入,权衡对噪声的抑制和细节保持的去噪技术(FFDNet),在FFDNet基础上,将噪声水平估计过程也用一个子网络实现,从而实现整个网络盲去噪的技术(CBDNet),通过增强学习,建立带有路径查找器的多路径CNN,可以为每个图像区域动态选择合适的路径(Path-Restore)等等。但是,这些方法都没有考虑到特征通道之间的不同重要性,或者未能充分地利用多尺度的特征,从而取得了较为受限的效果。
发明内容
有鉴于此,有必要针对上述的问题,提供一种基于注意力机制和特征金字塔的图像去噪方法,设计合理,考虑了不同特征通道的重要性,兼顾全局信息和局部信息,并保证了图像去噪质量。
一种基于通道注意力机制和特征金字塔的图像去噪方法,包括:
步骤1、在第一阶段,基于深度学习,使用卷积直接提取含噪图像的原始特征;
步骤2、使用通道注意力机制对提取的原始特征赋予不同的重要性;
步骤3、在第二阶段,使用池化核得到多尺度的深度特征;
步骤4、使用连续的下采样和上采样对深度特征分别实现去噪,并且使用双线性插值对去噪的结果进行上采样级联;
步骤5、在第三阶段,使用基于多路注意力机制的卷积核尺寸动态选择结构,自适应表达特征得到最终的干净图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东启迪图卫科技股份有限公司,未经广东启迪图卫科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911003727.4/2.html,转载请声明来源钻瓜专利网。





