[发明专利]基于通道注意力机制和特征金字塔的图像去噪方法在审
| 申请号: | 201911003727.4 | 申请日: | 2019-10-22 |
| 公开(公告)号: | CN110766632A | 公开(公告)日: | 2020-02-07 |
| 发明(设计)人: | 赵逸云;鞠国栋;沈良恒 | 申请(专利权)人: | 广东启迪图卫科技股份有限公司 |
| 主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/04;G06N3/08 |
| 代理公司: | 44326 广州容大专利代理事务所(普通合伙) | 代理人: | 刘新年 |
| 地址: | 510000 广东省广州市番禺区番禺大*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 注意力机制 深度特征 图像去噪 原始特征 上采样 去噪 尺寸动态 含噪图像 局部信息 全局信息 特征通道 直接提取 多尺度 卷积核 双线性 下采样 自适应 池化 多路 级联 卷积 金字塔 图像 赋予 保证 学习 | ||
1.一种基于通道注意力机制和特征金字塔的图像去噪方法,其特征在于,包括:
步骤1、在第一阶段,基于深度学习,使用卷积直接提取含噪图像的原始特征;
步骤2、使用通道注意力机制对提取的原始特征赋予不同的重要性;
步骤3、在第二阶段,使用池化核得到多尺度的深度特征;
步骤4、使用连续的下采样和上采样对深度特征分别实现去噪,并且使用双线性插值对去噪的结果进行上采样级联;
步骤5、在第三阶段,使用基于多路注意力机制的卷积核尺寸动态选择结构,自适应表达特征得到最终的干净图像。
2.根据权利要求1所述的基于通道注意力机制和特征金字塔的图像去噪方法,其特征在于,具体在步骤1中,使用四层卷积提取含噪图像的原始特征,所述四层卷积的单层卷积层的尺寸为3×3×32。
3.根据权利要求1或2所述的基于通道注意力机制和特征金字塔的图像去噪方法,其特征在于,所述步骤2的具体实现方法为:
(1)对直接提取的原始特征U进行全局池化,提取其全局语义信息,然后经过全连接层、ReLU非线性变换、全连接层和Sigmoid非线性变换后得到通道校准系数向量μ;
(2)使用通道校准系数向量μ对输入特征U进行重新校准。
4.根据权利要求3所述的基于通道注意力机制和特征金字塔的图像去噪方法,其特征在于,步骤3具体使用五个池化核,其大小分别为1×1,2×2,4×4,8×8和16×16。
5.根据权利要求4所述的基于通道注意力机制和特征金字塔的图像去噪方法,其特征在于,在步骤4中:
(1)上采样和下采样各包括五个阶段,前一阶段通过下采样或是上采样进入下一阶段,同时同一阶段的上采样特征和下采样特征会进行级联;
(2)使用池化对输入特征进行两倍下采样,使用反卷积层进行两倍上采样,每一阶段伴随四层卷积层,四层卷积尺寸相同,五个阶段依次为3×3×32,3×3×64,3×3×128,3×3×256,3×3×512。
6.根据权利要求5所述的基于通道注意力机制和特征金字塔的图像去噪方法,其特征在于,所述步骤5的具体实现方法为:
(1)同时通过3个不同卷积核大小的卷积层来表达特征,得到U′、U″和U″′,然后将结果逐像素相加得到混合特征
(2)再将进行全局池化,提取其全局语义信息,然后经过全连接层、ReLU非线性变换,再一分为三,得到对应的三个通道校准系数向量α、β和γ,并在整体上做softmax归一化操作,即对三个向量沿着各通道进行加权处理;
(3)将三个向量α、β和γ与U′、U″和U″′分别相乘,再逐像素相加,此时各特征通道自适应地选择了不同大小的卷积核进行特征表达;
(4)通过一个单层卷积,得到恢复后的干净图像。其中卷积层的尺寸为3×3×1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东启迪图卫科技股份有限公司,未经广东启迪图卫科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911003727.4/1.html,转载请声明来源钻瓜专利网。





