[发明专利]用于图像语义分割的SAUNet++网络与图像语义分割方法有效
申请号: | 202110721864.2 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113222124B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 肖汉光;冉智强;张勃龙;陈凯;李月韦 | 申请(专利权)人: | 重庆理工大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/82;G06N3/048;G06N3/0464;G06N3/08 |
代理公司: | 重庆博凯知识产权代理有限公司 50212 | 代理人: | 周玉玲 |
地址: | 400054 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 图像 语义 分割 saunet 网络 方法 | ||
本发明涉及一种用于图像语义分割的SAUNet++网络与图像语义分割方法,解决如何提高图像语义分割精度的技术问题。通过若干SER模块之间的下采样连接、上采样连接以及长\短跳跃连接形成U‑Net++网络结构,从而得到SU‑Net++网络,使得SU‑Net++网络具备一条下采样链路和不同深度的上采样链路以及用于合并特征图的跳跃连接网络;所述SER模块为挤压激励残差模块,用于调整特征图的通道数和各通道的权值;在所述SU‑Net++网络结构的下采样链路的末端与最深层上采样链路的首端之间增加一个ASPP模块,从而形成SAUNet++网络。本发明可以学习到图像中更丰富更重要的特征,提高分割准确率,医学图像和自然图像都能有效分割。
技术领域
本发明属于图像语义分割技术领域。
背景技术
图像分割是计算机视觉的重要分支,它将图像划分为互不相交的的子区域,属于同一个子区域的像素点具有一定相关性,而在不同子区域的像素点存在一定差异性,即对图片中像素点分类的过程。图像分割具体可分为语义分割、实例分割和全景分割。图像语义分割是将属于同一类别的区域分割出来,而不区分相同类别中的不同个体。
图像语义分割算法可分为传统图像处理方法和深度学习方法。传统图像处理方法又可分为基于阈值的方法、基于边缘的方法、基于区域的方法、基于活动轮廓的方法等。由于受到计算机算力的限制,该类方法只能提取图像的颜色、形状、纹理等低层特征对图像进行分割,而且需要手动设置参数,因此分割效果不佳,难以满足实际需求。
随着深度学习的发展,卷积神经网络成为了图像处理的重要手段。在图像语义分割任务中,深度学习方法能够学习到图像中的深层特征,充分利用图像中的语义信息,实现自动精确快速的分割。Long等人于2015年提出的全卷积网络(fully convolutionalnetworks,FCN)将图像级分类网络转变为像素级分类网络,并且实现了端到端的训练,是将卷积神经网络应用到图像语义分割的开山之作。但是,FCN由于没有考虑到像素点之间的关联性,导致对图像细节不够敏感,分割边界模糊。此后,大量基于FCN的深度学习方法被提出,可分为基于编解码的方法(U-Net、SegNet)、基于注意力机制的方法(DANet、CCNet)、基于空洞卷积的方法(DeepLab V1~V3+)等。
基于编解码的方法以U-Net网络最为经典,编码网络提取高层特征,解码网络恢复图像空间信息,并使用跳跃连接将编解码网络对应的特征图拼接到一起,融合了高层和低层特征的U-Net使得图像分割更加精确,但网络结构简单。
原始U-Net使用四次下采样来获取高维信息,然后使用四次上采样将特征图恢复到原始大小,并使用四个跳跃连接来合并特征图。然而,并不是所有基于U-Net的改进方法都采用四层结构,但是下采样、上采样和跳跃连接的组合一直没有改变。参考图1所示,U-Net++网络是U-Net网络的改进:在大的U-Net网络框架内部形成多层子U-Net网络,每个圆圈代表原型单元,用于实现卷积和激活函数。U-Net++可以从不同深度的结构中提取不同的特征,这些特征对分割都很重要,因此U-Net++结合了四个不同深度的结构,并使用不同长度的跳跃连接。由于U-Net++采用无填充卷积,经过两次卷积后,同一层特征图的边界像素会丢失,因此需要先对编码网络中的特征图进行裁剪,然后再与解码网络中的特征图进行连接。但是,现有的U-Net++网络结构不能很好的区分各个图像特征的重要性,对于场景较复杂的图像的分割效果不理想,尤其是对于边界信息较弱的分割目标,另外现有的U-Net++网络结构对细小目标的分割准确率也有待提高。
发明内容
针对上述现有技术的不足,本发明提供一种基于U-Net++网络的图像语义分割系统,解决如何提高图像语义分割精度的技术问题。
为解决上述技术问题,本发明提供一种用于图像语义分割的SAUNet++网络,通过若干SER模块之间的下采样连接、上采样连接以及长\短跳跃连接形成U-Net++网络结构,从而得到SU-Net++网络,使得SU-Net++网络具备一条下采样链路和不同深度的上采样链路以及用于合并特征图的跳跃连接网络;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆理工大学,未经重庆理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110721864.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序