[发明专利]基于编码-解码结构的图像语义分割方法在审
申请号: | 201910503595.5 | 申请日: | 2019-06-03 |
公开(公告)号: | CN110263833A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 韩慧慧 | 申请(专利权)人: | 韩慧慧 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多尺度 特征图 解码结构 空间信息 图像语义 浅层 分割 空间信息提取 图像处理技术 信息融合模块 医学图像分析 驾驶员辅助 分割结果 改进结构 室内环境 数据依赖 图片提取 图像分割 信息捕获 虚拟现实 自动驾驶 融合 上采样 传感 多核 卷积 细化 机器人 集合 重建 网络 | ||
本发明公开了一种基于编码‑解码结构的图像语义分割方法。其特征包括:首先通过改进结构的ResNet‑101网络对待分割图片提取特征图集合;然后利用多尺度信息融合模块对所提取的特征图进行多尺度信息捕获;并且,利用空间信息提取模块在ResNet‑101的浅层提取丰富的空间信息;接着,将深层的多尺度信息和浅层的空间信息融合后,利用一个多核卷积块对融合后的特征图进行细化;最终,通过数据依赖的上采样操作得到分割结果。本发明主要致力于提高图像分割准确性,属图像处理技术领域,特别适用于医学图像分析、自动驾驶、虚拟现实、驾驶员辅助、机器人传感、室内环境重建、无人机等。
技术领域
本发明属图像处理技术领域,尤其是涉及基于编码-解码结构的图像语义分割方法,特别适用于医学图像分析、自动驾驶、室内环境重建、无人机等任务。
背景技术
语义分割是图像处理中一个重要研究领域,其目标是对图像上的每个像素点进行密集预测并标注上对应物体或区域的类别。随着深度卷积神经网络的不断发展,特别是全卷机神经网络的出现,语义分割技术实现了质的飞跃。为了进一步提高语义分割结果,各国研究人员从不同的角度出发,设计出了多种多样的模型架构。
为了防止连续的下采样和池化操作导致的空间分辨率降低的现象,在Chen等人提出的Deeplabv2、 Deeplabv3和Deeplabv3+,和Zhao等人提出的PSPNet模型中,采用了扩张卷积,其可以有效地扩大滤波器的感受野,减少空间细节的损失。而且,编码-解码结构也可以防止空间信息丢失的现象。例如, Badrinarayanan等人提出的SegNet利用编码-解码结构来捕获更多的空间信息。为了在浅层捕获更多的空间信息,帮助模型恢复目标细节,DeepLabv3+在DeepLabv3模型中添加了一个简单而有效的解码模块。除此之外,在Chao等人提出的GCN、Yu等人提出的DFN和Li等人提出的PAN模型中应用了u型结构,以逐步融合骨干网中不同层次的特征图,提高空间分辨率,弥补空间细节的丢失。GCN利用“大核”来扩大接受域,保持空间信息。
为了捕获更丰富的多尺度上下文信息,很多工作已经取得了一定成果。Deeplabv2提出了扩张空间金字塔池化模块来捕获多尺度上下文信息。Yuan等人提出的OCNet模型通过使用金字塔对象上下文或扩张的空间金字塔对象上下文来捕获多尺度上下文信息。此外,Yang等人提出的DenseASPP模型运用一组扩张卷积层来生成多尺度特征图。Lin等人提出的Refinenet和Ronneberger等人提出的U-net采用编码-解码结构对不同层次的特征图进行融合,获得丰富的上下文信息。Byeon等人以二维LSTM网络为基础,提出了一种基于标签的复杂空间依赖关系捕获模型。为了捕获局部特征上丰富的上下文依赖关系,Shuai等人设计了一个有向无环图的递归神经网络。在Liu等人提出的SPN模型中设计了一个行/列线性传播模型,该模型可以提取场景图像中密集的全局成对关系。在Zhao等人提出的PSANet模型中,通过双向信息传播来学习自适应的点向上下文。
发明内容
为避免现有技术所存在的缺陷与不足,本发明提出一种基于编码-解码结构的图像语义分割方法,以解决在图像语义分割任务中存在的两个挑战:1)多尺度物体的存在导致错误分类;2)空间信息的丢失导致小物体识别不出。
为实现上述发明目的,本发明采用如下技术方案:
本发明基于编码-解码结构的图像语义分割方法是按如下步骤进行
步骤1、制作含有M张图片数据集,其分为三个子集:训练集,验证集和测试集,其中训练集和验证集被准确地进行像素级标注;
步骤2、对基于编码-解码结构的图像语义分割模型进行训练
步骤2.1、首先对训练集图片进行数据增强,即随机水平翻转、10到-10度的随机旋转和0.5到2倍的随机缩放;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韩慧慧,未经韩慧慧许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910503595.5/2.html,转载请声明来源钻瓜专利网。