[发明专利]一种改进全卷积神经网络的语义分割方法在审
申请号: | 201810558048.2 | 申请日: | 2018-06-01 |
公开(公告)号: | CN108921196A | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 霍智勇;戴伟达 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 语义分割 特征图 卷积 训练图像 随机梯度下降法 滤波器 尺寸缩小 分割结果 图像输入 像素预测 计算量 上采样 有效地 池化 稠密 改进 图像 恢复 网络 | ||
本发明公开了一种基于改进全卷积神经网络的语义分割方法,包括步骤:获取训练图像数据;将训练图像数据输入多孔全卷积神经网络,先通过标准卷积池化层得到尺寸缩小的特征图;再通过多孔卷积层在维持特征图尺寸的同时提取更稠密的特征;最后对特征图进行逐像素预测得到分割结果;且训练中利用随机梯度下降法SGD对多孔全卷积神经网络中的参数进行训练;获取需要语义分割的图像输入训练后的多孔全卷积神经网络,得到对应的语义分割结果。本发明可以改善全卷积网络中最终上采样恢复的特征图失去对图像的细节敏感性的问题,同时在不增加参数数量以及计算量的前提下,有效地扩大了滤波器的感受野。
技术领域
本发明涉及一种基于多孔全卷积神经网络的语义分割方法,属于计算机视觉的领域。
背景技术
图像语义分割是图像理解的关键性技术,广泛应用于自动驾驶系统(具体为街景识别与理解)、无人机应用(着陆点判断)以及穿戴式设备中。图像语义分割实现对图片中所有像素点的分类。在深度学习应用到图像语义分割之前,有最简单的像素级别的阈值法、基于像素聚类的分割法和图划分的分割法等多种方法。Shi等提出了基于图划分的Normalized cut(N-cut)方法,将分割的不同部分与全图节点的连接权重考虑进去从而达到考虑全局信息的目的。Rother等提出了同样基于图划分的Grab cut方法,这是一种交互式的语义分割方法,其利用图像中的纹理信息和边界信息,使得只需少量的用户交互操作就可得到较好的前后背景分割结果。这些方法多是根据图像像素自身的低阶视觉信息来进行图像分割。由于没有算法训练阶段,虽然计算复杂度不高,但有着较高的分割错误率。
近年来,深度学习的快速发展极大地推动了语义分割的进步。Dan等基于深度学习提出了图像块分类方法,即利用像素周围的图像块对每一个像素进行独立的分类,当时的卷积网络末端通常使用全连接层,因此需要固定尺寸的图像来进行逐像素的分割。Long等提出了全卷积神经网络进行像素级别端到端的语义分割,在接收不同尺寸图像的同时也极大地提升了分割的效率,但分割效果仍然不够精细,同时很难对不同尺寸的同一物体进行正确的分割。Papandreou等提出了将多尺度图像输入网络最后整合输出特征的方法,提高了对多尺度图像的适应能力。
综上所述,顺应发展趋势,采用卷积神经网络提取图像特征。然而其中仍存在一些问题值得研究,如卷积神经网络结构的设计来兼顾网络权重与特征提取效果,损失函数的设计来更好的进行语义分割任务。
发明内容
本发明所要解决的技术问题在于克服现有技术的不足,提供一种基于改进全卷积神经网络的语义分割方法,解决现有全卷积网络中由于连续多次的最大池化和下采样操作造成特征分辨率急剧降低,使最终上采样恢复的特征图失去对图像的细节敏感性的问题。
本发明实现上述目的的技术解决方案为:一种改进全卷积神经网络的语义分割方法,其特征在于包括以下步骤:
步骤1、获取训练图像数据;
步骤2、将训练图像数据输入改建得到的多孔全卷积神经网络进行训练;
步骤3、获取需要语义分割的图像数据,并输入至训练后的多孔全卷积神经网络,获得对应的语义分割结果。
进一步地,作为本发明的一种优选技术方案:所述训练的过程为:首先经过三个标准卷积池化模块,之后进行多孔卷积提取更稠密的特征得到尺寸变小的得分图,然后对得分图双线性插值得到原始图像尺寸特征图并作放大处理,最后进行逐像素预测得到分割结果;且训练中利用随机梯度下降法SGD对全卷积神经网络FCN中的参数训练。
更进一步地,作为本发明的一种优选技术方案:训练过程中对所得原始图像尺寸特征图放大处理依次为卷积、批归一化及反卷积处理。
更进一步地,作为本发明的一种优选技术方案:训练过程中利用随机梯度下降法SGD训练所需建立的损失函数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810558048.2/2.html,转载请声明来源钻瓜专利网。