[发明专利]低计算量及高度特征融合的实时语义分割方法在审

专利信息
申请号: 202010350414.2 申请日: 2020-04-28
公开(公告)号: CN111488884A 公开(公告)日: 2020-08-04
发明(设计)人: 杨绿溪;朱紫辉;王路;顾恒瑞;李春国;黄永明 申请(专利权)人: 东南大学
主分类号: G06K9/34 分类号: G06K9/34;G06K9/62;G06N3/04;G06N3/08;G06T3/40;G06T9/00
代理公司: 南京众联专利代理有限公司 32206 代理人: 蒋昱
地址: 210096 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 计算 高度 特征 融合 实时 语义 分割 方法
【说明书】:

发明公开了一种低计算量及高度特征融合的实时语义分割方法。该方法网络结构为基于深度可分离卷积的多分支特征跨层融合的编码‑解码结构。该方法利用不同分辨率的原始图像作为多分支的输入,再通过由深度可分离卷积组成的残差模块提取特征,之后对多分支的不同阶段进行特征传递,提高了各阶段特征利用率。本发明在Cityscapes数据集上进行测试,取得了很好的实验结果:达到112.3Fps和65.6%的mIoU。可以在满足计算精度的同时达到实时分割的效果。

技术领域

本发明涉及计算机视觉领域,特别是涉及低计算量及高度特征融合的实时语义分割方法。

背景技术

近年来,随着并行计算理论和硬件实现水平的不断突破,计算机视觉领域得到了极大的发展。尤其是2012年ILSVRC(ImageNet Large Scale Visual RecognitionChallenge)比赛中,基于卷积神经网络的AlexNet夺得分类项目的冠军,引发了深度学习的热潮,深度学习技术开始大放异彩。目前,在计算机视觉领域,深度学习,尤其是卷积神经网络,在各种视觉识别任务中,发挥着越来越重要的作用。

语义分割是对图像进行密集预测,推断每个像素的分类标签。主要应用于静态的2D图像、视频、甚至3D数据,是计算机视觉领域的关键问题之一。语义分割的主要目的是促进对完整场景的理解。越来越多的应用程序通过根据图像推断信息,使场景理解作为核心计算机视觉问题的重要性逐渐凸显。其中的应用包括自动驾驶、人机交互、计算机摄影、图像搜索引擎和增强现实等等。

传统的图像分割是非监督式学习问题,只是将相似的像素划分到一起,不必带有类别的训练样本。传统的计算机视觉和机器学习技术,已经可以解决场景理解的问题,但还是无法准确地分割出目标。而近年研究的图像语义分割是一种监督学习问题,要利用带有类别的训练样本进行目标识别。图像语义分割结合了分割与目标识别这两种技术,能够将图像分割成具有高级语义内容的区域。例如,通过语义分割,一幅图像能够分割成分别具有“车辆”、“行人”、“树”和“道路”四种不同语义的区域。

目前,最成功最先进的语义分割深度学习技术都源于全卷积神经网络,这种方法是利用现有的卷积神经网络作为强大的视觉模型,学习特征的层次结构。

2015年,UC Berkeley的Jonathan Long等人提出了用于语义分割的全卷积神经网络(Fully Convolutional Networks,FCN)。该方法将现有的和众

所周知的分类模型:AlexNet,VGG-16,GoogLeNet和ResNet转换为完全卷积的模型,即使用卷积替换完全连接层,输出空间特征图而不是分类得分数。这里使用反卷积进行上采样,从而生成密集的每像素标记输出。FCN被认为是深度学习解决语义分割问题的基石,因为它展示了如何利用CNN针对这个问题进行端到端的训练,并且有效地学习了对任意大小的输入进行密集预测。与传统方法相比,这种方法在在PASCAL VOC等标准数据集上的分割精度明显较高,同时还保持了计算的效率。

除了FCN架构之外,研究人员还开发了其他的变体网络,新的分割网络使用“编码-解码”的结构。编码过程是进行卷积提取特征并产生低分辨率图像或者特征映射。解码过程是将产生的低分辨率图像解码或映射到用于分割的像素预测。U-Net和SegNet就是基于“编码器-解码器”结构的语义分割网络,并且有着很好的性能,在分割任务中有着较好的表现。

现有的图像语义分割方法已经达到了较高精度的分割水平。但是对于自动驾驶等应用需要实时性较高的应用来说,语义分割庞大的计算量对其是一种巨大的挑战。在现有的实时语义分割方法中,主要有两类解决算法。有一类是利用视频帧之间的相关性,通过选取关键帧,减少冗余来进行视频语义分割。还有一类是通过降低计算成本的方法来提高算法运算的实时性。

所以,减小语义分割网络的计算量同时保证其语义分割精度是目前语义分割研究的一个热点问题。本发明选用降低计算量的方法来降低语义分割算法的运算时间,同时提高特征利用率,提高网络的计算精度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010350414.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top