[发明专利]一种基于金字塔网络的语义分割方法有效
| 申请号: | 201910711584.6 | 申请日: | 2019-08-02 | 
| 公开(公告)号: | CN110633706B | 公开(公告)日: | 2022-03-29 | 
| 发明(设计)人: | 颜成钢;宋家驹;张旗;许瑶江;李明珠;孙垚棋;张继勇;张勇东 | 申请(专利权)人: | 杭州电子科技大学 | 
| 主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V20/70;G06V10/764;G06V10/774;G06V10/766;G06V10/82;G06K9/62 | 
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 | 
| 地址: | 310018 浙*** | 国省代码: | 浙江;33 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 金字塔 网络 语义 分割 方法 | ||
本发明公开了一种基于金字塔网络的语义分割方法。本发明包括如下步骤:1:场景RGB图片经过预训练模型提取出特征图Ⅰ,特征图Ⅰ的大小为输入的场景RGB图片的1/8大小;2:在池化前,记录特征图Ⅰ的最大池化值,然后基于池化和卷积操作,对步骤1提取出的特征图Ⅰ进行4个不同尺度的维度处理,得到4个不同维度的特征图;3:通过上采样层将4个不同维度的特征图合并成池化前相同大小的特征图Ⅱ;4:将步骤3所得到的特征图Ⅱ经过一个编码器和解码器,得到特征图Ⅲ;5:将特征图Ⅲ与特征图Ⅱ合并,生成特征图Ⅳ;6:将步骤5获得的特征图Ⅳ再经过一个卷积层,得到最终输出。本发明提高了算法的检测精度,提高了分割的准确率。
技术领域
本发明属于计算机视觉技术领域,特别地,本发明涉及一种基于金字塔网络的语义分割方法。
背景技术
语义分割的场景分析是计算机视觉中的基本主题。目标是为图像中的每个像素分配一个类别标签。场景解析提供了对场景的完整理解。它预测每个元素的标签,位置和形状。该主题对于自动驾驶,机器人传感等潜在应用具有广泛的兴趣。正是由于语义分割具有重大的应用价值和科研价值,语义分割新方法的提出就显得极为重要。
整体而言,语义分割是一种旨在于场景理解的高难度任务。场景理解作为计算机视觉的核心问题,在从图像提取知识应用数量急剧增长的今天显得尤为重要。这些应用包括:自动驾驶、人机交互、计算机摄影、图像搜索引擎、及增强现实。这些问题在过去已经使用多种计算机视觉及机器学习的方法得以解决。尽管这些方法深受欢迎,但深度学习已经改变了这个局面,许多计算机视觉的问题—包括语义分割—正在被使用深度框架解决,通常是CNNs(Convolutional Neural Networks,卷积神经网络),其能够显著地提高准确率,有时甚至是效率。然而,深度学习相比机器学习及计算机视觉的其他分支还远未成熟。鉴于此,关于深度学习现状的概述及回顾还较少。由于大量的文献的发表,这让研究人员开始研究、紧跟发展趋势变得异常耗时。这让了解语义分割发展趋势,并且合适地解读他们的方案,修正欠佳结果,验证结果变得相对困难。
在计算机视觉领域中,对语义分割结果的新方法的提出都是人们一直以来所追求的事情。因此,在本发明中提出一种新的语义分割方法,可以对场景进行联想,从而大大的提高了分割的正确率,并且在拥有较高分辨率的同时,对于分割结果的边界的定位也能较为准确。
发明内容
本发明的目的在于克服现有技术的不足,提出一种基于金字塔网络的语义分割方法。其中输入为一张场景RGB图片,该方法利用卷积神经网络(CNN)、池化(pooling)、空洞卷积、上采样、卷积层进行相互迭代,本发明解决其技术问题是采取以下技术方案实现的:
步骤1:场景RGB图片经过预训练模型提取出特征图Ⅰ,特征图Ⅰ的大小为输入的场景RGB图片的1/8大小。
步骤2:在池化前,记录特征图Ⅰ的最大池化值,然后基于池化和卷积操作,对步骤1提取出的特征图Ⅰ进行4个不同尺度的维度处理,得到4个不同维度的特征图;
步骤3:通过上采样层将4个不同维度的特征图合并成池化前相同大小的特征图Ⅱ。
步骤4:将步骤3所得到的特征图Ⅱ经过一个编码器和解码器(encoder-decoder过程),得到特征图Ⅲ;
步骤5:将特征图Ⅲ与特征图Ⅱ合并,生成特征图Ⅳ;
步骤6:将步骤5获得的特征图Ⅳ再经过一个卷积层,得到最终输出。
本发明的特点及有益效果:
本发明利用金字塔解析网络进行特征提取,并对其结果进行了较大程度的优化,提高了算法的检测精度,克服了现有技术的不足,可以提取全集特征,进行场景联想,从而提高分割的准确率,并且拥有比较高的分辨率和较为准确的分割边界定位,获得了良好的目标检测结果。
附图说明
图1为步骤1中的部分附图说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910711584.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低照度成像车牌识别方法及装置
 - 下一篇:预测速度的方法和装置
 





