[发明专利]基于密集尺度动态网络的语义分割方法有效
申请号: | 202110574529.4 | 申请日: | 2021-05-25 |
公开(公告)号: | CN113191367B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 李志强;陈曦;刘敏;郑来文;刘小平;姜宛玥;李庆利 | 申请(专利权)人: | 华东师范大学;黄淮学院 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 哈尔滨华夏松花江知识产权代理有限公司 23213 | 代理人: | 杨晓辉 |
地址: | 200062 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 密集 尺度 动态 网络 语义 分割 方法 | ||
基于密集尺度动态网络的语义分割方法,解决了现有DCNN在语义分割时定位精度及同类对象的大尺度变化导致分割困难问题,属于语义分割技术领域。本发明提供一种密集尺度模块DSM,包括按顺序依次连接的n层并行单元,每层并行单元包括m个深度动态局部空洞卷积DDLAC和一个1×1卷积;每个DDLAC是通过将深度空洞卷积调整为由动态局部和有条件参数化卷积而生成的,包括条件滤波器生成网络CFGN和对应的动态局部滤波操作单元DLFO;将骨干网输出的特征图输入到每个CFGN中以生成滤波器集合。将骨干网输出的特征图输入到DSM的第一个DLFO中,每个DLFO在对应的滤波器集合的基础上进行分割,经过n层并行单元生成精细的分割图。
技术领域
本发明涉及基于密集尺度动态网络的语义分割方法,属于语义分割技术领域。
背景技术
语义分割在许多应用中起着重要作用,例如自动驾驶,医学影像,机器人视觉等。尽管基于深度卷积网络(DCNN)的语义分割算法的性能优于传统算法,但仍然面临两个重大挑战:1)大多数DCNN具有空间不变性,这种不变性降低了分割时的定位精度;2)在图像数据中,同类对象的大尺度变化导致分割困难。
当前主流的DCNN由空间域共享的滤波器(权重)组成。它们对局部图像变换具有空间不变性。这种不变性指的是:图像中的对象经过旋转或平移后,仍然能够被DCNN准确识别。这种不变性使得DCNN具有强大的数据抽象能力,非常适合分类任务;但不利于语义分割,因为这会导致分割时的定位精度降低。最近的研究表明,用于语义分割的理想滤波器应在空间上变化,以捕获不同位置的独特特征。而理想的DCNN应该是动态的,它可以将信息从共享空间域DCNN的通道维度转换为空间维度,并自动将不同的滤波器分配给空间维度上的不同对象区域。
物体的大尺度变化是指同一类别物体表现为十分多样的尺寸,大小差别极大。这是由于物体到相机的距离不同而引起的。这导致难以分割过大的或极小物体。大物体可能会超出DCNN的感受野,从而导致不连续的预测。小物体在感受野中的占比非常小,导致在感受野内看不见。
发明内容
针对现有DCNN在语义分割时定位精度及同类对象的大尺度变化导致分割困难问题,本发明提供一种基于密集尺度动态网络的语义分割方法。
本发明的一种基于密集尺度动态网络的语义分割方法,包括:
S1、将待分割的语义图像输入至骨干网中,得到特征图xA;
S2、将特征图输入至密集尺度模块DSM对输入图像进行语义分割,获取最终分割图,包括:
所述密集尺度模块DSM包括按顺序依次连接的n层并行单元,每层并行单元包括m个深度动态局部空洞卷积和一个1×1卷积,每层并行单元的输出为m个深度动态局部空洞卷积DDLAC的输出与1×1卷积的乘积;每个深度动态局部空洞卷积DDLAC包括条件滤波器生成网络CFGN和动态局部滤波操作单元DLFO;
特征图xB输入至深度动态局部空洞卷积DDLAC的动态局部滤波操作单元DLFO中,第1层并行单元的深度动态局部空洞卷积DDLAC中输入的特征图xB为所述特征图xA,第2层至第n层并行单元的深度动态局部空洞卷积DDLAC中输入的特征图xB为前一层并行单元的输出;
特征图xA同时输入至各深度动态局部空洞卷积DDLAC的条件滤波器生成网络CFGN中,每个条件滤波器生成网络生成形状为(Kh×Kω,H,W,CB)的动态局部滤波器集合F,实现动态获取不同的滤波器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学;黄淮学院,未经华东师范大学;黄淮学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110574529.4/2.html,转载请声明来源钻瓜专利网。