[发明专利]基于密集尺度动态网络的语义分割方法有效
| 申请号: | 202110574529.4 | 申请日: | 2021-05-25 |
| 公开(公告)号: | CN113191367B | 公开(公告)日: | 2022-07-29 |
| 发明(设计)人: | 李志强;陈曦;刘敏;郑来文;刘小平;姜宛玥;李庆利 | 申请(专利权)人: | 华东师范大学;黄淮学院 |
| 主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 哈尔滨华夏松花江知识产权代理有限公司 23213 | 代理人: | 杨晓辉 |
| 地址: | 200062 上*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 密集 尺度 动态 网络 语义 分割 方法 | ||
1.一种基于密集尺度动态网络的语义分割方法,其特征在于,所述方法包括:
S1、将待分割的语义图像输入至骨干网中,得到特征图xA;
S2、将特征图输入至密集尺度模块DSM对输入图像进行语义分割,获取最终分割图,包括:
所述密集尺度模块DSM包括按顺序依次连接的n层并行单元,每层并行单元包括m个深度动态局部空洞卷积和一个1×1卷积,每层并行单元的输出为m个深度动态局部空洞卷积DDLAC的输出与1×1卷积的乘积;每个深度动态局部空洞卷积DDLAC包括条件滤波器生成网络CFGN和动态局部滤波操作单元DLFO;
特征图xB输入至深度动态局部空洞卷积DDLAC的动态局部滤波操作单元DLFO中,第1层并行单元的深度动态局部空洞卷积DDLAC中输入的特征图xB为所述特征图xA,第2层至第n层并行单元的深度动态局部空洞卷积DDLAC中输入的特征图xB为前一层并行单元的输出;
特征图xA同时输入至各深度动态局部空洞卷积DDLAC的条件滤波器生成网络CFGN中,每个条件滤波器生成网络生成形状为(Kh×Kω,H,W,CB)的动态局部滤波器集合F,实现动态获取不同的滤波器;
每个深度动态局部空洞卷积DDLAC利用动态局部滤波操作单元DLFO从特征图xB中提取出形状为(H,W,CB,Kh×Kω)的数据块,并与相对应的条件滤波器生成网络CFGN生成的动态局部滤波器集合F进行相乘,作为深度动态局部空洞卷积DDLAC的输出;
Kh表示滤波器内核高度,Kω表示滤波器内核宽度,H表示特征图xB的高度,W表示特征图xB的宽度,CB表示特征图xB的通道数;
第n层并行单元的输出为最终分割图;
所述条件滤波器生成网络CFGN生成动态局部滤波器集合F的过程包括:
根据特征图xA生成类别概率图PA;
αi,j,n表示PA中的元素,表示感受野的数量;
初始化滤波器生成形状为(Kh,Kω,CB,N)的可学习滤波器集FL,FL(c,n)表示可学习滤波器集FL中形状为(Kh,Kω)的滤波器,c∈{1,2,...,CB};
使用αi,j,n参数化相应的滤波器FL(c,n)来生成条件动态局部滤波器F(i,j,c):
i∈{1,2,...,H},j∈{1,2,...,W};
所有条件动态局部滤波器F(i,j,c)组成形状为(Kh×Kω,H,W,CB)的动态局部滤波器集合F;
其中,Sample(·)表示采样操作,Softmax(·)表示回归模型,表示1×1的卷积;
所述动态局部滤波操作单元DLFO从特征图xB中提取出数据块,并与相对应的条件滤波器生成网络CFGN生成的动态局部滤波器集合F进行相乘的过程包括:
提取特征图xB中每个像素xB(i,j,c)的带洞图像块Pat(i,j,c),Pat(i,j,c)具有Kh×Kω个元素,Pat(i,j,c)中的元素为:
其中x(·)表示Pat(i,j,c)中的元素,rh表示带洞率的高度,rω表示带洞率的宽度;
所有带洞图像块Pat(i,j,c)形成形状为(H,W,CB,Kh×Kω)的数据块Pat,该数据块Pat与形状为(Kh×Kω,H,W,CB)的动态局部滤波集F的乘积为:
Output=Pat·F。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学;黄淮学院,未经华东师范大学;黄淮学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110574529.4/1.html,转载请声明来源钻瓜专利网。





