[发明专利]一种复杂街景图像语义分割方法有效

专利信息
申请号: 202010389518.4 申请日: 2020-05-10
公开(公告)号: CN111563909B 公开(公告)日: 2023-05-05
发明(设计)人: 张丹;刘京;余义德;孙杰;王红萍;时光;张志伟;裴立冠 申请(专利权)人: 中国人民解放军91550部队
主分类号: G06T7/11 分类号: G06T7/11;G06V10/80;G06V10/764
代理公司: 天津耀达律师事务所 12223 代理人: 侯力
地址: 116023 *** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 复杂 街景 图像 语义 分割 方法
【权利要求书】:

1.一种复杂街景图像语义分割方法,包括:

第1步、获得待处理图像;

第2步、采用DCNN提取包含位置信息的低级特征;

第3步、采用R-ASPP方法,获取图像足够的高级语义几何和纹理信息;具体操作包括:

考虑多尺度图像特征可以包含更多的特征信息,将第2步操作得到的DCNN输出图像特征经空间金字塔池化模块转换为五个分支;将除全局池化分支外的其余分支经过3×3的普通卷积进一步学习特征图中重要的内容信息,并且采用跳远连接的方式将R-ASPP的原始输入传递到此处与由进一步3×3的普通卷积获取到的图像特征进行融合,将五个分支的输出按照通道维度拼接起来作为R-ASPP部分的输出;

第4步、采用AT-Decoder模块将不同网络结构各部分的特征进行处理和融合;具体操作包括:

采用AT-Decoder模块的DF分支、DC分支和DD分支三种不同网络结构对各部分的特征分别进行处理,最后将各分支得到的结果依次在通道维度上融合;首先,将DF分支的输出与DC分支的输出进行相乘运算得到B2,之后,将B2与DC分支的输出进行相加运算,得到特征图B3,最后使用3×3卷积对融合后的特征图进一步学习特征,得到特征图B4;其中,

采用DF分支处理DCNN学到的包含细节信息在内的低层级特征,设计一个简单的空间注意力模型,使用3×3卷积操作进一步学习主要特征,并采用softmax函数对于特征进行分类;

采用DC分支对DCNN的输出特征图和R-ASPP的输出特征图在通道维度的拼接,使用3×3卷积直接提取包含准确位置信息和完整几何、纹理信息特征;

采用DD分支对编码器模块输出的高层语义特征进行处理,包括设计基于通道的注意力模块关注特征图通道之间的关系,所述注意力模块由两个子分支构成,分别为最大池化和平均池化子分支;随后,加入全连接层,对于各通道之间的特征图进行融合;最后,将最大池化和平均池化两个子分支得到的结果特征图进行融合,以得到包含更多图像信息的通道特征;

第5步、采用双线性插值上采样操作得到最终的分割结果图像。

2.如权利要求1所述复杂街景图像语义分割方法,其特征在于:

所述平均池化子分支能够通过全局描述特征,对特征图中的每一个像素点都有反馈,而最大池化子分支在进行梯度反向传播计算时,只有特征图中响应最大的像素点有梯度的反馈,从而能够作为一个补充。

3.如权利要求1或2所述复杂街景图像语义分割方法,其特征在于,所述第5步的操作包括:

采用双线性插值上采样操作,在保留更多图像特征内容的同时,将图像还原为原图像分辨率大小,得到最终的分割结果图像B5。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军91550部队,未经中国人民解放军91550部队许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010389518.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top