[发明专利]特征映射复用编解码器架构网络及快速分割方法有效
申请号: | 201911065906.0 | 申请日: | 2019-11-04 |
公开(公告)号: | CN110796205B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 刘桂雄;黄坚 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/774;G06V10/82;G06N3/0464 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 陈新胜 |
地址: | 510640 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 映射 编解码器 架构 网络 快速 分割 方法 | ||
本发明公开了一种特征映射复用编解码器架构网络及快速分割方法,该方法包括构建两路语义分割网络、确定可共用关键层结构以及逐个合并可共用关键层结构,得到特征映射复用编‑解码器架构网络优化结构;本发明在重点考虑网络语义分割准确度‑特征复用程度出发下,提出基于特征映射复用的快速复杂背景语义分割技术,基于相同特征图,完成不同视觉任务,即实现特征映射复用;通过改变共用层结构数量nshare,得到综合优化像素预测准确率PAA(nshare)、像素预测准确率PAB(nshare)、语义分割时间Tseg(nshare)指标的网络结构。在部件/零件的无漏检/无误判前提下,共用层结构可有效缩短分割时间。
技术领域
本发明涉及图像分割技术领域,尤其涉及深度学习的快速复杂背景图像语义分割。
背景技术
越来越多的应用场景需要精确且高效的图像分割技术,如自动驾驶、室内导航、甚至虚拟现实与增强现实等。这个需求与视觉相关的各个领域及应用场景下的深度学习技术的发展相符合,尤其是基于深度学习的语义分割技术。语义分割网络中,多孔卷积架构语义分割网络移除主干网络部分池化层空间分辨率较强,主干网络与ASPP模块的约简优化是值得深入研究内容,可以在轻量化语义分割CNN识别应用;编-解码器架构语义分割网络保留更多分类网络中的组件,可用于实现复杂背景下的特征提取;全卷积网络FCN不改变主干网络的卷积层、池化层结构,可同时实现目标检测、语义分割,降低计算复杂度与数据存储。
发明内容
为解决上述技术问题,本发明的目的是提供一种特征映射复用编-解码器架构网络,可基于相同特征图,完成不同视觉任务,即实现特征映射复用,有效缩短分割时间。
本发明的目的通过以下的技术方案来实现:
特征映射复用编解码器架构网络及快速分割方法,该方法包括构建两路语义分割网络、确定可共用关键层结构及逐个合并可共用关键层结构,得到特征映射复用编-解码器架构网络优化结构;具体包括以下步骤:
A训练两路语义分割网络达到机器视觉应用需求,设两路语义分割网络为网络A与网络B,并设网络A与网络B像素准确率分别为PAA、PAB,以及总分割时间为Tseg;
B分析主干网络可共用关键层结构,主干网络ηmain关键层结构使特征图分辨率降低即降采样或特征图数量增加即维数增加;
C分析密集预测网络可共用关键层结构,密集预测网络ηseg关键层结构使特征图分辨率增大即升采样或特征图数量变化即维数变化;
D逐个合并可共用关键层结构,重新训练不同共用层结构数量nshare的两路语义分割网络,得到PAA(nshare)、PAB(nshare)、Tseg(nshare);
E根据PAA(nshare)、PAB(nshare)、Tseg(nshare)综合得到最优共用层结构数量nshare,并定为特征映射复用编-解码器架构网络优化结构,实现快速复杂背景语义分割应用。
与现有技术相比,本发明的一个或多个实施例可以具有如下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911065906.0/2.html,转载请声明来源钻瓜专利网。