[发明专利]特征映射复用编解码器架构网络及快速分割方法有效
| 申请号: | 201911065906.0 | 申请日: | 2019-11-04 |
| 公开(公告)号: | CN110796205B | 公开(公告)日: | 2023-03-24 |
| 发明(设计)人: | 刘桂雄;黄坚 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/774;G06V10/82;G06N3/0464 |
| 代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 陈新胜 |
| 地址: | 510640 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 特征 映射 编解码器 架构 网络 快速 分割 方法 | ||
1.特征映射复用编解码器架构网络及快速分割方法,其特征在于,所述方法包括构建两路语义分割网络、确定可共用关键层结构及逐个合并可共用关键层结构,得到特征映射复用编-解码器架构网络优化结构;具体包括以下步骤:
步骤A、训练两路语义分割网络达到机器视觉应用需求,设两路语义分割网络为网络A与网络B,并设网络A与网络B像素准确率分别为PAA、PAB,以及总分割时间为Tseg;
步骤B、分析主干网络可共用关键层结构,主干网络ηmain关键层结构使特征图分辨率降低即降采样或特征图数量增加即维数增加;
步骤C、分析密集预测网络可共用关键层结构,密集预测网络ηseg关键层结构使特征图分辨率增大即升采样或特征图数量变化即维数变化;
步骤D、逐个合并可共用关键层结构,重新训练不同共用层结构数量nshare的两路语义分割网络,得到PAA(nshare)、PAB(nshare)、Tseg(nshare);
步骤E、根据PAA(nshare)、PAB(nshare)、Tseg(nshare)综合得到最优共用层结构数量nshare,并定为特征映射复用编-解码器架构网络优化结构,实现快速复杂背景语义分割应用;
所述步骤A具体包括:训练无共用层结构的两路语义分割网络nshare=0达到机器视觉应用需求,得到其PAA(0)、PAB(0)、Tseg(0);若CNN层结构超参数一致,该层结构就是可共用层结构;若能够变换特征图的解析度或维数的关键层结构共用,就是共用关键层结构;设网络A、网络B相同结构数量为nshare_max,则nshare定义域为nshare=1,2...nshare_max,每个nshare取值都是一个新语义分割网络结构。
2.如权利要求1所述的特征映射复用编解码器架构网络及快速分割方法,其特征在于,所述步骤B中,主干网络为VGG、ResNet、ResNext,特征图分辨率变化为1/1→1/2→1/4→1/8→1/16→1/32,特征图数量变化为3→128→256→512→1024→2048的位置。
3.如权利要求1所述的特征映射复用编解码器架构网络及快速分割方法,其特征在于,所述步骤C中:如层结构组PPMA-PPMB、CUP-A1-CUP-B1、CUP-A2-CUP-B2、CUP-A3-CUP-B3是密集预测网络ηseg可共用关键层结构,分别实现特征图分辨率增大即升采样或特征图数量变化即维数变化,特征图分辨率变化为1/32→1/32→1/16→1/8→1/4的位置。
4.如权利要求1所述的特征映射复用编解码器架构网络及快速分割方法,其特征在于,所述步骤D中:对于某一个语义分割网络,共用层结构数量nshare、专用过渡层结构数量nspec之和一定,若nshare增加,则nspec减少,nshare增加PAA(nshare)、PAB(nshare)与Tseg(nshare)均降低。
5.如权利要求1所述的特征映射复用编解码器架构网络及快速分割方法,其特征在于,所述步骤E中:根据PAA(nshare)、PAB(nshare)、Tseg(nshare)综合得到最优共用层结构数量nshare,就是PAA(nshare)、PAB(nshare)能够满足机器视觉应用需求、且nshare最大的网络,这时具有最小的Tseg(nshare),即两路语义分割网络具有最快的分割速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911065906.0/1.html,转载请声明来源钻瓜专利网。





