[发明专利]一种面向自动驾驶的实时语义分割方法及系统在审
| 申请号: | 202010314054.0 | 申请日: | 2020-04-20 |
| 公开(公告)号: | CN111462127A | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 金伟正;蔡凌云 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06T7/10 | 分类号: | G06T7/10 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 胡琦旖 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 自动 驾驶 实时 语义 分割 方法 系统 | ||
1.一种面向自动驾驶的实时语义分割方法,其特征在于,采用三分支结构网络,所述三分支结构网络分别输入同一张但具有不同分辨率的图像,所述三分支结构网络分别输出具有不同维度的特征图,三个具有不同维度的特征图通过逐级融合后得到最终语义分割结果信息。
2.根据权利要求1所述的面向自动驾驶的实时语义分割方法,其特征在于,不同维度的特征图进行融合时,图像语义分割算法模型包括监督损失计算;
所述监督损失计算为将标签图像缩放到与每一分支的特征图同等维度,利用缩放后的标签图像与1*1卷积分类之后的特征图通过归一化指数函数Softmax进行交叉熵损失函数的计算;
三分支结构网络的总损失值表示为:
Loss=α1L1+α2L2+α3L3
式中,Loss是总损失值;α1、α2、α3是三分支分别对应的三个调节权重;L1、L2、L3是三分支分别对应的三个不同维度特征的损失值。
3.根据权利要求2所述的面向自动驾驶的实时语义分割方法,其特征在于,所述交叉熵损失函数采用抑制性交叉熵损失函数;所述抑制性交叉熵损失函数的定义为:
式中,Si是归一化指数函数Softmax的输出概率值;μ和γ是参量;LICEloss是抑制性交叉熵损失函数值。
4.根据权利要求1所述的面向自动驾驶的实时语义分割方法,其特征在于,所述三分支结构网络包括下分支、中分支、上分支,所述下分支输入具有原始分辨率的图像,所述中分支输入具有原始分辨率1/2的图像,所述上分支输入具有原始分辨率1/4的图像;
所述下分支的输入图像经过下采样模块后得到具有原始分辨率1/8的图像,记为第一图像,所述第一图像为具有低维特征的特征图;
所述中分支的输入图像经过下采样模块后得到具有原始分辨率1/4的图像,记为第二图像;所述第二图像经过卷积层模块后得到具有原始分辨率1/16的图像,记为第三图像,所述第三图像为具有中间层特征的特征图;
所述上分支的输入图像经过下采样模块后得到具有原始分辨率1/8的图像,记为第四图像;所述第四图像经过卷积层模块与空洞卷积后得到具有原始分辨率1/32的图像,记为第五图像,所述第五图像为具有高维特征的特征图。
5.根据权利要求4所述的面向自动驾驶的实时语义分割方法,其特征在于,所述下采样模块用于将输入图像分为两路,一路经过步长为2的卷积层进行下采样,另一路经过2*2池化来下采样,两路的输出结果通过拼接、1*1卷积后实现融合。
6.根据权利要求4所述的面向自动驾驶的实时语义分割方法,其特征在于,所述第五图像经过第一PSP模块处理后作为第一高维特征图,所述第三图像作为第一低维特征图,所述第一低维特征图与所述第一高维特征图分别输入至第一融合模块中,所述第一融合模块输出第一融合特征图,所述第一融合特征图为具有原始分辨率1/16的图像;
所述第一融合特征图经过第二PSP模块处理后作为第二高维特征图,所述第一图像作为第二低维特征图,所述第二低维特征图与所述第二高维特征图分别输入至第二融合模块中,所述第二融合模块输出第二融合特征图,所述第二融合特征图为具有原始分辨率1/8的图像。
所述第二融合特征图经过第三PSP模块处理后得到最终融合特征图。
7.根据权利要求6所述的面向自动驾驶的实时语义分割方法,其特征在于,所述最终融合特征图经过后处理模块后得到最终语义分割结果信息,所述最终语义分割结果信息中的不同物体类别用不同颜色进行标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010314054.0/1.html,转载请声明来源钻瓜专利网。





