[发明专利]基于卷积神经网络跨模态融合的道路场景语义分割方法在审
| 申请号: | 202110308057.8 | 申请日: | 2021-03-23 |
| 公开(公告)号: | CN112991364A | 公开(公告)日: | 2021-06-18 |
| 发明(设计)人: | 周武杰;刘劲夫;叶宁;雷景生;万健;钱小鸿;甘兴利 | 申请(专利权)人: | 浙江科技学院 |
| 主分类号: | G06T7/11 | 分类号: | G06T7/11;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 韩迎之 |
| 地址: | 310023 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 卷积 神经网络 跨模态 融合 道路 场景 语义 分割 方法 | ||
1.一种基于卷积神经网络跨模态融合的道路场景语义分割方法,其特征在于,包含以下步骤:
选取多幅原始的道路场景图像及每幅原始的道路场景图像对应的真实语义分割图像,由所述多幅原始的道路场景图像和所述每幅原始的道路场景图像对应的标签图构成训练集;
构建带有跨模态融合和注意力机制优化、恢复分辨率和增强语义信息的卷积神经网络;
将所述训练集输入到所述卷积神经网络中进行训练,得到所述训练集中的每幅原始的道路场景图对应的预测图;
获取所述预测图的加和损失函数值;
多次对神经网络进行训练得到卷积神经网络分类训练模型。
2.根据权利要求1所述的一种基于卷积神经网络跨模态融合的道路场景语义分割方法,其特征在于,所述标签图包括热力图、彩色热力图像、语义分割标签图、前景标签图和边界标签图。
3.根据权利要求1所述的一种基于卷积神经网络跨模态融合的道路场景语义分割方法,其特征在于,所述预测图包括语义分割预测图、前景背景预测图和边界预测图。
4.根据权利要求3所述的一种基于卷积神经网络跨模态融合的道路场景语义分割方法,其特征在于,所述加和损失函数值的获取如下:
利用Lovász-Softmax损失函数计算分割标签图的损失函数值,利用分类交叉熵计算前景背景标签图的损失函数值和边界标签图的损失函数值,分割标签图的损失函数值,前景背景标签图的损失函数值和边界标签图的损失函数值相加获得加和损失函数值。
5.根据权利要求1所述的一种基于卷积神经网络跨模态融合的道路场景语义分割方法,其特征在于,构建带有跨模态融合和注意力机制优化、恢复分辨率和增强语义信息的卷积神经网络具体过程如下:
第一输入层、第一初始神经网络块、第一残差神经网络块、第二残差神经网络块、第三残差神经网络块和第四神经网络块依次连接,第二输入层、第二初始神经网络块、第五残差神经网络块、第六残差神经网络块、第七残差神经网络块和第八残差神经网络块依次连接,第一初始神经网络块与第二初始神经网络块的输出共同作为第一融合块的输入,第一融合块的输出记为第一侧边输出,第一残差神经网络块与第五残差神经网络块的输出作为第二融合块的输入,第二融合块的输出记为第二侧边输出,将第二残差神经网络块和第六残差神经网络块的输出做元素的加和,记为第三侧边输出,将第三残差神经网络块输出与第七残差神经网络块输出的加和记为第四侧边输出,将第四残差神经网络块输出与第八残差神经网络块输出的加和记为第五侧边输出;
将经过第三过渡层的所述第五侧边输出作为第一解码块的输入,所述第一解码块的输出与经过第二过渡层的所述第四侧边输出的元素加和作为第二解码块的输入,所述第二解码块的输出与经过第一过渡层的所述第三侧边输出的元素加和作为第三解码块的输入,将所述第三解码块的输出记为指导特征,将所述指导特征进行二倍双线性插值作为第一输出层的输入;
将经过第一过渡层的所述第三侧边输出进行双线性插值,分辨率变为两倍后与所述第二侧边输出元素相加,将所得加和与所述指导特征进行元素相乘,将所得乘积经过二倍双线性插值,将经过插值后的特征作为第二输出层的输入;
将所述第一侧边输出与经过二倍双线性插值处理过的所述指导特征进行元素相乘,将所得乘积作为第三输出层的输入;
所述第一输入层中输入训练集中的原始的道路场景图像,所述第一输入层输出原始的道路场景图像的R通道分量、G通道分量和B通道分量,第二输入层中输入原始的道路场景图像对应的热力图,所述第二输入层输出原始的道路场景图像对应的热力图像。
6.根据权利要求1所述的一种基于卷积神经网络跨模态融合的道路场景语义分割方法,其特征在于,跨模态融合和注意力机制优化通过融合块实现,所述融合块具体连接关系如下:
第一输入端后依次连接最大值选择层和第一卷积层,记输出为A,第二输入端与A进行像素加和,记输出为a,第二输入端与a做像素乘积,记输出为B,A与B做像素加和得到C,C输入第二卷积层得到D,所述第二卷积层后依次连接最大值池化层和第三卷积层,所述第三卷积层的输出与D做像素乘积得到输出。
7.根据权利要求1所述的一种基于卷积神经网络跨模态融合的道路场景语义分割方法,其特征在于,恢复分辨率和增强语义信息通过解码块实现,所述解码块的具有连接关系如下:
输入像素经过三个卷积层后与所述输入像素做像素加和并输入到上采样层中,得到输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江科技学院,未经浙江科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110308057.8/1.html,转载请声明来源钻瓜专利网。





