[发明专利]一种基于多监督网络的道路场景图像语义分割方法在审

申请号：	202110823118.4	申请日：	2021-07-21
公开（公告）号：	CN113362349A	公开（公告）日：	2021-09-07
发明（设计）人：	周武杰;董少华;强芳芳;许彩娥	申请（专利权）人：	浙江科技学院
主分类号：	G06T7/11	分类号：	G06T7/11;G06K9/62;G06N3/04;G06N3/08
代理公司：	杭州求是专利事务所有限公司 33200	代理人：	林超
地址：	310023 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于监督网络道路场景图像语义分割方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多监督网络的道路场景图像语义分割方法，其特征在于，包括训练阶段和测试阶段两个过程；

所述的训练阶段过程的具体步骤为：

步骤1_1：选取多幅原始道路场景RGB图像和对应的原始Thermal热红外图像以及真实语义分割图像，将每幅原始道路场景RGB图像和原始Thermal热红外图像分别通过裁剪、明亮度、翻转方式进行数据增强之后获得初始道路场景RGB图像和初始Thermal热红外图像，由多幅初始道路场景RGB图像和初始Thermal热红外图像以及对应的真实语义分割图像构成训练集；

步骤1_2：构建卷积神经网络；

步骤1_3：将训练集输入到卷积神经网络中进行训练，卷积神经网络输出训练集中的每幅原始道路场景RGB图像对应的七个预测图集合；

步骤1_4：将每幅原始道路场景RGB图像对应的真实语义分割图像处理成9幅独热编码图像并将9幅独热编码图像的集合记为J_true，分别计算9幅独热编码图像的集合J_true与对应的七个预测图集合之间的损失函数值，将七个损失函数值之和作为最终损失值；

步骤1_5：重复执行步骤1_3和步骤1_4共V次，直到卷积神经网络收敛达到饱和，获得卷积神经网络分类训练模型；将此时得到的网络的权值矢量和偏置作为卷积神经网络分类训练模型的最优权值矢量和最优偏置项；

所述的测试阶段过程的具体步骤为：

步骤2：将多幅待语义分割的原始道路场景RGB图像和原始Thermal热红外图像输入卷积神经网络分类训练模型中，利用最优权值矢量和最优偏置项进行预测，获得对应的语义分割预测图。

2.根据权利要求1所述的一种基于多监督网络的道路场景图像语义分割方法，其特征在于：所述卷积神经网络包括编码模块和解码模块两部分，编码模块与解码模块相连；

编码模块包括10个编码模块，解码模块包括语义AHLS模块、多任务监督RM模块、5个信息融合FM模块、5个特征融合AMMF模块和3个语义监督MLF模块；

第一编码模块依次经第二编码模块、第三编码模块、第四编码模块和第五编码模块后与语义AHLS模块相连，第六编码模块依次经第七编码模块、第八编码模块、第九编码模块和第十编码模块后与语义AHLS模块相连，第一编码模块的输入为初始道路场景RGB图像，第六编码模块的输入为初始Thermal热红外图像；

第五编码模块、语义AHLS模块和第十编码模块与第一特征融合AMMF模块相连，第一特征融合AMMF模块的输出与语义AHLS模块的输出分别输入到第一信息融合FM模块的第一输入和第二输入中，第一信息融合FM模块的输出和语义AHLS模块的输出同时输入到第一语义监督MLF模块，第一语义监督MLF模块的输出作为卷积神经网络的第二输出；

第四编码模块的输出、第一信息融合FM模块的输出和第九编码模块的输出输入到第二特征融合AMMF模块，第二特征融合AMMF模块的输出与语义AHLS模块的输出分别输入到第二信息融合FM模块的第一输入和第二输入中，第二信息融合FM模块的输出、第三编码模块的输出和第八编码模块的输出同时输入到第三特征融合AMMF模块，第三特征融合AMMF模块的输出与语义AHLS模块的输出分别输入到第三信息融合FM模块的第一输入和第二输入中，第二信息融合FM模块的输出和第三信息融合FM模块的输出同时输入到第二语义监督MLF模块，第二语义监督MLF模块的输出作为卷积神经网络的第三输出；

第二编码模块的输出、第三信息融合FM模块的输出和第七编码模块的输出输入到第四特征融合AMMF模块，第四特征融合AMMF模块的输出与语义AHLS模块的输出分别输入到第四信息融合FM模块的第一输入和第二输入中，第四信息融合FM模块的输出、第一编码模块的输出和第六编码模块的输出输入到第五特征融合AMMF模块，第五特征融合AMMF模块的输出与语义AHLS模块的输出分别输入到第五信息融合FM模块的第一输入和第二输入中，第四信息融合FM模块的输出和第五信息融合FM模块的输出同时输入到第三语义监督MLF模块，第三语义监督MLF模块的输出作为卷积神经网络的第四输出；第五信息融合FM模块的输出作为卷积神经网络的第一输出，第五信息融合FM模块的输出输入到多任务监督RM模块，多任务监督RM模块的第一输出、第二输出和第三输出分别作为卷积神经网络的第五输出、第六输出和第七输出。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江科技学院，未经浙江科技学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110823118.4/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多监督网络的道路场景图像语义分割方法在审

专利文献下载