[发明专利]一种基于深度学习的轻量级目标语义分割方法有效
申请号: | 202110545310.1 | 申请日: | 2021-05-19 |
公开(公告)号: | CN113223006B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 陈光柱;易佳 | 申请(专利权)人: | 成都理工大学 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06N3/04;G06N3/08;G06T7/181 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610059 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 轻量级 目标 语义 分割 方法 | ||
1.一种基于深度学习的轻量级目标语义分割方法,其特征在于,包括如下步骤:
步骤1:数据集的采集与制作;
首先,建立目标语义分割数据集,根据功能需求将数据集分为不同的类别,利用数据增强的方法扩充数据集;随后,建立目标边缘数据集,利用目标边缘检测算法,对目标语义分割数据集中的目标分割标签图进行处理,得到相应的目标边缘标签图;
步骤2:设计二维语义分割网络—基于边缘约束的多金字塔池化轻量级语义分割网络(Multi Pyramid Pooling Tiny Segmentation Network Based on Edge Constraints,MPPTSNet-EC);
首先,改变MobileNet v2的骨干特征提取网络的第5次下采样特征图的尺寸,将其尺寸扩大为其2倍,并保持其通道数不变,此网络称之为Resized_MobileNet v2;然后,Resized_MobileNet v2将待分割目标图像进行通道扩张、减小尺寸,获得不同尺度的特征图;其次,构建多金字塔池化模块,作为解码器,将第五次下采样的结果与第四次下采样的结果作为多金字塔池化模块的输入,进行不同尺度的特征信息融合;最后,利用分类器将多金字塔池化处理后的结果转为目标分割预测图;
步骤3:构建合适的损失函数,加速整个网络的收敛,达到网络最优状态;
首先,构建交叉熵损失函数L1:
式中,M代表样本中的类别数量,pc表示预测图像属于类别c的概率,yc表示为一个独热(one-hot)向量,由0与1两种元素构成,当预测值等于样本值为1,反之为0;
而当样本中前景所占比例较小时,交叉熵损失函数会使得整个网络趋于背景,严重影响网络精度,由此引出DiceLoss损失函数L2:
式中,X代表了样本标签,Y代表了预测结果,|X∩Y|表示了这两者之间的公共元素,|X|、|Y|分别代表了两者中元素的个数;
对目标边缘构建一个分类的损失函数L3,其中,y表示边缘点,p(y)为该样本属于边界类的概率:
L3=-(ylog(p(y))+(1-y)log(1-p(y))),
综上所述,构建损失函数L:
L=L1+L2+L3,
利用损失函数L共同来进行MPPSNet-EC网络的训练;
步骤4:加入边缘约束网络,提高编码器对目标图像边缘信息的提取能力;
首先将Resized_MobileNet v2提取的不同尺度的特征图作为边缘约束网络的输入;随后利用不同的1×1卷积对不同尺度的特征图进行处理,再将处理后的结果上采样至目标原图尺寸大小并进行融合;最后,对1×1卷积处理融合后的特征图经过Sigmoid函数处理,得到最后的目标边缘预测图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都理工大学,未经成都理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110545310.1/1.html,转载请声明来源钻瓜专利网。