[发明专利]目标分割系统及其训练方法、目标分割方法及设备有效
| 申请号: | 202110767088.X | 申请日: | 2021-07-07 |
| 公开(公告)号: | CN113486956B | 公开(公告)日: | 2022-03-25 |
| 发明(设计)人: | 张凯;王任;丁冬睿;杨光远 | 申请(专利权)人: | 山东力聚机器人科技股份有限公司 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/80;G06K9/62;G06N3/04;G06T7/11;G06T7/40 |
| 代理公司: | 北京中和立达知识产权代理有限公司 11756 | 代理人: | 孟姣 |
| 地址: | 276808 山东省日照市岚山区安东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标 分割 系统 及其 训练 方法 设备 | ||
1.一种目标分割系统,其特征在于,包括:
语义感知网络,采用全卷积网络形式,包括卷积模块、池化模块和正则化模块,所述语义感知网络设置为获取图像的第一预处理数据,基于所述第一预处理数据提取所述图像的语义特征图;
纹理感知网络,采用无池化的网络形式,包括串行排列的空洞卷积层、特征收缩层、特征扩展层和第一卷积层,所述纹理感知网络设置为获取所述图像的第二预处理数据,基于所述第二预处理数据提取所述图像的纹理特征图;
特征融合层,与所述语义感知网络和所述纹理感知网络连接,设置为对所述语义特征图和所述纹理特征图进行拼接和融合,得到所述图像的目标分割图;
在所述纹理感知网络中,
所述空洞卷积层的数量为多个且串行排列,所述多个空洞卷积层设置为对所述第二预处理数据进行空洞卷积操作,提取所述图像的浅层纹理特征,得到第二特征图;多个所述空洞卷积层为两个核尺寸为3×3、步长为1、膨胀率为(1,2,4)的空洞卷积层,使用不同的膨胀率能够使网络在同一网络层次中获得多层级特征;
所述特征收缩层包括第二卷积层,设置为对所述第二特征图进行通道维度的降维卷积操作,实现所述第二特征图在通道级别的降维;由核尺寸为1×1的卷积构成的特征收缩层;
所述特征扩展层包括第三卷积层,设置为对所述降维后的第二特征图进行通道维度的升维卷积操作,实现降维后的第二特征图在通道级别的升维;由核尺寸为3×3、步长为1且通道数翻倍的卷积层作为特征扩展模块;
所述第一卷积层设置为对扩展后的第二特征图进行卷积操作,加深网络层数,以继续提取所述图像的纹理特征,得到所述纹理特征图。
2.如权利要求1所述的目标分割系统,其特征在于,所述语义感知网络包括串行排列的VGGNet骨干网络和上采样层,其中,
所述VGGNet骨干网络包括多个串行排列的卷积模块,每个卷积模块包含串行排列的VGG卷积层、最大池化层、批正则化层和非线性层,所述VGGNet骨干网络设置为基于所述第一预处理数据,提取所述图像的高级语义特征,得到第一特征图;
所述上采样层设置为对所述第一特征图进行尺度放大,得到所述语义特征图,其中,所述语义特征图与所述图像尺度相同。
3.如权利要求1所述的目标分割系统,其特征在于,所述特征融合层包括串行排列的拼接模块和第四卷积层,其中,
所述拼接模块与所述语义感知网络和所述纹理感知网络连接,设置为在通道维度拼接所述语义特征图和所述纹理特征图,使所述语义特征图和所述纹理特征图在每个通道维度逐像素对齐;
所述第四卷积层设置为利用1×1的卷积完成在每个像素上的特征融合,得到所述目标分割图。
4.如权利要求1所述的目标分割系统,其特征在于,所述语义感知网络采用ResNet网络形式或WRN网络形式,包括卷积模块、池化模块、正则化模块和随机连接删除模块。
5.一种目标分割系统的训练方法,其特征在于,包括:
S10、获取训练图像集,其中,所述训练图像集中包括多个训练图像;对每个训练图像进行像素级的手工分割标注,得到所述每个训练图像的标注图;
S20、对每个训练图像进行原始尺度数据增强,得到所述每个训练图像的第一预处理数据;对所述第一预处理数据进行多尺度数据增强,得到所述每个训练图像的第二预处理数据;其中,所述原始尺度数据增强包括翻转、旋转、颜色抖动增强中的至少一种,所述多尺度的处理策略包括中心裁剪、随机裁剪、均匀裁剪、缩放和高斯金字塔中的至少一种;
S30:依次将每个训练图像输入权利要求1-4任意一项所述的目标分割系统,以对所述目标分割系统的参数进行迭代优化,其中,每个训练图像的第一预处理数据输入所述语义感知网络,所述每个训练图像的第二预处理数据输入所述纹理感知网络;
S40:基于所述纹理感知网络的输出,构建辅助损失函数;基于所述特征融合层的输出,构建主损失函数;以所述主损失函数和所述辅助损失函数的组合为总损失函数,以每个训练图像的标注图为标注信息迭代更新所述目标分割系统的网络参数;所述辅助损失函数用来监督纹理感知网络,所述主损失函数用来监督整个网络的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东力聚机器人科技股份有限公司,未经山东力聚机器人科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110767088.X/1.html,转载请声明来源钻瓜专利网。





