[发明专利]场景分割网络训练方法、装置、计算设备及存储介质有效
申请号: | 201710908431.1 | 申请日: | 2017-09-29 |
公开(公告)号: | CN107730514B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 张蕊;颜水成;唐胜 | 申请(专利权)人: | 北京奇宝科技有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/136 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 100000 北京市朝阳区酒*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 场景 分割 网络 训练 方法 装置 计算 设备 存储 介质 | ||
本发明公开了一种场景分割网络训练方法、装置、计算设备及计算机存储介质,其中,该方法通过多次迭代完成;提取样本图像以及标注场景分割结果;将样本图像输入至场景分割网络中进行训练,其中,在场景分割网络中至少一层卷积层,利用尺度回归层输出的尺度系数对该卷积层的第一卷积块进行缩放处理,得到第二卷积块,而后利用第二卷积块进行该卷积层的卷积运算,获得该卷积层的输出结果;获取对应的样本场景分割结果;根据样本场景分割结果与标注场景分割结果之间的分割损失,更新场景分割网络的权重参数;迭代执行上述训练步骤,直至满足预定收敛条件。该技术方案实现了对感受野的自适应缩放,提高了图像场景分割的准确率以及处理效率。
技术领域
本发明涉及图像处理技术领域,具体涉及一种场景分割网络训练方法、装置、计算设备及计算机存储介质。
背景技术
在现有技术中,分割网络的训练主要是基于深度学习中的全卷积神经网络,利用迁移学习的思想,将在大规模分类数据集上经过预训练得到的网络迁移到图像分割数据集上进行训练,从而得到用于场景分割的分割网络。
现有技术中训练分割网络时所使用的网络架构直接利用了图像分类网络,其卷积层中卷积块的大小是固定不变的,从而感受野的大小是固定不变的,其中,感受野是指输出特征图某个节点的响应对应的输入图像的区域,大小固定的感受野只适于捕捉固定大小和尺度的目标。然而对于图像场景分割,场景中经常会包含不同大小的目标,利用具有大小固定的感受野的分割网络在处理过大和过小的目标时常常会发生问题,例如,对于较小的目标,感受野会捕捉过多的目标周围的背景,从而将目标与背景混淆,导致目标遗漏并被错判为背景;对于较大的目标,感受野仅仅能捕捉目标的一部分,使得目标类别判断出现偏差,导致不连续的分割结果。因此,现有技术中训练得到的分割网络存在着图像场景分割的准确率低下的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的场景分割网络训练方法、装置、计算设备及计算机存储介质。
根据本发明的一个方面,提供了一种场景分割网络训练方法,该方法通过多次迭代完成;
其中一次迭代过程的训练步骤包括:
提取样本图像以及与样本图像对应的标注场景分割结果;
将样本图像输入至场景分割网络中进行训练,其中,在场景分割网络中至少一层卷积层,利用尺度回归层输出的尺度系数对该卷积层的第一卷积块进行缩放处理,得到第二卷积块,而后利用第二卷积块进行该卷积层的卷积运算,获得该卷积层的输出结果;尺度回归层为场景分割网络的中间卷积层;
获取与样本图像对应的样本场景分割结果;
根据样本场景分割结果与标注场景分割结果之间的分割损失,更新场景分割网络的权重参数;
该方法包括:迭代执行上述训练步骤,直至满足预定收敛条件。
进一步地,提取样本图像以及与样本图像对应的标注场景分割结果进一步包括:
从样本库中提取样本图像以及与样本图像对应的标注场景分割结果。
进一步地,利用尺度回归层输出的尺度系数对该卷积层的第一卷积块进行缩放处理,得到第二卷积块进一步包括:
利用上一次迭代过程尺度回归层输出的尺度系数或者初始尺度系数对该卷积层的第一卷积块进行缩放处理,得到第二卷积块。
进一步地,利用第二卷积块进行该卷积层的卷积运算,获得该卷积层的输出结果进一步包括:
利用线性插值方法,从第二卷积块中采样得到特征向量,组成第三卷积块;
依据第三卷积块与该卷积层的卷积核进行卷积运算,获得该卷积层的输出结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇宝科技有限公司,未经北京奇宝科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710908431.1/2.html,转载请声明来源钻瓜专利网。