[发明专利]场景分割方法、装置、计算机设备及存储介质有效
| 申请号: | 201910446505.3 | 申请日: | 2019-05-27 |
| 公开(公告)号: | CN110136136B | 公开(公告)日: | 2022-02-08 |
| 发明(设计)人: | 张渊 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
| 主分类号: | G06T7/10 | 分类号: | G06T7/10 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 场景 分割 方法 装置 计算机 设备 存储 介质 | ||
1.一种场景分割方法,其特征在于,包括:
获取待识别的图像;
将所述图像输入深度神经网络,所述深度神经网络包括下采样模块、空洞空间金字塔池化模块、上采样模块以及分类模块,所述下采样模块以及所述上采样模块均采用了深度可分离卷积结构,所述下采样模块位于所述空洞空间金字塔池化模块的输入端,所述上采样模块位于所述空洞空间金字塔池化模块的输出端,所述上采样模块与所述下采样模块跨层连接;
通过所述下采样模块采用深度卷积的方式对所述图像进行卷积运算,通过1×1的卷积的方式对所述图像的深度卷积结果进行融合,得到尺寸小于所述图像的第一特征图,通过所述空洞空间金字塔池化模块对所述第一特征图进行空洞卷积,得到不同尺度的第二特征图,通过所述上采样模块采用深度卷积的方式对所述第一特征图与所述不同尺度的第二特征图的拼接结果进行卷积运算,通过1×1卷积的方式对所述拼接结果的深度卷积结果进行融合,得到与所述图像尺寸相同的第三特征图,通过所述分类模块对所述第三特征图中的每个像素进行分类,得到所述图像的场景分割结果;
其中,所述深度神经网络是基于多个样本图像训练得到的,所述多个样本图像是根据数据集对应的采样权重对多个数据集进行采样得到的,所述数据集对应的采样权重与数据集中候选样本图像的数量负相关。
2.根据权利要求1所述的场景分割方法,其特征在于,所述下采样模块包括步长大于1的卷积层。
3.根据权利要求1所述的场景分割方法,其特征在于,所述上采样模块包括至少一个第一上采样模块以及至少一个第二上采样模块,所述第一上采样模块的输入为所述第二上采样模块输出的特征图与所述第一特征图的拼接结果,所述第二上采样模块为所述第一上采样模块的上一个上采样模块。
4.根据权利要求1所述的场景分割方法,其特征在于,所述获取待识别的图像之前,所述方法还包括:
获取所述多个样本图像,每个样本图像的每个像素标注了场景标签,所述场景标签表示所述像素所属的场景;
调用初始深度神经网络,所述初始深度神经网络包括下采样模块、空洞空间金字塔池化模块、上采样模块以及分类模块,所述下采样模块以及所述上采样模块均采用了深度可分离卷积结构;
基于所述多个样本图像,对所述初始深度神经网络进行模型训练,得到所述深度神经网络。
5.根据权利要求4所述的场景分割方法,其特征在于,所述获取所述多个样本图像之前,所述方法还包括:
对所述多个样本图像进行数据增强。
6.一种场景分割装置,其特征在于,包括:
获取单元,被配置为获取待识别的图像;
输入单元,被配置为将所述图像输入深度神经网络,所述深度神经网络包括下采样模块、空洞空间金字塔池化模块、上采样模块以及分类模块,所述下采样模块以及所述上采样模块均采用了深度可分离卷积结构,所述下采样模块位于所述空洞空间金字塔池化模块的输入端,所述上采样模块位于所述空洞空间金字塔池化模块的输出端,所述上采样模块与所述下采样模块跨层连接;
模型运算单元,被配置为通过所述下采样模块采用深度卷积的方式对所述图像进行卷积运算,通过1×1的卷积的方式对所述图像的深度卷积结果进行融合,得到尺寸小于所述图像的第一特征图,通过所述空洞空间金字塔池化模块对所述第一特征图进行空洞卷积,得到不同尺度的第二特征图,通过所述上采样模块采用深度卷积的方式对所述第一特征图与所述不同尺度的第二特征图的拼接结果进行卷积运算,通过1×1的卷积的方式对所述拼接结果的深度卷积结果进行融合,得到与所述图像尺寸相同的第三特征图,通过所述分类模块对所述第三特征图中的每个像素进行分类,得到所述图像的场景分割结果;
其中,所述深度神经网络是基于多个样本图像训练得到的,所述多个样本图像是根据数据集对应的采样权重对多个数据集进行采样得到的,所述数据集对应的采样权重与数据集中候选样本图像的数量负相关。
7.根据权利要求6所述的场景分割装置,其特征在于,所述下采样模块包括步长大于1的卷积层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910446505.3/1.html,转载请声明来源钻瓜专利网。





