[发明专利]膨胀卷积处理方法、图像处理方法、设备及存储介质在审
| 申请号: | 202011103388.X | 申请日: | 2020-10-15 |
| 公开(公告)号: | CN112233052A | 公开(公告)日: | 2021-01-15 |
| 发明(设计)人: | 于盼盼;陶永俊 | 申请(专利权)人: | 北京四维图新科技股份有限公司 |
| 主分类号: | G06T5/30 | 分类号: | G06T5/30;G06K9/34;G06N3/04;G06N3/08 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;臧建明 |
| 地址: | 100094 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 膨胀 卷积 处理 方法 图像 设备 存储 介质 | ||
本申请提供一种膨胀卷积处理方法、图像处理方法、设备及存储介质,该方法通过确定待处理膨胀卷积中各个采样点与中心点的距离,进而,根据该距离,对上述各个采样点进行分类,根据分类后的采样点,将待处理膨胀卷积划分为多个子卷积,其中,一个子卷积中包括分类后的一类采样点,从而,使得子卷积的采样点是属于同一尺度的,这样在使用子卷积提取空间尺度特征时,一个子卷积所提取的空间特征是属于同一个空间尺度的,使提取的空间尺度统一,提高提取的空间尺度信息的清晰度,进而,通过本申请实施例的膨胀卷积能够更准确的提取多尺度特征,为语义分割任务提取更加准确的特征,提高语义分割的分割精度。
技术领域
本申请涉及计算机视觉技术,尤其涉及一种膨胀卷积处理方法、图像处理方法、设备及存储介质。
背景技术
语义分割是图像理解中的重要技术手段,是计算机视觉中的一项重要研究内容。图像是由很多像素组成的,语义分割就是将图像中的所有像素按照其表达的语义含义进行不同的分类分组,也就是像素级分类。相比于目标识别和物体检测,语义分割可以实现对图像更加细致的理解。鉴于语义分割的稠密预测性,语义分割在很多实际应用领域中都有着巨大的作用,比如自动/智能驾驶系统中的路面场景理解,无人机系统中的着陆点判断以及可穿戴设备中的图像理解等。
自深度学习发展以来,基于深度学习的图像算法层出不穷。相关技术中,基于深度学习的语义分割算法通常使用膨胀卷积来融合不同尺度的空间信息。具体的,通过对特征图分别进行几种不同膨胀系数的膨胀卷积操作,对得到的结果进行融合来提取不同尺度的空间信息。
然而,上述在使用膨胀卷积提取空间尺度特征时,会出现提取的空间尺度不统一的问题,进而影响分割精度。
发明内容
为解决现有在使用膨胀卷积提取空间尺度特征时,会出现提取的空间尺度不统一的问题,本申请提供一种膨胀卷积处理方法、图像处理方法、设备及存储介质。
第一方面,本申请实施例提供一种膨胀卷积处理方法,该方法包括如下步骤:
根据待处理膨胀卷积的膨胀系数,确定所述待处理膨胀卷积中各个采样点与所述待处理膨胀卷积的中心点的距离;
根据所述距离,对所述各个采样点进行分类;
根据分类后的采样点,将所述待处理膨胀卷积划分为多个子卷积,其中,一个子卷积中包括分类后的一类采样点。
在一种可能的实现方式中,所述根据所述距离,对所述各个采样点进行分类,包括:
根据所述距离,确定所述各个采样点中距离相同的采样点;
根据所述距离相同的采样点,对所述各个采样点进行分类。
在一种可能的实现方式中,所述根据分类后的采样点,将所述待处理膨胀卷积划分为多个子卷积,包括:
若所述中心点为所述待处理膨胀卷积中的一个采样点,则根据所述中心点和分类后的一类采样点,确定所述待处理膨胀卷积划分的一个子卷积;
若所述中心点不为所述待处理膨胀卷积中的一个采样点,则根据分类后的一类采样点,确定所述待处理膨胀卷积划分的一个子卷积。
第二方面,本申请实施例提供一种图像处理方法,该方法包括如下步骤:
利用待处理膨胀卷积划分的多个子卷积,分别对待处理图像的输入特征图进行卷积操作,获得多个不同空间尺度的特征图,其中,所述待处理膨胀卷积划分的多个子卷积是根据所述待处理膨胀卷积中各个采样点与所述待处理膨胀卷积的中心点的距离,对所述各个采样点进行分类后,根据分类后的采样点,将所述待处理膨胀卷积划分为的多个子卷积,一个子卷积中包括分类后的一类采样点;
根据所述多个不同空间尺度的特征图,获得所述待处理图像的输出特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京四维图新科技股份有限公司,未经北京四维图新科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011103388.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示装置
- 下一篇:一种基于深度学习的CT投影几何校正方法





