[发明专利]一种基于深度学习自适应可变形卷积的特征图像提取方法有效
| 申请号: | 202011212397.2 | 申请日: | 2020-11-03 |
| 公开(公告)号: | CN112257727B | 公开(公告)日: | 2023-10-27 |
| 发明(设计)人: | 赵成明;陈金令;李洁 | 申请(专利权)人: | 西南石油大学 |
| 主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/25;G06V10/82;G06N3/0464;G06N3/048;G06N3/084;G06N3/0985 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 610500 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 自适应 变形 卷积 特征 图像 提取 方法 | ||
本发明公开了一种基于深度学习自适应可变形卷积的特征图像提取方法,包括自适应可变形卷积模块和自适应可变形的ROIpooling模块;所述自适应可变形卷积模块最主要的是采用了两种不同的可学习因子对偏移量和采样位置进行学习微调的方式,然后通过使用网格根据目标物体进行自适应的形变,产生更能符合目标物体的特征;所述自适应可变形的ROIpooling模块为池化层中的每个bin位置添加的一个偏移量,偏移量能从前面的特征图像以及感兴趣区域中进行学习得到,能对具有不同形变特性的目标物体实现自适应的准确定位。本发明提供的两个模块能够轻松替换现在主流的卷积层,且在不增加较多的参数情况下,提升卷积神经网络对模型的建模能力和图像检测精度。
技术领域
本发明涉及人工智能领域和数字图像处理方法,特别是涉及一种基于深度学习自适应可变形卷积的特征图像提取方法。
背景技术
近几年来,随着深度学习技术的快速发展和计算机设备性能的逐步提升,越来越多的卷积神经网络(CNNs)被应用于计算机视觉任务,如图像分类、目标检测和图像分割等领域。但是基于卷积神经网络(CNNs)的方法都是以一个固定的卷积尺寸进行特征提取,此方法无法自由的适应目标的多尺寸、多姿态以及多角度所带来的几何变化或者模型的几何转换的问题。针对以上的卷积神经网络(CNNs)所带来的诸多问题,目前主流的解决方法则有两种。其中一点是能够建立针对当前任务所拥有的目标多尺寸、多姿态、多角度等足够多的期望变化训练数据集。这种方法往往是通过增加现有的训练数据集样本实现的,如对数据样本进行随机尺寸变化、随机剪裁以及随机旋转等相互组合的方式,增强当前训练数据集样本的几何多样性的特征;其二种便是通过相应的变换不变性的特征或者算法,丰富现有训练数据集样本的空间表达能力,有助于提高模型对训练任务的几何表达能力。虽然卷积神经网络最近几年中在图像分类、语义分割和目标检测等热门的计算机视觉任务中取得了非常显著的效果,但是它仍然具有一下两个较为显著的缺点。第一点,卷积核在对目标物体进行卷积特征提取的时候,对于目标物体的几何变换是固定且是已知的,这样将会阻碍卷积神经网络对具有未知几何变换任务的泛化能力。其次,如果使用过于复杂的转换方法,将会提高相应变换不变性的特征或者算法的设计难度,且是一个耗时的过程,因此,这种方法的可行性极低,这样便无法满足当前视觉任务的需求,从而在无形之中就增加了视觉任务的隐形难度。
在当前的技术中,当目标样本具有多尺寸、多姿态以及多角度等形变特性的时候,就需要计算机设备储存大量和该目标样本与之相关的特征图像数据,这样将会使得储存的数据量非常的庞大,很消耗图形处理器(GPU)的显存,且在训练的过程的中是相当的耗时,不便于样本的快速训练。目前的卷积神经网络中,卷积层会对特征图像进行固定大小位置的采样,ROI池化层会把感兴趣区域划分成固定大小的空间容器,致使网络无法根据目标样本的内容而自适应的调整卷积核的感受野大小,因此便限制了对于具有形变特性的样本的识别精度。
发明内容
本发明的目的在于提供一种基于深度学习自适应可变形卷积的特征图像提取方法,可以有效的提高目标识别的精度。
本发明采用的技术方案是:一种基于深度学习自适应可变形卷积的特征图像提取方法,包括自适应可变形卷积模块和自适应可变形的ROIpooling模块;
所述自适应可变形卷积模块首先先将二维偏移量添加到标准卷积中的常规网格采样位置中,其次采用了两个不同的可学习因子对偏移量和采样位置进行学习微调的方式,然后通过使用网格可以根据目标物体进行自适应的变形,使之更能符合目标物体的特征;其中的二维偏移量是通过从前面的特征图像中利用不同的卷积层得到的;
所述自适应可变形的ROIpooling模块能够在池化层中的每一个bin位置添加一个偏移量,其偏移量能够从前面的特征图像以及感兴趣区域中进行学习得到,其中的ROI检测框能够以一个适应目标物体的检测框大小去检测,不再是以固定的检测框大小,避免了无用的检测,这样能够实现对具有不同形变的目标物体实现自适应的准确定位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学,未经西南石油大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011212397.2/2.html,转载请声明来源钻瓜专利网。





