[发明专利]一种基于深度学习自适应可变形卷积的特征图像提取方法有效
| 申请号: | 202011212397.2 | 申请日: | 2020-11-03 |
| 公开(公告)号: | CN112257727B | 公开(公告)日: | 2023-10-27 |
| 发明(设计)人: | 赵成明;陈金令;李洁 | 申请(专利权)人: | 西南石油大学 |
| 主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/25;G06V10/82;G06N3/0464;G06N3/048;G06N3/084;G06N3/0985 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 610500 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 自适应 变形 卷积 特征 图像 提取 方法 | ||
1.一种基于深度学习自适应可变形卷积的特征图像提取方法,其特征在于,包括自适应可变形卷积模块和自适应可变形的ROIpooling模块;
所述自适应可变形卷积模块首先先将二维偏移量添加到标准卷积中的常规网格采样位置中,其次采用了两个不同的可学习因子对偏移量和采样位置进行学习微调的方式,然后通过使用网格可以根据目标物体进行自适应的变形,使之更能符合目标物体的特征,其中的二维偏移量是通过从前面的特征图像中利用不同的卷积层得到的;
所述自适应可变形的ROIpooling模块能够在池化层中的每一个bin位置添加一个微小偏移量,其偏移量能够从前面的特征图像以及感兴趣区域中进行学习得到,其中的ROI检测框以一个适应目标物体的检测框大小去检测,不再是以固定的检测框大小,这样能够实现对具有不同形变的目标物体实现自适应的准确定位。
2.根据权利要求1所述的基于深度学习自适应可变形卷积层的特征图像提取方法,其特征在于,所述自适应可变形卷积层的特征图像提取方法包括三个步骤:
S1,获取目标物体图像;
S2,通过卷积层的卷积核中的采样点的位置,以提取输入图像的低水平特征图像其中I为原始输入图像,M为卷积核,p为输出特征图像点,c为图像的列,r为图像的宽;
S3,在输入的特征图像X上使用标准的规则网格K进行特征采样,使用的自适应可变形卷积核为以获取高水平的特征图像,其中用W代表加权采样之和,网格k定义采样位置,用pk代表采样点在自适应可变形卷积核中的位置,sk表示对采样点pk的学习因子,Δpk表示可学习偏移量,Δmk表示可调制量,ck表示对可调制量Δmk的学习因子,其中sk∈[0,1],Δmk∈[0,1],ck∈[0,1]。
3.根据权利要求2所述的基于深度学习自适应可变形卷积层的特征图像提取方法,其特征在于,所述步骤S3具体为:
对于输出映射特征y上的每个位置p0,有:
其中,pk为网格K中枚举的采样位置;
在可变形的卷积中,对枚举的采样位置pk进行学习,另外还添加了可调制量Δmk,其中采样位置k用偏移量进行推广{Δpk|k=1,...,K},使采样位置能够分解为较大的步长,因此有:
最后,在自适应可变形的卷积中,运用学习因子ck对添加的调制偏移量进行再学习,以此来适应目标物体所具有多变的形变特性,因此有:
此时,采样是在极不规则以及具有偏移的位置pk+Δpk,因此Δpk经常以小数的形式进行微量偏移,特别地,sk、ck、Δpk和Δmk来自于输出通道的单独卷积,其中,2k输出通道模拟空间偏移量Δpk,连续的k个输出通道对应于调制量Δmk,用Sigmoid函数激活,剩余的个通道是sk和ck在空间维度上与Δpk和Δmk作用的张量,它们的学习率是当前层学习率的0.1倍。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学,未经西南石油大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011212397.2/1.html,转载请声明来源钻瓜专利网。





