[发明专利]基于多尺度注意力机制的遥感图像车辆目标检测方法在审
| 申请号: | 202010521480.1 | 申请日: | 2020-06-10 |
| 公开(公告)号: | CN111738110A | 公开(公告)日: | 2020-10-02 |
| 发明(设计)人: | 门飞飞;李训根;马琪;潘勉;吕帅帅;李子璇;张战;刘爱林 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 浙江永鼎律师事务所 33233 | 代理人: | 陆永强 |
| 地址: | 310018*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 尺度 注意力 机制 遥感 图像 车辆 目标 检测 方法 | ||
1.一种基于多尺度注意力机制的遥感图像车辆目标检测方法,其特征在于,包括如下步骤:
S1,使用多层卷积神经网络对原始图片进行特征提取,将生成的不同尺度特征图构建一个自底向上的金字塔网络;
S2,对于已经构建好的金字塔网络,实现自顶向下的特征融合,在融和过程中,依次对高层特征图进行通道注意力操作,并融合到低层特征图;
S3,获取融合后的低层特征图的空间注意力信息,并融合到原有的低层特征中;
S4,通过预先设定的大小、比例等生成大量候选框,根据检测目标的真实框大小决定所用到的特征图,再通过真实框与候选框的交并比判定候选框的正负性;
S5,对得到的正样本候选框直接预测其类别信息以及回归信息,使用非极大抑制方法,滤除得到的重叠区域同类别候选框,得到最终的检测结果。
2.如权利要求1所述的基于多尺度注意力机制的遥感图像车辆目标检测方法,其特征在于,所述S1包括:选用ResNet-50作为基础卷积神经网络,图片经过网络,在不同的层输出不同尺度的特征图,每上一个特征图是下一个特征图所经过神经网络的输出,此时的不同特征具有不同的通道数,越上层的特征,通道数越多,但是尺度越小,首先对不同特征图进行通道数统一化,其过程如下:
Pi=Conv3×3(Ci,256,3,1,1) (1)
其中,Pi代表第i层的特征图,Conv3x3表示3×3卷积层,Ci表示输入图片经过ResNet-50得到的第i特征图,在3×3卷积层Conv3x3内,Ci为输入特征图的通道数,256为输出特征图的通道数,3代表使用的卷积核尺寸,1表示卷积核每次移动的步长,1表示对特征图的边界填充数。
3.如权利要求1所述的基于多尺度注意力机制的遥感图像车辆目标检测方法,其特征在于,所述S2包括:每次的特征图融合总是一个高层次特征和低层次特征参与操作,高层特征图P4平移不变,次高层特征图P3将会融合来自特征图P4的信息,首先对低层次特征进行通道最大池化和平均池化,接着将合并的两个池化结果输入1×1卷积得到通道数为256,尺度大小为1×1的特征块;其次,将该特征块与低层次特征图进行通道相乘得到包含通道注意力的低层次特征图,其过程表示为以下形式:
其中表示Pi经过通道注意力得到特征图,Pi-1为Pi的下一层网络,Conv1×1表示1×1卷积操作,cat()表示特征图的连接操作,Cmaxpool()表示通道最大池化,Cavgpool()表示通道平均池化,Unsample()是对特征图进行上采样。
4.如权利要求1所述的基于多尺度注意力机制的遥感图像车辆目标检测方法,其特征在于,所述S3包括:先对经过上一步得到的特征图进行空间最大池化,得到尺度不变,通道数为1的特征块,其次同时得到平均池化的特征块;将两个特征块拼接后送入卷积核大小为1×1的卷积块中得到通道数为1的特征块,该特征块融合了特征图中的空间信息;
接着,利用Sigmoid()激活函数,将特征图中像素点的值激活到0到1之间;
最后,通过特征图与特征块的矩阵相乘,获得最终的结果,其过程可以表示为以下形式:
其中,表示最终通过通道注意力和空间注意力得到的特征图,Smaxpool()表示空间最大池化,Savgpool()表示空间平均池化,Sigmoid()表示对经过卷积后得到的特征块进行sigmoid激活。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010521480.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种预灌封安全装置的灭菌设备
- 下一篇:触摸开关及其控制方法





