[发明专利]一种基于比率自适应池化的多尺度特征物体检测算法在审
申请号: | 202010433145.6 | 申请日: | 2020-05-21 |
公开(公告)号: | CN111612065A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 朱勉春;许曼玲;戴宪华 | 申请(专利权)人: | 中山大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06K9/32;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 比率 自适应 尺度 特征 物体 检测 算法 | ||
1.一种基于比率自适应池化的多尺度特征物体检测算法,对传统的自上而下特征金字塔网络融合结构进行改进,所述方法包括:
将待测图像输入到卷积神经网络(ResNet50),Cx代表ResNet每一个模块生成的特征图C={C2,C3,C4,C5},整体框架保留了FPN原来的结构,横向连接是C经过1×1卷积降低为维度到256记为M={M2,M3,M4,M5},然后经过最顶层的M5经过RAP模块进行增强,输出记为P5;
P5经过上采样与横向连接的M4融合,输出记为P4。依次操作,直到输出最后一层特征图P2,完成增强过程。P={P2,P3,P4,P5}送入后续的检测。
其中在RAP增强的具体操作是:FPN的最顶层特征M5经过一个比率自适应,池化方式为自适应平均池化,这里我们选用的池化系数为α=[0.1,0.2,0.3],输出的分辨率不同的三个特征图记为{A,B,C};
然后{A,B,C}经过3×3卷积后再经过双线性差值上采样输出记为{E,F,G},恢复到原来的输入分辨率大小;
最后三个分辨率相同的特征图进行特征拼接,再经过1×1卷积降低通道数到256,输出最后的增强结果。至此,比率自适应池化过程构建完成。
2.根据权利要求1所述的方法,其特征在于,将RPN嵌入在改进后的FPN中,用于多尺度特征融合;其中对于P2,P3,P4,P5这些层,定义anchor的大小为322,642,1282,2562,5122,另外每层都有3个长宽对比度{1:2,1:1,2:1}。所以整个特征金字塔有15种锚点(anchor)。
3.根据权利要求1和2所述的方法,其特征在于,训练RPN时,只会选择256个anchor进行训练,并满足正负样本大概比例为1:1。其正负样本定界为,为了保证至少有正样本参与训练,对每一个真实框,与其IoU(交并比)最大的anchor作为正样本;在剩余的anchor中,如果对应的anchor与任意一个真实框的IoU大于0.7,则作为训练的正样本,如果anchor与任意一个真实框的IoU小于0.3,则该anchor作为训练的负样本。
4.根据权利要求3所述的方法,其特征在于,在训练RPN的同时,RPN也会生成RoIs送入Fast R-CNN网络中。RPN会选择大部分的anchor(如12000个)并进行粗略修正其位置得到RoIs,再利用非极大值抑制(NMS)的方法从12000个RoIs选择概率最大的2000个RoIs。
5.根据权利要求4所述的方法,其特征在于,网络会从2000个RoIs中选取128个RoIs作为训练,选取正负样本规则为,RoIs与真实边框的IoU大于0.5的作为正样本(比如N个),剩余的(128-N)个负样本从与真实框的IoU小于等于0(或者0.1)的RoIs中选取,正负样本比大致为1:3。
6.根据权利要求5所述的方法,其特征在于,选取得到的128个RoIs进行后续RoIPooling、计算损失、分类、更细节的边框回归等操作。其中对于位置的回归一般采用的损失函数为Smooth_L1 Loss,针对分类问题一般采用交叉熵损失函数。在计算位置回归损失L1Loss的时候,负样本不参与计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010433145.6/1.html,转载请声明来源钻瓜专利网。