[发明专利]一种基于局部上下文感知的复杂场景密集目标检测方法在审
| 申请号: | 202010173018.7 | 申请日: | 2020-03-13 |
| 公开(公告)号: | CN111368775A | 公开(公告)日: | 2020-07-03 |
| 发明(设计)人: | 王靖宇;吴虞霖;张科;王红梅;王叶子;马振宇;王林 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
| 代理公司: | 西北工业大学专利中心 61204 | 代理人: | 刘新琼 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 局部 上下文 感知 复杂 场景 密集 目标 检测 方法 | ||
1.一种基于局部上下文感知的复杂场景密集目标检测方法,其特征在于步骤如下:
步骤1:对于每一张输入神经网络的尺寸为1024*1024的图像,经过Res101残差网络提取特征后,生成6种不同大小的特征图feature map,记为C1~C6,尺度分别为512*512,256*256,128*128,64*64,32*32,16*16,选择C2、C3、C4和C5建立特征金字塔;
步骤2:根据C2、C3、C4和C5生成特征金字塔,结果记为P2、P3、P4和P5;其中P2、P3、P4是将高层特征下采样,并与经过1*1卷积的同层C2、C3、C4特征相加;
步骤3:特征金字塔中的每张特征图使用区域生成网络生成锚点anchor的时候只使用一种尺寸,P2、P3、P4、P5和P6分别对应322、642、1282、2562和5122,每个anchor对应的宽高比为1:2,1:1和2:1;
使用锚点anchor生成候选区域proposals时,采取的计算公式为:
生成局部上下文的候选区域lc_proposals时,采取的计算公式为:
其中,(xc,yc)分别为预测的anchor点坐标,(w,h)分别为预测proposals的宽度和高度;(x1,y1)和(x2,y2)为proposals的左上角和右下角坐标;(x1′,y1′)和(x2′,y2′)为lc_proposals的左上角和右下角坐标;
步骤4:因为4种尺度的特征图上都有从原图上的anchor映射过来的proposals,所以使用特征池化的时候,也必须对应4种不同的特征层,采用如下公式计算特征池化对应的特征层:
其中,w和h为对应的proposals的尺寸,1024为原图尺寸,k0为基准值,设置为4;
由于P2、P3、P4和P5为特征金字塔的特征图,因此对应特征层的取值规则为:
特征金字塔中的每张特征图中的proposals经过对应的特征池化层,分别输出7*7的结果,也就是这4张特征图上的proposals经过特征池化之后,提取出了49个特征;
局部上下文操作的流程与对应的proposals完全相同;
步骤5:把局部上下文和对应的proposals的7*7结果分布连接两个全连接层,两个全连接层输出结果为目标类别和目标边界框。
2.根据权利要求1所述的一种基于局部上下文感知的复杂场景密集目标检测方法,其特征在于步骤3中区域生成网络生成锚点anchor训练候选区域所采用的标签用交并比IoU来确定,如果IoU0.7,则为正样本;如果IoU0.3,则为负样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010173018.7/1.html,转载请声明来源钻瓜专利网。





