[发明专利]一种角度自适应的椭圆模板目标检测器在审
| 申请号: | 202111462501.8 | 申请日: | 2021-12-02 |
| 公开(公告)号: | CN114372502A | 公开(公告)日: | 2022-04-19 |
| 发明(设计)人: | 胡永利;武剑;员娇娇;尹宝才;孙艳丰 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/18;G06N3/04;G06N3/08;G06V10/764;G06V10/774 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 角度 自适应 椭圆 模板 目标 检测器 | ||
1.一种角度自适应的椭圆模板目标检测器,其特征包括以下内容:
EllipseNet模型结构
用E=[cx,cy,la,sa,θ,n(i)]表示目标的真实椭圆框,令C=[cx,cy]表示椭圆的中心,A=[la,sa]代表椭圆的长轴和短轴长度,θ代表椭圆顺时针旋转的角度,n(i)是边界框中的对象所属的类,N是类别数目;
模型结构包括四个部分:骨干网络ResNet提取图像的多级特征C3,C4和C5;然后通过特征金字塔结构获得融合后的特征图F1至F5,回归层完成对椭圆属性的预测,包括椭圆圆心的偏移量,长短轴长以及椭圆的旋转角度以及类别;最后计算预测值和真实值之间的损失;
在回归层中,对于第i个特征图Fi中的每个位置(x(i),y(i)),将特征点映射回输入图像s是特征图相对于输入图像的下采样率;如果位置(x(i),y(i))落在目标图像的区域内,则将其视为正样本点;
偏移量通过公式(1)计算:
c_error=(cx-x(i),cy-y(i)) (1)
网络的回归层需要输出对象的类别向量p和椭圆中心的偏移量,以及椭圆的轴长和旋转角度;在FCOS的头部增加了五个独立的回归分支;在模型的输出层中,负责预测椭圆圆心的偏移量;是椭圆圆心的长轴和短轴的预测值,负责预测椭圆的角度;另外,根据椭圆的对称性,其角度的取值范围为[0,180),因此使用exp(x)将输出分支映射到正数;
在模型推理阶段,网络接收一张图像后,通过特征金字塔结构获取5张特征图,然后获取特征图上每个像素点位置的六个预测值,分别为对象的类别、中心度分数、椭圆中心偏移量、长短轴长以及椭圆的旋转角度;然后,将所有的特征像素点映射回所在原始图像的位置,将中心度分数乘以类别分数得到椭圆中心点的置信度分数,并以阈值δ=0.3来过滤掉小于阈值的预测点,然后利用公式(1)进一步确定椭圆的圆心;然后得到最终的椭圆框,再对这些椭圆进行非极大值抑制算法,得到网络最终的输出结果;
损失函数设计
损失函数L定义如下:
其中Lcls,Lcnt,Lshp代表分类损失,椭圆中心位置损失和形状损失;Npos代表正样本像素的数量,而α,β是权衡这些损失的权重,是两个超参数,设定为1;
分类损失Lcls使用Focal Loss完成分类任务,可以定义如下
Lcls=-ηt(1-pt)γlog(pt) (4)
其中ηt和γ是两个超参数,分别设置为0.25和2,pt是属于类别t的对象的概率值;
基于FCOS中的中心损失Lreg通过公式五进行计算:
其中Pcenterness,Gcenterness分别为预测椭圆和真实椭圆框的外接矩形框,假设真实椭圆框的外接矩形框为(l*,r*,b*,t*),则Gcenterness的计算方式如下:
BCE(.)的计算方式为:
BCE(P,G)=-(GlogP+(1-G)log(1-P)) (7)
此处采用了标准的二元交叉熵损失函数,其根据靠近圆心的远近程度赋予圆心周围的像素点一个权重值,距离越近则权重越大,距离越远则权重越小;
另外,和C表示预测椭圆的中心和椭圆的真实中心,SmoothL1损失来回归二者之间的距离;SmoothL1损失用下式计算:
形状损失Lshp由下式构成:
其中θ表示预测椭圆和真实椭圆的旋转角度;A分别代表椭圆长轴和短轴的预测值以及真实值;
在Elliptical_IOU_Loss中,令G=[g1,g2],P=[p1,p2]代表椭圆的真实轴长和预测轴长,则两个椭圆的近似IOU是:
由于IOU需要优化为1,因此最终的Elliptical_IOU_Loss为:
考虑到在模型训练早期阶段,网络还无法很好准确回归椭圆的旋转角度和中心偏移;因此,在训练的初始阶段,仅使用SmoothL1损失来回归椭圆轴长,待损失值接近0时,此时网络基本可以回归椭圆的属性值;此时在添加Elliptical_IOU_Loss继续训练模型,进一步提升模型的性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111462501.8/1.html,转载请声明来源钻瓜专利网。





