[发明专利]一种角度自适应的椭圆模板目标检测器在审

专利信息
申请号: 202111462501.8 申请日: 2021-12-02
公开(公告)号: CN114372502A 公开(公告)日: 2022-04-19
发明(设计)人: 胡永利;武剑;员娇娇;尹宝才;孙艳丰 申请(专利权)人: 北京工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06F17/18;G06N3/04;G06N3/08;G06V10/764;G06V10/774
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 刘萍
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 角度 自适应 椭圆 模板 目标 检测器
【权利要求书】:

1.一种角度自适应的椭圆模板目标检测器,其特征包括以下内容:

EllipseNet模型结构

用E=[cx,cy,la,sa,θ,n(i)]表示目标的真实椭圆框,令C=[cx,cy]表示椭圆的中心,A=[la,sa]代表椭圆的长轴和短轴长度,θ代表椭圆顺时针旋转的角度,n(i)是边界框中的对象所属的类,N是类别数目;

模型结构包括四个部分:骨干网络ResNet提取图像的多级特征C3,C4和C5;然后通过特征金字塔结构获得融合后的特征图F1至F5,回归层完成对椭圆属性的预测,包括椭圆圆心的偏移量,长短轴长以及椭圆的旋转角度以及类别;最后计算预测值和真实值之间的损失;

在回归层中,对于第i个特征图Fi中的每个位置(x(i),y(i)),将特征点映射回输入图像s是特征图相对于输入图像的下采样率;如果位置(x(i),y(i))落在目标图像的区域内,则将其视为正样本点;

偏移量通过公式(1)计算:

c_error=(cx-x(i),cy-y(i)) (1)

网络的回归层需要输出对象的类别向量p和椭圆中心的偏移量,以及椭圆的轴长和旋转角度;在FCOS的头部增加了五个独立的回归分支;在模型的输出层中,负责预测椭圆圆心的偏移量;是椭圆圆心的长轴和短轴的预测值,负责预测椭圆的角度;另外,根据椭圆的对称性,其角度的取值范围为[0,180),因此使用exp(x)将输出分支映射到正数;

在模型推理阶段,网络接收一张图像后,通过特征金字塔结构获取5张特征图,然后获取特征图上每个像素点位置的六个预测值,分别为对象的类别、中心度分数、椭圆中心偏移量、长短轴长以及椭圆的旋转角度;然后,将所有的特征像素点映射回所在原始图像的位置,将中心度分数乘以类别分数得到椭圆中心点的置信度分数,并以阈值δ=0.3来过滤掉小于阈值的预测点,然后利用公式(1)进一步确定椭圆的圆心;然后得到最终的椭圆框,再对这些椭圆进行非极大值抑制算法,得到网络最终的输出结果;

损失函数设计

损失函数L定义如下:

其中Lcls,Lcnt,Lshp代表分类损失,椭圆中心位置损失和形状损失;Npos代表正样本像素的数量,而α,β是权衡这些损失的权重,是两个超参数,设定为1;

分类损失Lcls使用Focal Loss完成分类任务,可以定义如下

Lcls=-ηt(1-pt)γlog(pt) (4)

其中ηt和γ是两个超参数,分别设置为0.25和2,pt是属于类别t的对象的概率值;

基于FCOS中的中心损失Lreg通过公式五进行计算:

其中Pcenterness,Gcenterness分别为预测椭圆和真实椭圆框的外接矩形框,假设真实椭圆框的外接矩形框为(l*,r*,b*,t*),则Gcenterness的计算方式如下:

BCE(.)的计算方式为:

BCE(P,G)=-(GlogP+(1-G)log(1-P)) (7)

此处采用了标准的二元交叉熵损失函数,其根据靠近圆心的远近程度赋予圆心周围的像素点一个权重值,距离越近则权重越大,距离越远则权重越小;

另外,和C表示预测椭圆的中心和椭圆的真实中心,SmoothL1损失来回归二者之间的距离;SmoothL1损失用下式计算:

形状损失Lshp由下式构成:

其中θ表示预测椭圆和真实椭圆的旋转角度;A分别代表椭圆长轴和短轴的预测值以及真实值;

在Elliptical_IOU_Loss中,令G=[g1,g2],P=[p1,p2]代表椭圆的真实轴长和预测轴长,则两个椭圆的近似IOU是:

由于IOU需要优化为1,因此最终的Elliptical_IOU_Loss为:

考虑到在模型训练早期阶段,网络还无法很好准确回归椭圆的旋转角度和中心偏移;因此,在训练的初始阶段,仅使用SmoothL1损失来回归椭圆轴长,待损失值接近0时,此时网络基本可以回归椭圆的属性值;此时在添加Elliptical_IOU_Loss继续训练模型,进一步提升模型的性能。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111462501.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top