[发明专利]基于语义增强和高斯损失的小目标检测方法在审

专利信息
申请号: 202310532596.9 申请日: 2023-05-12
公开(公告)号: CN116524274A 公开(公告)日: 2023-08-01
发明(设计)人: 崔嘉敖;产思贤;毛家发;白琮 申请(专利权)人: 浙江工业大学
主分类号: G06V10/764 分类号: G06V10/764;G06V10/82;G06V10/20;G06V10/44;G06V10/80;G06N3/0464;G06N3/048;G06N3/08;G06T7/73
代理公司: 杭州天正专利事务所有限公司 33201 代理人: 舒良
地址: 310014 浙江省杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语义 增强 损失 目标 检测 方法
【权利要求书】:

1.一种基于语义增强和高斯损失的小目标检测方法,包括以下步骤:

1)将训练集中的图像进行图像预处理操作,包括等比缩放、区域填充、仿射变换和mosaic数据增强;

2)经过处理后的图像之后被输入到Darknet-53特征提取网络,随着骨干网络的深入,依次输出三个尺度的特征图,记为C1,C2,C3;

3)C1,C2,C3随后进入改进后的FPN网络,进行语义增强融合;FPN网络输出后的特征图记为P1,P2,P3;

4)经过特征融合的特征图进入Head直接预测目标的类别和预测框位置(cx,cy,w,h);

5)通过高斯Wasserstein距离损失函数对步骤4)得到的预测框结果进行评估,并训练模型。

2.根据权利要求1所述的基于语义增强和高斯损失的小目标检测方法,其特征在于:步骤2)三个特征图C1,C2,C3的尺度分别为76×76、38×38和19×19。

3.根据权利要求1所述的基于语义增强和高斯损失的小目标检测方法,其特征在于:步骤3)所述语义增强融合,包括语义重组和因子融合,具体步骤如下:

(31)首先对C1,C2,C3进行语义重组;

(32)语义重组时先使用1×1的卷积压缩通道,交互各个通道信息的同时,减少计算量;

(33)使用3×3大小的卷积层对压缩通道后的特征图进行编码,让每一个通道学习特征处的上下文信息;编码后的特征图记为Wl

(34)用Softmax函数对Wl进行归一化,使Wl值总和为1,由此对特征区域实现软选择;

(35)通过Wl对局部特征区域进行重组;对于一个目标位置为l和以此为中心的正方形区域N(Xl,r),重组公式如下:

其中X可以为C1,C2,C3中任意一个,重组后的特征图记为C′1,C′2,C′3;r为Wl的边长;

(36)引入了融合因子α平衡小目标检测中深层与浅层的特征学习;C′1,C′2,C′3按以下方式聚合相邻的特征层:

其中是用于通道匹配的1×1卷积操作,fupsample表示用于分辨率匹配的2×上采样操作,flayer通常是用于特征处理的卷积操作,α表示融合因子;把α设置为网络自学习参数,为在网络开始训练前,根据数据集标签计算得到其初始值,该参数参与梯度反向传播,受到损失函数控制,同时为了防止α过大导致网络梯度爆炸,对其有下约束公式:

Nup,Nlow分别是上层和下层特征图对应尺度目标的数量。

4.根据权利要求3所述的基于语义增强和高斯损失的小目标检测方法,其特征在于:步骤(35)中的r设为3。

5.根据权利要求1所述的基于语义增强和高斯损失的小目标检测方法,其特征在于:步骤5)所述的高斯Wasserstein距离损失函数,具体方法为:

(51);将包围目标的椭圆区域映射为一个2D高斯分布,目标中的点在平面上的分布遵循:

(cx,cy,w,h)表示目标检测数据集中目标使用水平框标注;

(52)将高斯分布记为N(u,∑):

其中d=2,表示二维高斯分布,u为分布的中心点,u=[cx,cy]T,∑为Covariancematrix,反映分布的形状,对角线上的元素为x方向和y方向的方差,斜对角线上的元素是x和y的协方差,反映点在x,y方向上的线性相关程度,在水平分布时为0:

两个二维高斯分布N1(u11)和N2(u22)之间的WSD距离可表示如下:

对于任意两个水平框,Σ1Σ2=Σ2Σ1,距离将会退化为:

其中|| ||F表示Frobenius norm,矩阵中每项数的平方和的开方值;预测框与真实框间的WSD距离可以转化为:

其中wgt,hgt是真实框的宽高,d表示预测框与真实框间的WSD距离;

(53)在计算得到d后,需要将d映射到0-1之间,如下公式是改进的损失函数,增加了对预测框宽高的约束:

其中func是映射函数,C是一个归一化参数,在训练过程中自适应的计算C,V是纵横比,反映预测框宽高和真实框宽高的相似程度,α是由V计算得到;

参数C使得映射函数可以使用更加普遍且简单的函数例如e-d,另一方面能更好的拟合不同尺度的目标;在得到IOU后,根据IOU的大小评估模型的表现,并反向传播梯度训练模型;

(54)在得到IOU值后,根据IOU的大小评估模型的表现,并反向传播梯度训练模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310532596.9/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top