[发明专利]基于语义增强和高斯损失的小目标检测方法在审

申请号：	202310532596.9	申请日：	2023-05-12
公开（公告）号：	CN116524274A	公开（公告）日：	2023-08-01
发明（设计）人：	崔嘉敖;产思贤;毛家发;白琮	申请（专利权）人：	浙江工业大学
主分类号：	G06V10/764	分类号：	G06V10/764;G06V10/82;G06V10/20;G06V10/44;G06V10/80;G06N3/0464;G06N3/048;G06N3/08;G06T7/73
代理公司：	杭州天正专利事务所有限公司 33201	代理人：	舒良
地址：	310014 浙江省杭***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于语义增强损失目标检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于语义增强和高斯损失的小目标检测方法，包括以下步骤：

1)将训练集中的图像进行图像预处理操作，包括等比缩放、区域填充、仿射变换和mosaic数据增强；

2)经过处理后的图像之后被输入到Darknet-53特征提取网络，随着骨干网络的深入，依次输出三个尺度的特征图,记为C1,C2,C3；

3)C1,C2,C3随后进入改进后的FPN网络，进行语义增强融合；FPN网络输出后的特征图记为P1,P2,P3；

4)经过特征融合的特征图进入Head直接预测目标的类别和预测框位置(cx,cy,w,h)；

5)通过高斯Wasserstein距离损失函数对步骤4)得到的预测框结果进行评估，并训练模型。

2.根据权利要求1所述的基于语义增强和高斯损失的小目标检测方法，其特征在于：步骤2)三个特征图C1,C2,C3的尺度分别为76×76、38×38和19×19。

3.根据权利要求1所述的基于语义增强和高斯损失的小目标检测方法，其特征在于：步骤3)所述语义增强融合，包括语义重组和因子融合，具体步骤如下：

(31)首先对C1,C2,C3进行语义重组；

(32)语义重组时先使用1×1的卷积压缩通道，交互各个通道信息的同时，减少计算量；

(33)使用3×3大小的卷积层对压缩通道后的特征图进行编码，让每一个通道学习特征处的上下文信息；编码后的特征图记为W_l；

(34)用Softmax函数对W_l进行归一化，使W_l值总和为1，由此对特征区域实现软选择；

(35)通过W_l对局部特征区域进行重组；对于一个目标位置为l和以此为中心的正方形区域N(X_l,r)，重组公式如下：

其中X可以为C1,C2,C3中任意一个，重组后的特征图记为C′₁,C′₂,C′₃；r为W_l的边长；

(36)引入了融合因子α平衡小目标检测中深层与浅层的特征学习；C′₁,C′₂,C′₃按以下方式聚合相邻的特征层：

其中是用于通道匹配的1×1卷积操作，f_upsample表示用于分辨率匹配的2×上采样操作，f_layer通常是用于特征处理的卷积操作，α表示融合因子；把α设置为网络自学习参数，为在网络开始训练前，根据数据集标签计算得到其初始值，该参数参与梯度反向传播，受到损失函数控制，同时为了防止α过大导致网络梯度爆炸，对其有下约束公式：

N_up，N_low分别是上层和下层特征图对应尺度目标的数量。

4.根据权利要求3所述的基于语义增强和高斯损失的小目标检测方法，其特征在于：步骤(35)中的r设为3。

5.根据权利要求1所述的基于语义增强和高斯损失的小目标检测方法，其特征在于：步骤5)所述的高斯Wasserstein距离损失函数，具体方法为：

(51)；将包围目标的椭圆区域映射为一个2D高斯分布，目标中的点在平面上的分布遵循：

(cx,cy,w,h)表示目标检测数据集中目标使用水平框标注；

(52)将高斯分布记为N(u,∑):

其中d＝2,表示二维高斯分布，u为分布的中心点，u＝[cx,cy]^T，∑为Covariancematrix，反映分布的形状，对角线上的元素为x方向和y方向的方差，斜对角线上的元素是x和y的协方差，反映点在x,y方向上的线性相关程度，在水平分布时为0：

两个二维高斯分布N₁(u₁,Σ₁)和N₂(u₂,Σ₂)之间的WSD距离可表示如下：

对于任意两个水平框，Σ₁Σ₂＝Σ₂Σ₁，距离将会退化为：

其中|| ||_F表示Frobenius norm，矩阵中每项数的平方和的开方值；预测框与真实框间的WSD距离可以转化为:

其中w_gt,h_gt是真实框的宽高，d表示预测框与真实框间的WSD距离；

(53)在计算得到d后，需要将d映射到0-1之间，如下公式是改进的损失函数，增加了对预测框宽高的约束：