[发明专利]基于语义增强和高斯损失的小目标检测方法在审
| 申请号: | 202310532596.9 | 申请日: | 2023-05-12 |
| 公开(公告)号: | CN116524274A | 公开(公告)日: | 2023-08-01 |
| 发明(设计)人: | 崔嘉敖;产思贤;毛家发;白琮 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/20;G06V10/44;G06V10/80;G06N3/0464;G06N3/048;G06N3/08;G06T7/73 |
| 代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 舒良 |
| 地址: | 310014 浙江省杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 语义 增强 损失 目标 检测 方法 | ||
1.一种基于语义增强和高斯损失的小目标检测方法,包括以下步骤:
1)将训练集中的图像进行图像预处理操作,包括等比缩放、区域填充、仿射变换和mosaic数据增强;
2)经过处理后的图像之后被输入到Darknet-53特征提取网络,随着骨干网络的深入,依次输出三个尺度的特征图,记为C1,C2,C3;
3)C1,C2,C3随后进入改进后的FPN网络,进行语义增强融合;FPN网络输出后的特征图记为P1,P2,P3;
4)经过特征融合的特征图进入Head直接预测目标的类别和预测框位置(cx,cy,w,h);
5)通过高斯Wasserstein距离损失函数对步骤4)得到的预测框结果进行评估,并训练模型。
2.根据权利要求1所述的基于语义增强和高斯损失的小目标检测方法,其特征在于:步骤2)三个特征图C1,C2,C3的尺度分别为76×76、38×38和19×19。
3.根据权利要求1所述的基于语义增强和高斯损失的小目标检测方法,其特征在于:步骤3)所述语义增强融合,包括语义重组和因子融合,具体步骤如下:
(31)首先对C1,C2,C3进行语义重组;
(32)语义重组时先使用1×1的卷积压缩通道,交互各个通道信息的同时,减少计算量;
(33)使用3×3大小的卷积层对压缩通道后的特征图进行编码,让每一个通道学习特征处的上下文信息;编码后的特征图记为Wl;
(34)用Softmax函数对Wl进行归一化,使Wl值总和为1,由此对特征区域实现软选择;
(35)通过Wl对局部特征区域进行重组;对于一个目标位置为l和以此为中心的正方形区域N(Xl,r),重组公式如下:
其中X可以为C1,C2,C3中任意一个,重组后的特征图记为C′1,C′2,C′3;r为Wl的边长;
(36)引入了融合因子α平衡小目标检测中深层与浅层的特征学习;C′1,C′2,C′3按以下方式聚合相邻的特征层:
其中是用于通道匹配的1×1卷积操作,fupsample表示用于分辨率匹配的2×上采样操作,flayer通常是用于特征处理的卷积操作,α表示融合因子;把α设置为网络自学习参数,为在网络开始训练前,根据数据集标签计算得到其初始值,该参数参与梯度反向传播,受到损失函数控制,同时为了防止α过大导致网络梯度爆炸,对其有下约束公式:
Nup,Nlow分别是上层和下层特征图对应尺度目标的数量。
4.根据权利要求3所述的基于语义增强和高斯损失的小目标检测方法,其特征在于:步骤(35)中的r设为3。
5.根据权利要求1所述的基于语义增强和高斯损失的小目标检测方法,其特征在于:步骤5)所述的高斯Wasserstein距离损失函数,具体方法为:
(51);将包围目标的椭圆区域映射为一个2D高斯分布,目标中的点在平面上的分布遵循:
(cx,cy,w,h)表示目标检测数据集中目标使用水平框标注;
(52)将高斯分布记为N(u,∑):
其中d=2,表示二维高斯分布,u为分布的中心点,u=[cx,cy]T,∑为Covariancematrix,反映分布的形状,对角线上的元素为x方向和y方向的方差,斜对角线上的元素是x和y的协方差,反映点在x,y方向上的线性相关程度,在水平分布时为0:
两个二维高斯分布N1(u1,Σ1)和N2(u2,Σ2)之间的WSD距离可表示如下:
对于任意两个水平框,Σ1Σ2=Σ2Σ1,距离将会退化为:
其中|| ||F表示Frobenius norm,矩阵中每项数的平方和的开方值;预测框与真实框间的WSD距离可以转化为:
其中wgt,hgt是真实框的宽高,d表示预测框与真实框间的WSD距离;
(53)在计算得到d后,需要将d映射到0-1之间,如下公式是改进的损失函数,增加了对预测框宽高的约束:
其中func是映射函数,C是一个归一化参数,在训练过程中自适应的计算C,V是纵横比,反映预测框宽高和真实框宽高的相似程度,α是由V计算得到;
参数C使得映射函数可以使用更加普遍且简单的函数例如e-d,另一方面能更好的拟合不同尺度的目标;在得到IOU后,根据IOU的大小评估模型的表现,并反向传播梯度训练模型;
(54)在得到IOU值后,根据IOU的大小评估模型的表现,并反向传播梯度训练模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310532596.9/1.html,转载请声明来源钻瓜专利网。





