[发明专利]复杂背景下多目标多尺寸图像检测方法、系统、电子设备以及存储介质在审
申请号: | 202310233827.6 | 申请日: | 2023-03-12 |
公开(公告)号: | CN116229086A | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 王纪晨 | 申请(专利权)人: | 王纪晨 |
主分类号: | G06V10/40 | 分类号: | G06V10/40;G06V10/774;G06V10/82;G06V10/766;G06N3/044;G06N3/045;G06N3/0464;G06N3/098 |
代理公司: | 北京奇眸智达知识产权代理有限公司 11861 | 代理人: | 陈彩云 |
地址: | 130022 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复杂 背景 多目标 尺寸 图像 检测 方法 系统 电子设备 以及 存储 介质 | ||
1.一种复杂背景下多目标多尺寸图像检测方法,其特征在于,所述方法包括:
在数据集库选取背景复杂、目标数量多的图像,并对图像进行预处理,对图像进行标注,得到复杂背景下多目标多尺寸数据训练集;
基于YOLOv3模型,采用Darknet-53特征提取网络结构提取图像后进行特征提取;
采用通道自适应FPN递归层特征强化提取网络对特征提取强化,增强特征检测的强度和精度;
通过判断预测框与真实框之间的位置关系来自适应替换边界框回归损失函数,模型参数能继续优化,加快模型的收敛速度,提升预测框的准确度;
对于数据训练集进行训练,训练结束后使用自采集待测图片进行效果检验。
2.根据权利要求1所述的方法,其特征在于,所述对图像进行预处理,包括:
在空白图像中随机初始化一个点,使用初始化的横纵坐标将空白图像分为四个区域,随机读取四张图像;
对图像进行镜像翻转、尺度缩放后形成一张新的图像,并将读取的图像所对应的标签进行相应的旋转、缩放、平移。
3.根据权利要求1所述的方法,其特征在于,所述采用通道自适应FPN递归层特征强化提取网络对特征提取强化,增强特征检测的强度和精度,包括:
基于FPN可以提供一种自顶向下的路径来融合多尺度特征图中的特征原理,建立FPN金字塔网络结构,其中,FPN的网络输出公式
fi=Fi(fi+1,Xi)
Xi=Bi(Xi-1)
其中,Bi表示骨干网络从下至上路径的第i阶段,Xi表示第i阶段的输出,Fi表示对应的从上至下路径额外反馈的操作,fi表示输出,其中i的取值范围为1-S,S表示骨干网络中的阶段数,f(s+1)=0;
将FPN各层从上到下的附加反馈连接到自下而上的Darknet-53骨干特征提取层中;
基于ECA-Block模块融合了每层局部接受场的空间和通道信息,使网络能够构建信息特征,自适应地改变通道权重关系的原理,然后通过ECA-Block来完成递归层中的通道自适应,通过自适应的权重模块计算各通道的权重来分配通道的权重;
对于ECA-Block通道的注意力模块计算权重后每个通道都有一个与之对应的数字,该数字为通道的自适应权重;
ECA-Block通道的注意力模块计算权重:
积块提取的图像特征输出为U∈RW×H×G,其中W、H、C分别为宽度、高度和通道数;
所有空间信息通过全局平均池化压缩到统计信息中,统计信息由空间维H×W收缩计算的卷积输出产生,所以Z的第c元素,即Z1×1×c,平均池化生成公式:
得到聚合特征Z1×1×C后,通过卷积核大小为K的一维卷积生成通道权值,其中一维卷积核K由信道维数C自适应确定,生成卷积核K公式:
其中,k为卷积核的大小,|t|odd为距离t最近的奇数值,C为通道的维数,γ、b分别为固定值2和1;
对目标图像进行两次的特征提取,递归提取增强了特征检测的强度和精度,输出特征依赖于前面步骤的输出,其中,Ri表示自适应FPN递归层连接到骨干网之前的特征转换,输出特征fi
fi=Fi(fi+1,xi),xi=ui(xi-1,Ri(fi))
式中,ui表示的是骨干提取网络中的第i层卷积运算,xi为卷积操作后的特征,Fi代表FPN对xi的第i次运算;
递归输出特征可以展开为一个输出顺序网络,即当
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王纪晨,未经王纪晨许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310233827.6/1.html,转载请声明来源钻瓜专利网。