[发明专利]一种基于自适应多级融合特征池的目标检测方法在审
申请号: | 202211617845.6 | 申请日: | 2022-12-15 |
公开(公告)号: | CN116342987A | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 李伟生;黄麟 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06V10/778 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 多级 融合 特征 目标 检测 方法 | ||
1.一种基于自适应多级融合特征池的目标检测方法,其特征在于,包括以下步骤:
S1.基于现有YOLOv5网络构建改进YOLOv5网络,改进YOLOv5网络包括骨干网络、颈部网络和头部网络;颈部网络中加入了多级融合特征池、批次通道均值结构和均值压缩扩展结构;
S2.获取图像数据集训练改进YOLOv5网络,采用损失函数进行迭代训练,调整网络参数;
S3.将训练好的改进YOLOv5网络用于目标检测,得到目标检测结果。
2.根据权利要求1所述的一种基于自适应多级融合特征池的目标检测方法,其特征在于,改进YOLOv5网络包括有第二CSP1模块、第三CSP1模块和第二Conv模块;
获取第二CSP1模块的输出特征,并将其通过步长为2且卷积核为3×3的卷积层得到下采样结果,将该下采样结果作为多级融合特征池的第一输入特征;获取第三CSP1模块的输出特征,并将其作为多级融合特征池的第二输入特征;获取第二Conv模块的输出特征,并将其通过临近插值算法进行上采样,将上采样结果作为多级融合特征池的第三输入特征;多级融合特征池结构将第一输入特征、第二输入特征和第三输入特征融合得到特征拼接图,将该特征拼接图输入批次通道均值结构,再将批次通道均值结构的输出送入均值压缩扩展结构。
3.根据权利要求2所述的一种基于自适应多级融合特征池的目标检测方法,其特征在于,改进YOLOv5网络还包括有第一CSP2模块、第二CSP2模块和第三CSP2模块;将第一输入特征与均值压缩扩展结构的输出相乘,并将相乘结果进行上采样后输入第一CSP2模块;将第二输入特征与均值压缩扩展结构的输出相乘,并将相乘结果输入第二CSP2模块;将第三输入特征与均值压缩扩展结构的输出相乘,并将相乘结果进行下采样后输入第三CSP2模块。
4.根据权利要求2所述的一种基于自适应多级融合特征池的目标检测方法,其特征在于,第一输入特征、第二输入特征和第三输入特征的尺度均相同。
5.根据权利要求1所述的一种基于自适应多级融合特征池的目标检测方法,其特征在于,批次通道均值结构包括空间均值模块和批次均值模块;首先通过空间均值模块计算多级融合特征池的输出特征图的空间均值;然后将该输出特征图的空间均值送入批次均值模块计算批次均值。
6.根据权利要求5所述的一种基于自适应多级融合特征池的目标检测方法,其特征在于,空间均值模块和批次均值模块的计算公式分别为:
其中,表示空间均值,表示批次均值,w表示多级融合特征池的输出特征图的宽度,h表示多级融合特征池的输出特征图的高度,b表示批次训练数量,pij表示多级融合特征池的输出特征图第i行第j列的特征值,qm表示第m张输出特征图的空间均值。
7.根据权利要求1所述的一种基于自适应多级融合特征池的目标检测方法,其特征在于,均值压缩扩展结构采用两个1×1卷积对批次通道均值结构的输出依次进行压缩和扩张,采用sigmoid函数对均值压缩扩展结构的输出进行处理得到通道特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211617845.6/1.html,转载请声明来源钻瓜专利网。