[发明专利]一种加入注意力机制的YOLOv5神经网络车辆检测方法在审
申请号: | 202111400884.6 | 申请日: | 2021-11-19 |
公开(公告)号: | CN114092764A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 夏长权;汪李超;时壮壮;朱颖;徐思韵 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 王晓东 |
地址: | 225009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 加入 注意力 机制 yolov5 神经网络 车辆 检测 方法 | ||
1.一种加入注意力机制的YOLOv5神经网络车辆检测方法,其特征在于,包括:
采用汽车图像数据集,对所述数据集进行预处理;
对YOLOv5神经网络进行改进,添加注意力机制;
将标注好的所述数据集按照符合网络要求的格式输入所述改进后的YOLOv5神经网络进行训练并测试结果;
将训练好的模型部署到移动端进行目标车辆的检测与识别。
2.如权利要求1所述的加入注意力机制的YOLOv5神经网络车辆检测方法,其特征在于:所述汽车图像数据集包括UA-DETRAC公开数据集、图像标注工具Labelimg。
3.如权利要求2所述的加入注意力机制的YOLOv5神经网络车辆检测方法,其特征在于:所述的UA-DETRAC公开数据集包括,
24个不同地点拍摄的10个小时的视频;
所述视频以每秒25帧的速度录制,分辨率为960*540像素。
4.如权利要求1~3任一所述的加入注意力机制的YOLOv5神经网络车辆检测方法,其特征在于:对所述数据集进行预处理过程包括,
利用图像标注工具Labelimg对所述图像数据集进行标注;
根据COCO数据集格式将标注后的所述图像数据集保存为txt格式标注文件,并将所述数据集根据8:1的划分比例分为训练集和验证集。
5.如权利要求1所述的加入注意力机制的YOLOv5神经网络车辆检测方法,其特征在于:添加注意力机制包括添加通道注意力模块:
将输入的特征图,即H×W×C,分别经过基于H和W的全局最大池化层和全局平均池化,得到两个1×1×C的特征图;
将所述特征图分别送入一个两层的神经网络,第一层的神经元个数为C/r,激活函数为ReLU,第二层的神经元个数为C;
将输出的特征进行元素求和操作并激活,生成通道注意力模块,即Mc;
将Mc与输入特征进行乘法运算,生成空间注意力模块需要的输入特征,其具体实现公式如下:
其中,H和W分别为输入特征图的高和宽,σ表示Sigmoid函数,F表示输入的特征,和分别表示经过所述平均池化和所述最大池化操作后的特征,W0和W1分别表示每层神经网络的权重函数。
6.如权利要求1所述的加入注意力机制的YOLOv5神经网络车辆检测方法,其特征在于:添加注意力机制包括空间注意力模块:
将所述通道注意力模块输出的特征作为所述空间注意力模块的输入特征图;
所述输入特征图通过所述最大池化层和所述平均池化层,得到两个H*W*1的特征图;
将所述两个特征图进行concat融合并通过一个7*7的卷积层,降维为一个channel,并经过Sigmoid函数生成空间注意力模块即Ms;
将Ms与空间注意力模块的输入特征图做乘法运算,得到最终生成的特征,其具体实现公式如下:
其中,σ表示Sigmoid函数,f7×7表示尺寸为7*7的卷积操作,F表示输入的特征,和分别表示经过平均池化和最大池化操作后的特征。
7.如权利要求1、5~6任一所述的加入注意力机制的YOLOv5神经网络车辆检测方法,其特征在于:训练所述YOLOv5神经网络并测试结果的过程包括,
输入端采用Mosaic数据增强,对输入的图像进行随机缩放,随机剪切,随机排布的方式进行拼接;
自适应锚框计算;
自适应图片缩放。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111400884.6/1.html,转载请声明来源钻瓜专利网。