[发明专利]一种基于改进YOLOv5的中学物理实验器材检测方法在审

专利信息
申请号: 202211510728.X 申请日: 2022-11-29
公开(公告)号: CN115937674A 公开(公告)日: 2023-04-07
发明(设计)人: 张原;梁铭炬;刘利姣;晏昊东 申请(专利权)人: 郑州大学
主分类号: G06V20/10 分类号: G06V20/10;G06V10/764;G06V10/77;G06V10/774;G06V10/80;G06V10/82;G06N3/048;G06N3/08
代理公司: 郑州亦鼎知识产权代理事务所(普通合伙) 41188 代理人: 王璐
地址: 450001 河南省郑州市市*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 改进 yolov5 中学物理 实验 器材 检测 方法
【权利要求书】:

1.一种基于改进YOLOv5的中学物理实验器材检测方法,其特征在于,包括如下步骤:

S1.获取在多种场景下拍摄的物理实验器材数据集;

S2.对采集到的数据集进行预处理并划分为训练集和测试集;

S3.构建基于改进YOLOv5网络的检测模型,所述改进YOLOv5网络基于原YOLOv5网络,主干网络采用ShuffleNet网络,颈部网络采用Ghost-PAN结构,将原YOLOv5网络的检测头解耦合,并引入自适应空间任务对齐的模块,以增强分类与回归任务之间的交互性,得到融合不同信息的定位或分类特征;

S4.利用训练集对所述检测模型进行训练,得到训练好的检测模型;

S5.部署训练好的检测模型,完成对中学物理实验器材的检测。

2.根据权利要求1所述的基于改进YOLOv5的中学物理实验器材检测方法,其特征在于,所述步骤S2中,对数据集进行预处理,将拍摄图片在保证宽高比一致的情况下,调整图片为统一的分辨率。

3.根据权利要求1所述的基于改进YOLOv5的中学物理实验器材检测方法,其特征在于,所述步骤S2中,划分训练集和测试集:首先对拍摄图片使用LabelImg标注工具进行标注,得到标注后的XML文件;然后将拍摄图片及其XML文件按照VOC格式进行存储,创建Annotations、JPEGImages文件夹,Annotations文件夹中存储每一个标签XML文件,JPEGImages文件夹中存储所有图片;通过python脚本把数据格式转换为YOLOv5框架使用的txt格式;最后将数据集按4:1的方式划分为训练集和测试集。

4.根据权利要求1所述的基于改进YOLOv5的中学物理实验器材检测方法,其特征在于,所述步骤S3中,所述Ghost-PAN结构使用GhostNet中的GhostBlock模块处理多层之间特征融合,其基本结构单元由一组1x1卷积和3x3的深度可分卷积组成。

5.根据权利要求1所述的基于改进YOLOv5的中学物理实验器材检测方法,其特征在于,所述步骤S3中,所述自适应空间任务对齐的模块为:

Xtask=w·Xfpn

其中,Xtask为融合不同信息的定位或分类特征,Xfpn为Ghost-PAN结构输出的特征金字塔特征,w为自适应参数,用于捕获层之间的依赖关系。

6.根据权利要求5所述的基于改进YOLOv5的中学物理实验器材检测方法,其特征在于,所述自适应参数w根据跨层任务交互特征计算得来,如下式所示:

w=σ((fc(xfpn)))

其中,fc表示全连接层,σ表示sigmoid函数,xfpn是Xfpn平均池化所得。

7.根据权利要求5所述的基于改进YOLOv5的中学物理实验器材检测方法,其特征在于,从定位或分类特征Xtask中预测得到定位或分类的结果Ytask,如下式所示:

Ytask=conv2(σ(conv1(Xtask)))

其中,conv1和conv2为用于降维的1×1卷积层;

最后,使用sigmod函数将分类或定位的结果Ytask转化为预测的分数或预测的边界框。

8.根据权利要求1所述的基于改进YOLOv5的中学物理实验器材检测方法,其特征在于,所述步骤S3中,所述改进YOLOv5网络的输出端对应两个分支:分类置信度分支和回归分支,分别表示改进YOLOv5网络预测输出的类别得分和位置偏移量,根据预测结果获得图片中的器材类别及位置坐标。

9.根据权利要求1所述的基于改进YOLOv5的中学物理实验器材检测方法,其特征在于,所述步骤S3中,所述改进YOLOv5网络的输出端的损失函数包括边界框的位置误差及类别质量预测两部分,其中边界框的回归损失Lbox采用CIOU损失函数,类别质量评估损失Lobjclass采用QFL损失函数,总损失函数LTotal为两者相加,如下式所示:

Lobjclass=-|y-σ|2((1-y)log(1-σ)+ylog(σ))

公式中,B为预测框的面积;Bgt为真实框的面积;ρ为欧式距离,b为中心点,c是覆盖两个框的最小框的对角线长。α是平衡正数的参数,v是确保长宽比具有一致性的参数;y为0~1的质量标签,σ为网络预测;λ0和λ1为两个损失的权重系数,i为所有网格中的anchor个数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211510728.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top