[发明专利]基于改进YOLOv5-L的宠物犬视频目标检测方法及系统在审

专利信息
申请号: 202211151017.8 申请日: 2022-09-21
公开(公告)号: CN115588150A 公开(公告)日: 2023-01-10
发明(设计)人: 黄步添;汪志刚;刘振广;焦颖颖;许曼迪 申请(专利权)人: 杭州云象网络技术有限公司
主分类号: G06V20/40 分类号: G06V20/40;G06V10/82;G06V10/77;G06V10/764;G06N3/04;G06N3/08
代理公司: 杭州五洲普华专利代理事务所(特殊普通合伙) 33260 代理人: 徐晶晶
地址: 310000 浙江省杭州*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 改进 yolov5 宠物 视频 目标 检测 方法 系统
【说明书】:

发明提出了一种基于改进YOLOv5‑L的宠物犬视频目标检测方法,包括如下步骤:搜集宠物犬图像数据,用于构建初始训练集;搜集包含宠物犬的视频数据,用于构建测试集;对所述测试集中的视频进行帧提取,保存得到的帧图像;对所述初始训练集进行预处理,得到最终训练集;改进YOLOv5‑L模型,具体如下:搭建BackBone网络,改进Pred模块,在BackBone网络后加入SK注意力机制;设置训练参数,对改进后的模型进行训练,保存最佳权重参数文件;将权重参数文件放入检测器中,对测试集中视频进行检测,保存所有检测到宠物犬的视频帧,使用AP指标对检测结果进行评估。本发明减少了模型的参数量,提高了检测模糊、遮挡的视频帧图像的精确度。

技术领域

本发明涉及视频目标检测技术领域,更具体地,涉及一种基于改进YOLOv5-L的宠物犬视频目标检测方法及系统。

背景技术

当前社会,宠物犬已经是很多人共同生活的伙伴,人们为了消除孤寂或出于娱乐目的而豢养它们,宠物犬是一种灵性、聪明的动物,它们在经过人类驯化以后,动作敏捷,善解人意,忠诚主人,同时理解宠物犬的动作行为也是一项重要的研究工作。

目标检测是目前计算机视觉领域的热点,传统的分类任务一般只关心整体,得到的是一张图像的内容描述,而目标检测任务则不同,目标检测关注的是特定的物体目标,目标检测需要的是从背景中提取出感兴趣的目标,并确定这一目标的位置,因而目标检测输出的是一个列表,包含目标的类别和位置。现有的目标检测算法一般分为两种:two-stage检测模型和one-stage检测模型。two-stage检测模型先进行区域生成,该区域称之为region proposal,在通过卷积网络进行样本的分类,常用的two-stage检测模型有R-CNN、SPP-Net、fast R-CNN等。one-stage检测模型则不需要生成region proposal,直接从输入数据中提取特征,直接预测物体的类别和位置信息,常用的算法有:SSD和YOLO。

虽然现有的two-stage检测模型在通用数据集上测试的精度不错,但是这些模型的检测速度非常慢,尤其是在进行视频的检测时,面对fps大于25的视频,two-stage检测模型完全做不到实时的检测。相较于two-stage检测模型,one-stage检测模型的速度更快,其中YOLOv5模型的检测速度远高于two-stage检测模型。但是现有的目标检测模型只适合检测形状规则的物体,在宠物犬视频目标检测中,当宠物犬在运动时,形态发生改变,该模型就很难检测准确。

发明内容

针对上述问题,本发明的目的在于提供一种基于改进YOLOv5-L的目标检测模型,并通过预处理数据集,进行数据加强,提升检测宠物犬运动视频帧时的精确度。

基于上述目的,本发明提出了一种基于改进YOLOv5-L的宠物犬视频目标检测方法及系统。

一种基于改进YOLOv5-L的宠物犬视频目标检测方法,包括如下步骤:

基于获取到的包含宠物犬图像数据和获取到的包含宠物犬的视频数据分别构建初始训练集测试集;

对所述包含宠物犬的视频进行帧提取,得到帧图像;

对所述初始训练集进行预处理,得到最终训练集;

改进YOLOv5-L模型并进行训练,具体为:搭建BackBone网络,改进Pred模块,在BackBone网络后加入SK注意力机制;设置训练参数,对改进后的YOLOv5-L模型进行训练,保存最佳权重参数文件;将所述最佳权重参数文件放入检测器中,对所述最终测试集中视频进行检测,保存所有检测到宠物犬的视频帧,使用AP指标对检测结果进行评估,进而得到最佳改进YOLOv5-L模型;

将待测宠物犬视频输入最佳YOLOv5-L模型,得到相应的检测结果。作为一种可实施方式,所述构建初始训练集和测试集,包括以下步骤:

基于获取到的包含宠物犬图像数据,得到所有已标注的宠物犬图片;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云象网络技术有限公司,未经杭州云象网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211151017.8/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top