[发明专利]超低空无人机视角下的多行人检测与姿态估计方法在审
| 申请号: | 202310136199.X | 申请日: | 2023-02-20 |
| 公开(公告)号: | CN116152682A | 公开(公告)日: | 2023-05-23 |
| 发明(设计)人: | 任艳;刘昱玮;陈新禹;张天博;乔志华 | 申请(专利权)人: | 沈阳航空航天大学 |
| 主分类号: | G06V20/17 | 分类号: | G06V20/17;G06V40/10;G06V10/82;G06T7/73;G06V10/774;G06V10/764;G06N3/0464;G06N3/08 |
| 代理公司: | 沈阳维特专利商标事务所(普通合伙) 21229 | 代理人: | 李娜 |
| 地址: | 110136 辽宁省沈*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 超低空 无人机 视角 行人 检测 姿态 估计 方法 | ||
1.超低空无人机视角下的多行人检测与姿态估计方法,其特征在于:包括,
利用无人机采集图像数据,对数据集进行数据预处理;
对数据集进行数据增强;
利用YOLOv5算法使用增强后的数据训练目标检测网络;
利用训练好的目标检测网络进行多行人检测,利用单人姿态估计算法进行姿态估计。
2.如权利要求1所述的超低空无人机视角下的多行人检测与姿态估计方法,其特征在于:对选用的Okutama-Action数据集按照如下标签进行筛选:包括,目标ID、标注框左上角的x坐标、标注框左上角的y坐标、标注框右下角的x坐标、标注框右下角的y坐标、该标注对应的帧号、目标是否丢失、目标是否有遮挡、是否为生成的标注和标注对应的类别;目标若丢失则标注为1、目标若遮挡则标注为1、该标注是通过自动插值生成的则标注为1;180帧内,拥有相同ID的是一个人;在下一个180帧会有新的ID,一个人缺席90帧就会有新的ID;标注框左上是坐标xy最小值;标注框右下的坐标xy最大值。
3.如权利要求2所述的超低空无人机视角下的多行人检测与姿态估计方法,其特征在于:对筛选后的标签信息采用如下规则进行预处理剔除无效信息:
1)若同一行人在180帧的倍数帧存在信息重复,则选用较大帧数下对应的目标ID信息作为本帧的标签信息;
2)丢失情况标注为1的标签丢弃,丢失情况标注为0的标签保留;
3)遮挡情况标注为1的标签保留,遮挡情况标注为0的标签保留;
4)插值生成情况标注为1的标签丢弃,插值生成情况标注为0的标签保留。
4.如权利要求3所述的超低空无人机视角下的多行人检测与姿态估计方法,其特征在于:将筛选后的有效标签信息表示为:
(track ID,xmin,ymin,xmax,ymax,label),
其中,track ID表示目标ID,xmin为标注框左上角的x坐标,ymin为标注框左上角的y坐标,xmax为标注框右下角的x坐标,ymax为标注框右下角的y坐标,label为类别;将(track ID,xmin,ymin,xmax,ymax,label)转换为(cls_id,x,y,w,h)并归一化,含义为(目标类别,目标的中心坐标x值,目标的中心坐标y值,目标标注框的宽,目标标注框的高),由于label中只包含person一个类别,所以cls_id均为0;W是图像宽度,H是图像高度,归一化公式如下,
并采用labelimg修正筛选过的数据集,利用修正过的Okutama-Action数据集和通过无人机对某校园道路场景拍摄而获得的数据集建立数据库,划分训练集、验证集和测试集,比例为7:2:1。
5.如权利要求4所述的超低空无人机视角下的多行人检测与姿态估计方法,其特征在于:对数据集进行数据增强,依次包括马赛克数据增强、仿射变换、图像翻转、HSV随机增强、cutout数据增强。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳航空航天大学,未经沈阳航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310136199.X/1.html,转载请声明来源钻瓜专利网。





