[发明专利]基于改进YOLOv2的视频图像行人检测方法及系统有效
申请号: | 201910097521.6 | 申请日: | 2019-01-31 |
公开(公告)号: | CN109829428B | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 党建武;王松;王阳萍;兰文博;高德勇;赵庶旭;张振海;闵永智;金静;苏翔宇 | 申请(专利权)人: | 兰州交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 11569 北京高沃律师事务所 | 代理人: | 程华 |
地址: | 730000 甘*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人检测 网络结构 视频图像 行人数据 算法 更新 视频图像处理 对视频图像 改进 聚类处理 聚类算法 候选框 实时性 检测 漏检 误检 遮挡 替换 应用 | ||
1.一种基于改进YOLOv2的视频图像行人检测方法,其特征在于,所述视频图像行人检测方法包括:
制备带有标注信息的视频图像行人数据集;所述视频图像行人数据集由视频帧行人图像数据集和INRIA行人数据集组成;所述视频帧行人图像数据集为在TUD视频数据集中截取的视频帧行人图像所组成的数据集;
利用K-Means++聚类算法对所述视频图像行人数据集进行聚类处理,确定初始候选框;
根据所述初始候选框计算更新值,并用所述更新值替换原YOLOv2算法的原始值,得到更新后的YOLOv2算法;
在所述更新后的YOLOv2算法的网络结构的基础上添加3个Passthrough层,得到改进后的YOLOv2网络结构,具体包括:在所述更新后的YOLOv2算法的网络结构的第21层、第25层、第30层前分别添加1个Passthrough层,得到改进后的YOLOv2网络结构;所述Passthrough层由Route层和Reorg层组成,所述Route层的作用是将指定层的行人特征信息传入到当前层;所述Reorg层的作用是根据所述行人特征信息重组特征图,并与后一层的特征图相匹配;
利用所述视频图像行人数据集,对所述改进后的YOLOv2网络结构进行训练,得到训练好的行人检测模型;
将实时获取的视频帧行人图像输入到所述训练好的行人检测模型中进行行人检测。
2.根据权利要求1所述的基于改进YOLOv2的视频图像行人检测方法,其特征在于,所述制备带有标注信息的视频图像行人数据集,具体包括:
在所述TUD视频数据集中截取视频帧行人图像,得到初始视频帧行人图像数据集;
采用LabelImage软件对所述初始视频帧行人图像数据集中每帧视频帧行人图像进行标注,得到视频帧行人图像数据集;
将所述视频帧行人图像数据集和所述INRIA行人数据集合并,得到视频图像行人数据集。
3.根据权利要求1所述的基于改进YOLOv2的视频图像行人检测方法,其特征在于,所述利用K-Means++聚类算法对所述视频图像行人数据集进行聚类处理,确定初始候选框,具体包括:
利用所述K-Means++聚类算法对所述视频图像行人数据集进行聚类,得到N个聚类结果;
选取与每个所述聚类结果中图像的行人宽高比最相近的初始候选框。
4.根据权利要求3所述的基于改进YOLOv2的视频图像行人检测方法,其特征在于,所述更新值包括两个数值,分别为第一数值和第二数值;所述第一数值为所述初始候选框的高除以所述初始候选框对应的图像的高的值;所述第二数值为所述初始候选框的宽除以所述初始候选框对应的图像的宽的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州交通大学,未经兰州交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910097521.6/1.html,转载请声明来源钻瓜专利网。