[发明专利]一种基于深度神经网络的无重叠区域行人跟踪方法有效
| 申请号: | 201810192601.5 | 申请日: | 2018-03-09 |
| 公开(公告)号: | CN108509859B | 公开(公告)日: | 2022-08-26 |
| 发明(设计)人: | 韩光;葛亚鸣;苏晋鹏;李晓飞 | 申请(专利权)人: | 南京邮电大学 |
| 主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/84;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 神经网络 重叠 区域 行人 跟踪 方法 | ||
1.一种基于深度神经网络的无重叠区域行人跟踪方法,其特征在于,该方法包括以下步骤:
(1)采用YOLO算法对监控视频图像中当前行人目标进行检测,分割行人目标图片;
(2)使用卡尔曼算法对当前行人 检测结果跟踪预测;
(3)利用深度残差网络提取图片的深度特征,所述图片包括候选行人图片和所述步骤(2)中的目标行人图片,并存储所述候选行人的图片及其特征;所用深度残差网络采用ResNet-50模型作为主干网络,ResNet-50以残差单元组成的卷积模块为基本组成:
第一个卷积模块Conv1:卷积核大小为7×7,输出为64张特征图;
输入数据下采样层pool1:池化窗口大小为3×3,输出为64张特征图;
第二个卷积模块Conv2:包含3个残差单元,每个残差单元包含3个卷积层,卷积核大小分别为1×1,3×3和1×1,最终输出256张特征图;
第三个卷积模块Conv3:包含4个残差单元,每个残差单元包含3个卷积层,卷积核大小分别为1×1,3×3和1×1,最终输出512张特征图;
第四个卷积模块Conv4:包含6个残差单元,每个残差单元包含3个卷积层,卷积核大小分别为1×1,3×3和1×1,最终输出1024张特征图;
第五个卷积模块Conv5:包含3个残差单元,每个残差单元包含3个卷积层,卷积核大小分别为1×1,3×3和1×1,最终输出2048张特征图;
输出数据下采样层pool5:池化窗口大小7×7,输出为2048×1的向量,该向量即为对行人图片提取出的深度特征f;
(4)计算目标行人特征与候选行人特征的相似度并排序,识别出所述目标行人;
所述步骤(4)包括:
(41)计算对每个跟踪行人目标提取的深度特征fq与已离线储存的候选行人图片深度特征fgi之间的余弦相似度sim(fq,fgi),其中,fgi表示第i个候选行人图片的深度特征:
(42)对余弦相似度sim(fq,fgi)从到从大到小进行排序;
(43)与目标行人图片余弦相似度最大的候选行人图片,其所属的行人,即为本方法识别出的行人;设定余弦相似度阈值为0.75,即当识别出的最大余弦相似度低于该阈值时则判断目标行人不属于候选行人中的任意一名。
2.根据权利要求1所述的基于深度神经网络的无重叠区域行人跟踪方法,其特征在于,所述步骤(2)包括:
(21)根据所述当前行人检测结果和所述卡尔曼算法,预测所述当前行人在下一帧图像中的位置,并将所述位置更新到预测框中;
(22)对检测框和所述预测框的结果进行配对,计算所述检测框和所述预测框之间的欧式距离;
(23)更新配对成功与配对未成功的预测情况。
3.根据权利要求2所述的基于深度神经网络的无重叠区域行人跟踪方法,其特征在于,所述检测框的显示方法为:
采用YOLO检测模型对输入的所述监控视频的每一帧进行检测,并将其设为只检测行人且设置置信度阈值,只显示所述置信度得分高于所述阈值的所述目标行人的检测框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810192601.5/1.html,转载请声明来源钻瓜专利网。





