[发明专利]密集行人检测方法在审
| 申请号: | 202111512063.1 | 申请日: | 2021-12-07 |
| 公开(公告)号: | CN114202774A | 公开(公告)日: | 2022-03-18 |
| 发明(设计)人: | 高尚;王一帆;卢湖川 | 申请(专利权)人: | 大连理工大学宁波研究院;大连维视科技有限公司 |
| 主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/52;G06N3/04;G06K9/62;G06V10/774;G06V10/74 |
| 代理公司: | 辽宁鸿文知识产权代理有限公司 21102 | 代理人: | 苗青 |
| 地址: | 315016 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 密集 行人 检测 方法 | ||
一种密集行人检测方法。在网络训练阶段,搭建卷积神经网络,训练编码器解码器及检测头部预测正确的行人包围框;并根据预测结果,为每个行人分配一个最佳的预测候选框;固定密度估计头部外的其他网络参数,使用每个行人唯一的预测候选框生成密度目标,训练密度估计头部;最后放开网络所有参数,联合训练整个网络。在测试应用阶段,在进行后处理时,每选定一个确定保留的行人框,则在这张预测密度图上减去对应位置的高斯激活图,对于那些与该被保留行人重叠率大于阈值的行人框,利用更新后的密度图对这些行人框进行二次判断。本发明在密集场景下,解决了通用的非极大值抑制方法会误删的正确预测的包围框的问题,同时也不影响非密集场景的表现。
技术领域
本发明属于图像行人检测技术领域,用于解决检测器后处理阶段常用的非极大值抑制方法,在行人密集情况下,误删正确预测候选框,而导致整体召回率偏低的问题。
背景技术
行人检测是一项非常有挑战的计算机视觉任务,并且作为核心模块被广泛应用于各种计算机视觉系统中。虽然在近些年行人检测技术取得了显著的进步,由于实际应用的情况下,经常出现的遮挡状况,密集状况下的行人检测还是一个十分具有挑战性的任务。
近些年,基于卷积神经网络的方法在行人检测领域取得了绝对的优势地位,精度远高于采用手工设计特征所得到的结果。基于深度卷积神经网络的行人检测器大多基于通用物体检测的经典的深度学习算法,如Ren等人在2015年NeurIPS会议文章Faster r-cnn:Towards real-time object detection with region proposal中提出的Faster R-CNN算法,Tian等人在2019年ICCV会议文章Fcos:Fully convolutional one-stage objectdetection中提出的Fcos算法,并在这些框架上针对行人的特点,及公共场景中行人的密集特性提出针对性的改进方案。这些工作主体可分为两类:
第一类是改进候选框提取阶段,包括改进网络结构而获得更好的行人特征进行后续的候选框分类和回归;设计针对性的损失函数辅助网络训练,提升网络输出的准确性和鲁棒性。Zhang等人在2018年ECCV文章Occlusion-aware R-CNN:Detecting Pedestriansin a Crowd上提出OR-CNN网络,对每个候选框提取5个关键的部位特征进行打分,最后聚合多个非遮挡部位得分得到最后的候选框得分。Pang等人在2019年ICCV会议Mask-GuidedAttention Network for Occluded Pedestrian Detection上提出的MGAN网络通过注意力自网络提取人体前景部位特征进行候选框分类。Wang等人在2018年CVPR会议上提出的Repulsion Loss:Detecting Pedestrians in a Crowd通过推开属于不同行人的预测框来解决密集情况下,预测框出现在两个行人中间的情况。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学宁波研究院;大连维视科技有限公司,未经大连理工大学宁波研究院;大连维视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111512063.1/2.html,转载请声明来源钻瓜专利网。





