[发明专利]一种复杂场景下融合运动信息的行人检测方法有效
| 申请号: | 202011290529.3 | 申请日: | 2020-11-18 |
| 公开(公告)号: | CN112347967B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 侯舒娟;韩羽菲;李海;张钦;宋政育;武毅 | 申请(专利权)人: | 北京理工大学 |
| 主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/52;G06V10/25;G06V10/44;G06V10/80;G06V10/82;G06N3/0464;G06N3/047;G06N3/08 |
| 代理公司: | 北京理工大学专利中心 11120 | 代理人: | 李微微 |
| 地址: | 100081 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 复杂 场景 融合 运动 信息 行人 检测 方法 | ||
本发明公开了一种融合运动信息的复杂场景下的行人检测方法,由运动目标识别网络和行人检测网络两个支路构成,将视频输入网络,分别获得运动目标框和行人检测提议候选框,将两种候选框进行融合,然后根据框的面积大小分成两组,送入两个子网络,分别进行分类和回归,最终合并输出结果;本发明针对分辨率较低、行人在画面中尺寸较小的视频,相较于其他算法可以达到更高的检测率;本发明的行人检测网络是利用运动信息减少漏检,对动态与静态行人目标的检测效果都很好。
技术领域
本发明属于目标检测技术领域,具体涉及一种复杂场景下融合运动信息的行人检测方法。
背景技术
行人是视频监控任务中的重要目标,行人检测也是计算机视觉研究的基础任务和关键技术之一,这种技术用于判断图像或者视频序列中是否存在行人并给予精确定位,在车辆辅助驾驶系统、视频监控、机器人开发等计算机领域被广泛应用。
受存储资源、拍摄距离等众多因素的影响,一般实际中监控视频往往存在视频画质较差、行人目标在画面中所占比例较小、行人目标存在遮挡等问题,导致复杂场景下的行人检测技术在实际应用中仍然存在严重的漏检、误检等问题。随着机器学习技术和计算机视觉的发展,基于深度学习的目标检测技术被广泛的应用到行人检测任务中,取得了不凡的成绩,为复杂场景下的行人检测算法提供了思路。
2012年Lijun Guo等人在《Pedestrian detection Method of IntegratedMotion Information and APPearance Features》一文中提出一种结合运动信息与表观特征的行人检测方法,用于复杂场景下的行人检测任务,将运动信息融入到基于图像序列的对象分割算法中,通过获取更准确的分割结果来提高对候选检测窗口的检测准确率,然而该算法的精度要远低于R-CNN系列的行人检测网络,且计算量较大,在复杂场景下效果不理想。
2013年张芝英在《基于目标运动信息和HOG特征的行人检测的研究与实现》中设计了一种融合了目标运动信息的行人检测分类器,构成了一种HOG与SVM分类器进行行人检测的组合,然而该算法的检测模块精度不及R-CNN系列的行人检测网络,且运算速度较慢,用于运动信息提取的帧间差分法也还有一定的提升空间。
2016年Jianan Li等人在《Scale-aware Fast R-CNN for PedestrianDetection》一文中针对监控视频中的小尺寸行人目标提出了一种将大尺寸子网络和小尺寸子网络集成到同一框架中的网络,但是该网络是一种基于图片的行人检测网络,而且采用的Fast R-CNN网络精度较低,针对低分辨率的图片无法达到比较好的检测效果。
2016年Liliang Zhang等人在《Is Faster R-CNN Doing Well for PedesrtianDetection》一文中公开了一种让通用目标检测Faster R-CNN网络更适用于行人检测任务的改进网络,在分类模块对小尺寸行人目标有着更高的区分性,但是该网络仍然是一种基于图片的检测网络,在图片画质较低的情况下效果并不理想。
2018年Aixin Guo在《Multi-scale Pedestrain Detection based on DeepConvolutional Feature Fusion》中提出了一种基于深度卷积特征融合的多尺度行人检测方案,针对中小尺度行人特征不足的情况,将底层特征和高级语义特征相结合,并引入焦点损失函数来进行难样本挖掘来提高算法精度,该方案虽然在公开数据集中检测率得到了一定的提升,但是只适用于图片画质稍好的情况。
2019年夏金铭等人在《一种基于Faster R-CNN的行人检测算法》中引入了一种难样本挖掘策略,将复杂环境下的样本挑出并对权重进行调整,使训练更有侧重点,以提升模型的泛化性能,同样这也是一种基于图片的行人检测方案,该方案的查全率略有提升,但是仍然只适用于清晰图片的多尺度行人检测任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011290529.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种透光度实时可调的窗机构
- 下一篇:一种可快速更换收卷筒的纺织面料收卷装置





