[发明专利]一种基于形状玻尔兹曼机的补全式行人检测方法有效
| 申请号: | 201710052873.0 | 申请日: | 2017-01-24 |
| 公开(公告)号: | CN106803080B | 公开(公告)日: | 2019-12-31 |
| 发明(设计)人: | 赵保军;赵博雅;韩煜祺;唐玮;邓宸伟 | 申请(专利权)人: | 北京理工大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06K9/66 |
| 代理公司: | 11120 北京理工大学专利中心 | 代理人: | 代丽;仇蕾安 |
| 地址: | 100081 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 形状 玻尔兹曼机 补全式 行人 检测 方法 | ||
本发明公开了一种基于形状玻尔兹曼机的补全式行人检测方法。使用本发明能够解决监控环境下行人检测遮挡的问题。本发明首先通过分类器对图像中行人目标进行初步检测,然后使用形状玻尔兹曼机将行人检测中的遮挡定义为一个连续遮挡的过程,将非完备的检测方法转变为完备的检测方法,满足在监控条件下可能发生的各种遮挡情况;最后基于人体物理模型,使用多级直方图对形状补全后的目标进行匹配度测试,评估目标补全部分与原始部分的匹配程度。通过将支持向量机的预测概率值与目标补全匹配度结合,能够将假正例(FP)与假反例(FN)两种错误分类向相反的方向拉伸,最大程度上降低漏检率和虚警率,提高算法的鲁棒性。
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于形状玻尔兹曼机的补全式行人检测方法。
背景技术
随着视频监控的迅速发展,从监控摄像头获得到的视频分辨率越来越高,存储压力和传输压力也越来越大,由此引发的对于监控视频处理要求也越来越高。其中,对于监控视频下的行人检测是一个十分重要的研究方向,尤其是对于步行区域等地方的人流分析、城市安全保障以及异常行人检测与分析等均有重要意义。同时,因为行人目标是非刚体,这就意味着目标可以有多种表现形式,这种非刚体的特性以及目标之间的相互遮挡为行人的检测带来了挑战。
在行人检测领域里主要分为三类方法:一类是基于模型的方法,包括可变部件模型及其各种加速算法等。这种方法使用的基本特征是hog(梯度直方图)特征,将目标看做一个可变弹簧模型,通过滑动窗口的方式对目标进行检测,能够较好的解决非刚体形变的问题。但是随着图像的分辨率越来越高,这种方法的计算量呈几何倍数增加。并且在目标之间没有遮挡时,其准确度相比单一模型准确率和虚警率都有降低。第二类方法是基于决策森林的方法,主要集中多通道特征上,每一个通道是独立的特征,通过决策森林集中多个弱分类器最终得到检测目标,决策森林能达到目前比较好的效果,并且采用积分图计算特征,使得计算实时性能够保证。决策森林的思想目前能达到最好的方法是采取10个通道的:6个梯度方向、1个梯度幅值和3个颜色通道,称作hog+luv。决策森林的思想限制在于目前采用的特征均为手工特征,并且目前10通道特征的方法不能被解释。第三类方法是基于深度学习的方法,主要方法是卷积神经网络,随着拍摄设备的普及,数据量爆发增长,很容易得到成千上万的数据,这就为使用深度学习提供了基础,但是深度学习目前的问题在于可解释性及参数调节上。在数据库中的效果很好,但是放到实际的场景中,由于视角,目标形变等原因检测效果大打折扣。
同时对于行人检测中遮挡问题的解决主要是两类:第一类是通过训练frankclassifier将行人目标特征从左至右,从上到下进行非连续切割。第二类是在深度神经网络中通过赋予隐层不同的遮挡类型,使得隐层具有检测相应遮挡问题的功能。但是这两种方法对于遮挡问题的解决是一个非完备、非连续的过程,尤其是在监控环境下,遮挡问题多种多样。
发明内容
有鉴于此,本发明提供了一种基于形状玻尔兹曼机的补全式行人检测方法,能够解决监控环境下行人检测遮挡的问题。
本发明的基于形状玻尔兹曼机的补全式行人检测方法,包括如下步骤:
步骤1,从监控图像训练集中人工提取行人目标切片图;
步骤2,根据监测视角的变化,将步骤1得到的所有目标分为不同视角的子集;提取各子集中目标的多尺度hog特征;利用各子集的多尺度hog特征对子集对应视角的分类器进行训练,得到各视角的训练好的分类器;分类器的输出为是否是行人的概率;其中,分类器中的负样本为背景信息,正样本为行人目标的多尺度hog特征;
步骤3,利用步骤2得到的不同视角的训练好的分类器分别对待检测图片进行滑动窗口检测,在同一滑窗位置上以不同分类器得到的预测概率值中的最大值作为该滑窗位置的预测概率值P,并以获得最大值的分类器所对应的视角为该滑窗位置处对应切片图的视角;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710052873.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:指纹模组及移动终端
- 下一篇:一种基于多分类器集成的脑电分类方法





