[发明专利]一种基于形状玻尔兹曼机的补全式行人检测方法有效
| 申请号: | 201710052873.0 | 申请日: | 2017-01-24 | 
| 公开(公告)号: | CN106803080B | 公开(公告)日: | 2019-12-31 | 
| 发明(设计)人: | 赵保军;赵博雅;韩煜祺;唐玮;邓宸伟 | 申请(专利权)人: | 北京理工大学 | 
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06K9/66 | 
| 代理公司: | 11120 北京理工大学专利中心 | 代理人: | 代丽;仇蕾安 | 
| 地址: | 100081 *** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 形状 玻尔兹曼机 补全式 行人 检测 方法 | ||
1.一种基于形状玻尔兹曼机的补全式行人检测方法,其特征在于,包括如下步骤:
步骤1,从监控图像训练集中人工提取行人目标切片图;
步骤2,根据监测视角的变化,将步骤1得到的所有目标分为不同视角的子集;提取各子集中目标的多尺度hog特征;利用各子集的多尺度hog特征对子集对应视角的分类器进行训练,得到各视角的训练好的分类器;分类器的输出为是行人的概率;其中,分类器中的正样本为行人目标的多尺度hog特征,负样本为背景信息;
步骤3,利用步骤2得到的不同视角的训练好的分类器分别对待检测图片进行滑动窗口检测,在同一滑窗位置上以不同分类器得到的预测概率值中的最大值作为该滑窗位置的预测概率值P,并以获得最大值的分类器所对应的视角为该滑窗位置处对应切片图的视角;
步骤4,将预测概率值位于[0.4,0.8]区间的滑窗位置对应的切片图做进一步处理:将这些切片图转变为灰度图,通过形状玻尔兹曼机对这些切片图进行目标补全处理;
步骤5,针对步骤4补全后的目标切片,求取目标的多级直方图;将目标多级直方图和预先获得的与切片视角相同的行人标准多级直方图进行L2范数匹配,并将匹配结果归一化到-0.4至0.4之间;
其中,所述目标多级直方图的获取方式为:根据人本身的物理形状特征及视角,将人从头部开始由上至下等分为5部分,对每一部分求基于轮廓内二值的直方图,将每一部分的直方图依次拼接为一个目标多级直方图;
步骤6,将步骤5得到的归一化后的匹配结果和步骤3获得的相应切片图的预测概率值P相叠加,得到该切片图的最终预测概率值;
步骤7,将步骤6获得的最终预测概率值与设定阈值进行比较,确定目标是否为行人目标。
2.如权利要求1所述的基于形状玻尔兹曼机的补全式行人检测方法,其特征在于,采用高斯金字塔提取多尺度hog特征。
3.如权利要求2所述的基于形状玻尔兹曼机的补全式行人检测方法,其特征在于,所述多尺度hog特征的提取方法如下:
首先,构建图像I的N/K层高斯金字塔,然后提取N/K层高斯金字塔的各层特征;在N/K层高斯金字塔中相邻的第h层与第h+1层之间设置K-1层,形成N层高斯金字塔;其中,N/K层高斯金字塔中第h层与第h+1层之间的K-1层的特征由公式(I)计算得到:
f(I,s+h)≈f(I,h)e-λs (I)
其中,h=1,2,…,N/K;s=1,2,…,K-1;f(I,s+h)为图像I的第s+h层的特征,所述s+h层位于第hN/K层与第(h+1)N/K层之间;f(I,h)为第h层的特征;λ是经验值,取1.099;K取值为3~10,N为需要构建的高斯金字塔的总层数;
由此,得到最终的N层高斯金字塔各层的特征,所述最终的N层高斯金字塔各层特征的集合即为多尺度hog特征。
4.如权利要求1所述的基于形状玻尔兹曼机的补全式行人检测方法,其特征在于,所述分类器为:支持向量机、随机森林、决策树或ADABOOST。
5.如权利要求4所述的基于形状玻尔兹曼机的补全式行人检测方法,其特征在于,采用RBF-SVM支持向量机,其核函数选择直方图交叉核。
6.如权利要求1所述的基于形状玻尔兹曼机的补全式行人检测方法,其特征在于,所述步骤3中,滑动窗口的步长设置为1到8之间。
7.如权利要求1所述的基于形状玻尔兹曼机的补全式行人检测方法,其特征在于,所述步骤4中,事先对形状玻尔兹曼机进行训练,训练方法为:利用各视角下完整的目标切片,采用基于gibbs采样的梯度下降法,对形状玻尔兹曼机进行训练。
8.如权利要求1所述的基于形状玻尔兹曼机的补全式行人检测方法,其特征在于,所述步骤2中,利用监控图像测试集对训练好的分类器进行测试,如果分类器在测试集中的准确率小于70%,则修改分类器参数,重复步骤2,重新训练,直到分类器在测试集中的准确率大于或等于70%,得到最终的训练好的分类器,执行步骤3。
9.如权利要求8所述的基于形状玻尔兹曼机的补全式行人检测方法,其特征在于,对监控图像测试集中的图像进行基于形状玻尔兹曼机的补全式行人检测,如果补全式检测结果在测试集中的准确率小于90%,则修改形状玻尔兹曼机参数,重新对切片图的目标进行补全,执行步骤5~7,直到基于形状玻尔兹曼机的补全式检测结果在测试集中的准确率大于或等于90%,得到最终的形状玻尔兹曼机参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710052873.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:指纹模组及移动终端
- 下一篇:一种基于多分类器集成的脑电分类方法





