[发明专利]一种单幅图像行人检测方法有效
| 申请号: | 201510360321.7 | 申请日: | 2015-06-26 |
| 公开(公告)号: | CN104881662B | 公开(公告)日: | 2019-03-08 |
| 发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 北京畅景立达软件技术有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种单幅图像行人检测方法,包括:采集一个真实场景下的行人数据集,标注行人位置,同时采集一个不包含行人的背景数据集,以此作为训练数据,利用梯度幅值特征和线性支持向量机,训练一个“粗”的行人检测器,快速过滤非行人窗口。利用该快速行人检测器,在行人数据集上进行检测,纪录所有输出窗口的位置,根据标注好的行人位置,分别保存为正例窗口和反例窗口。利用这些窗口样本,基于层叠自动编码机,训练一个深度网络,区分行人窗口和非行人窗口。输出最终的由“粗”到“精”的行人检测器,以此实现对输入图像的行人检测。 | ||
| 搜索关键词: | 一种 单幅 图像 行人 检测 方法 | ||
【主权项】:
1.一种单幅图像行人检测方法,其特征在于:(1)采集M幅图像组成行人数据集,记为
,
,图像
上包含有
个行人样本,
,标记图像
上第j个行人样本的位置为:
,其中
为矩形框左上顶点坐标,
为矩形框宽度,
为矩形框长度,所述矩形框为完全包含该行人样本轮廓的人体矩形框,采集的每幅图像的宽均大于20像素,高均大于50像素,采集N幅不包含行人的图像组成背景数据集,记为
;(2)对行人数据集I中的每一幅图像
,根据图像上每个人体矩形框的位置,经过截取,获得对应的人体子图像,行人数据集I中所有图像的所有人体子图像构成了正例样本,将截取的正例人体子图像转换为对应的人体灰度子图像,经过归一化处理得到10*25像素大小的标准人体灰度子图像,计算该10*25像素大小的标准人体灰度子图像的梯度幅值特征
,是一个10行25列的矩阵,将该特征拉直,该拉直后的梯度幅值特征为一个250维的列向量,将所有正例样本的特征记为:
,其中
表示第i幅图像的第j个人体矩形框的拉直梯度幅值特征,在训练集B中的图像上,选择宽高比例为10:25的背景矩形框共10T个,经过截取,获得对应的背景子图像,则这10T个背景子图像构成了反例样本,将截取的反例背景子图像转换为对应的背景灰度子图像,经过归一化处理得到10*25像素大小的标准背景灰度子图像,计算该10*25像素大小的标准背景灰度子图像的梯度幅值特征
,将该特征拉直,该拉直后的梯度幅值特征为一个250维的列向量,将所有反例样本的特征记为:
,是一个250行10T列的矩阵,其中
表示第a个反例样本的拉直梯度幅值特征,将所有正例样本的标签设置为1,反例样本的标签设置为0,训练一个二类线性分类的支持向量机SVM,得到判别投影
,设置得分函数
,其中g表示任意10*25大小的灰度图像样本经过拉直后的梯度幅值特征,该拉直后的梯度幅值特征是一个250维的列向量,计算每个正例样本的标准人体灰度子图像的得分函数值,进行排序,设置检测阈值
,使得该阈值大于99%的正例样本的标准人体灰度子图像的得分函数值;(3)将行人训练集I中的每幅图像进行灰度处理,得到灰度图像,对其进行高斯金字塔处理,缩放比例为
,直到最小尺寸的灰度图像的宽大于10个像素且高大于25个像素,将D+1个尺度作为主尺度,计算每个主尺度灰幅图像的梯度幅值特征图像,通过双三次Bi‑Cubic插值在每两个相邻主尺度之间获得中间尺度的梯度幅值特征图像,在所有尺度的梯度幅值特征图像上进行窗口扫描,窗口大小为10*25像素,水平和垂直方向的步长都是1,对扫描得到的每个10*25像素大小的梯度幅值特征窗口,将其拉直为一个250维的列向量,计算其得分函数值,对得分函数值大于检测阈值
的窗口,以该窗口所在的比例为
的梯度幅值特征图像的比例倒数
缩放该图像,并以该窗口在该尺度的梯度幅值特征图像上的相对位置进行还原,还原得到该窗口在行人训练集I中的对应图像的灰度图像上的相对位置,该灰度图像的尺度为1,该位置为一个宽高比为10:25的矩形框,计算还原得到的每个矩形框与行人训练集I中对应图像上的所有人体矩形框之间的重合度,重合度具体计算方法为:
,即这两个矩形框
的面积重合部分除以两个矩形框的平均面积,将与对应图像上的所有人体矩形框之间的重合度都低于0.5的矩形框作为反例,将与所有人体矩形框中任意一个的重合度大于0.8的矩形框作为正例;(4)利用快速检测结果训练精细行人检测器;(5)利用训练得到的快速行人检测器和精细行人检测器对输入图像进行行人检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京畅景立达软件技术有限公司,未经北京畅景立达软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510360321.7/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





