[发明专利]一种基于多分辨率框架的物体识别检测方法有效
申请号: | 201010134143.3 | 申请日: | 2010-03-29 |
公开(公告)号: | CN101807256A | 公开(公告)日: | 2010-08-18 |
发明(设计)人: | 张加万;付磊;张怡;高中杰 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分辨率 框架 物体 识别 检测 方法 | ||
技术领域
本发明属于计算机视觉领域,涉及一种物体识别检测方法。
背景技术
本发明中涉及到的背景技术有:
(1).快速鲁棒性(Speeded Up Robust Features,SURF)图像局部特征描述符(见文献 [1]):SURF具有尺度及旋转不变,对于光照变化具有很好鲁棒性的特征,而且相比于其他局 部特征,这种特征采取了不同的特征提取方式,增加了特征的提取速度,同时降低了描述的 维数,并且具有较好的特征特异性,达到很好的识别率,近几年在计算机视觉的多个方面得 到了应用。
(2).在众多物体识别检测算法中,基于有监督学习的物体检测算法能够准确快速地检测 出图像中想要类别的物体,而并不把其他类别的物体检测出来,即在检测的同时识别物体, 而且这种物体检测算法能够对单张图像进行物体检测,对于复杂场景也能取得比较好的检测 效果。例如,Agarwal(见文献[2])等人提出使用Forstner感兴趣点检测子检测图像特正, 然后通过SnoW(Sparse Network of Winnows)学习框架训练分类器,利用该分类器形成多尺 度空间的分类活动图,通过分析活动图实现物体的检测。Dalal(见文献[3])等人提出利用 梯度方向柱状图,结合SVM分类器实现人脸的检测,并达到很好的效果。但是这些算法依然 面临很多的问题和挑战,如尺度变化、旋转变化、平移变化、光照变化、视角变化等问题。
发明内容
本发明的目的在于客服现有技术的上述不足,提供一种能够在具有尺度变化、视角变化、 旋转变化、亮度变化、部分遮挡等复杂条件下准确并快速的检测到物体位置的物体识别检测 方法。为此,本发明采用如下的技术方案:
一种基于多分辨率框架的物体识别检测方法,包括构造多分辨率框架分类器和多分辨率 框架下物体检测两部分,步骤如下:
第一步:分别选择所要分类物体的正负样本图像,正样本为所要分类别的物体图像,负 样本为非该类物体的任意其他物体图像,设原始图像分辨率为R,构造用于分类器的训练集 T(R),;
第二步:将训练集T(R)分别作不同采样率σ的采样,得到图像的分辨率分别为 r=1,2,3……R的各个分辨率下的图像训练集合T(r);
第三步:按照下列方法得到物体分类器C(r),最终得到一个包含各个分辨率的层次分 类器H(r),H(r)是由R个单独的分类器C(r)构成:
(a)从图像训练集合T(r)中,分别提取正样本和负样本中所有图像的SURF特征描述 符,正负样本特征描述符分别存储两个集合之中;(b)利用K-means聚类方法,对正负样本 集的特征描述符进行聚类分析;(c)将正负样本集合的聚类结合,形成图像特征词典;(d) 根据正负样本集合在聚类中的索引,求出每幅图像聚类直方图,并根据正负样本对应相应的 标签,将直方图数据和标签进行支持向量机训练,得到分辨率r下的分类器C(r);
第四步:将待检测的图像根据多分辨率分类器的构造流程分别提取R个分辨率不同分辨 率的图像,然后对不同分辨率的测试图像再依次提取不同尺度s的多尺度图像,s=1,2,3……S, 尺度因子为β;
第五步:在每个分辨率图像的各个尺度空间使用相同大小的窗口进行检测,在不同分辨 率之间窗口使用不同的窗口进行检测,每个分辨率的窗口大小为(wr,hr)=(w,h)/aR-r,w,h分 别是原始分辨率窗口的长和宽,a是固定常数;
第六步:对于每个分辨率r和尺度s,所有初始检测窗口的状态全部初始化为1,使用分 类器C(r)以同样窗口大小检测分辨率r的各个尺度空间图像,在尺度空间s上,将检测为0, 即不包含物体的窗口区域丢弃,将检测为1即包含物体的窗口区域保留,传递到r+1分辨率 同一尺度空间s中去,依次进行,直到检测到最高分辨率R,得到最高分辨率R中不同尺度 空间s包含物体的区域;
第七步:在原始分辨率R下各个尺度空间通过使用Mean-shift聚类的方法来得到物体的 最终位置。
作为优选实施方式,其中第三步的步骤(b)包括下列步骤:利用K-means聚类方法,将 正负样本集的特征描述符分别聚成K类,各自形成K个关键字,并且得到每幅图像中特征描 述符的聚类索引,即每个特征符存在哪个聚类当中,同时记下每个聚类中心的中心数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010134143.3/2.html,转载请声明来源钻瓜专利网。