[发明专利]一种基于多分辨率框架的物体识别检测方法有效

专利信息
申请号: 201010134143.3 申请日: 2010-03-29
公开(公告)号: CN101807256A 公开(公告)日: 2010-08-18
发明(设计)人: 张加万;付磊;张怡;高中杰 申请(专利权)人: 天津大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 程毓英
地址: 300072 天*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于计算机视觉领域,涉及一种基于多分辨率框架的物体识别检测方法,包括下列步骤:将快速鲁棒性特征描述符(SURF)与文本分类中常用的简单模型Bag-of-word(词袋模型)模型和SVM(支持向量机)相结合,构造了基于SURF特征的有监督学习二元物体分类器;在上述分类器的基础上,将基于SURF特征的SVM分类器与图像的多分辨率理论结合,在不同的分辨率空间下进行物体的检测。本发明能够有效解决物体识别和检测中所面临的尺度变化、旋转变化、平移变化、光照变化、视角变化等带来的问题,在多分辨率物体检测框架下,可以有效解决使用滑动窗口方法带来的物体检测时间过长的问题,准确并快速的检测到物体的位置。
搜索关键词: 一种 基于 分辨率 框架 物体 识别 检测 方法
【主权项】:
一种基于多分辨率框架的物体识别检测方法,包括构造多分辨率框架分类器和多分辨率框架下物体检测两部分,步骤如下:第一步:分别选择所要分类物体的正负样本图像,正样本为所要分类别的物体图像,负样本为非该类物体的任意其他物体图像,设原始图像分辨率为R,构造用于分类器的训练集T(R),;第二步:将训练集T(R)分别作不同采样率σ的采样,得到图像的分辨率分别为r=1,2,3……R的各个分辨率下的图像训练集合T(r);第三步:按照下列方法得到物体分类器C(r),最终得到一个包含各个分辨率的层次分类器H(r),H(r)是由R个单独的分类器C(r)构成:从图像训练集合T(r)中,分别提取正样本和负样本中所有图像的SURF特征描述符,正负样本特征描述符分别存储两个集合之中;(b)利用K-means聚类方法,对正负样本集的特征描述符进行聚类分析;(c)将正负样本集合的聚类结合,形成图像特征词典;(d)根据正负样本集合在聚类中的索引,求出每幅图像聚类直方图,并根据正负样本对应相应的标签,将直方图数据和标签进行支持向量机训练,得到分辨率r下的分类器C(r);第四步:将待检测的图像根据多分辨率分类器的构造流程分别提取R个分辨率不同分辨率的图像,然后对不同分辨率的测试图像再依次提取不同尺度s的多尺度图像,s=1,2,3……S,尺度因子为β;第五步:在每个分辨率图像的各个尺度空间使用相同大小的窗口进行检测,在不同分辨率之间窗口使用不同的窗口进行检测,每个分辨率的窗口大小为(wr,hr)=(w,h)/aR-r,w,h分别是原始分辨率窗口的长和宽,a是固定常数;第六步:对于每个分辨率r和尺度s,所有初始检测窗口的状态全部初始化为1,使用分类器C(r)以同样窗口大小检测分辨率r的各个尺度空间图像,在尺度空间s上,将检测为0,即不包含物体的窗口区域丢弃,将检测为1即包含物体的窗口区域保留,传递到r+1分辨率同一尺度空间s中去,依次进行,直到检测到最高分辨率R,得到最高分辨率R中不同尺度空间s包含物体的区域;第七步:在原始分辨率下R各个尺度空间通过使用Mean-shift聚类的方法来得到物体的最终位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201010134143.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top