[发明专利]一种结合不同大小视觉词汇本的图像分类方法有效

专利信息
申请号: 201210007079.1 申请日: 2012-01-11
公开(公告)号: CN102609731A 公开(公告)日: 2012-07-25
发明(设计)人: 罗会兰;廖列法;胡中栋 申请(专利权)人: 江西理工大学
主分类号: G06K9/66 分类号: G06K9/66
代理公司: 暂无信息 代理人: 暂无信息
地址: 341000 江*** 国省代码: 江西;36
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 结合 不同 大小 视觉 词汇 图像 分类 方法
【说明书】:

技术领域

发明属于模式识别、计算机视觉、图像理解技术领域,具体涉及一种图像分类方法。

背景技术

图像分类的困难在于需要建立一个即能容纳类内的高度变化,又要能区分不同类的类模型。“Constellation”模型试图定位不同的物体局部并确定它们在空间上的关系。尽管这些方法可能表示能力强,但是这种空间约束模型无法处理或识别大的变形,比如不在一个平面内的旋转和遮挡,也没有考虑局部数目不确定的物体,比如建筑物和树。许多用于图像分类的流行方法使用独立块的集合来表示图像,这些独立块由局部视觉描述子描述,其中最典型的是“bag-of-words”模型。它确定每类中特定的局部比例,而忽略局部间的空间关系。在检测到图像的兴趣点(独立块)且用描述子描述兴趣点(也就是特征表示)后,必须为训练和测试图像表示它们的分布。一种流行的表示方法,也称为图像量化方法,是通过对描述后的兴趣点集进行聚类得到一个视觉词汇本。然后图像表示成视觉单词标签的直方图。但是几乎所有流行的聚类算法都需要用户输入簇个数。为了提供这个参数,用户必需要有一些图像的先验知识或者通过许多的验证实验来选择一个合适的参数。最近,许多基于“bag-of-words”模型的方法致力于融合多种特征来得到性能提升。计算机视觉领域中流行的结合多个特征的趋势是使用多核学习方法(Multiple Kernel Learning,MKL)。从时间复杂性角度来说,MKL方法不能并行学习多个特征。

本发明试图将集成学习技术的优势应用到图像分类中,集成学习的思想是应用多个学习器并结合他们的预测。图像分类对于传统的机器学习算法是非常困难的,因为描述图像的矢量的维度非常高。为了利用来自于不同信息综合层的线索来分类图像,不同大小的视觉词汇本成员用来构成视觉词汇本集体。当应用基于视觉词汇本集体上学习得到的分类器集体来分类新的图像时,可以得到性能的提升。而且,从时间复杂性角度来说,本发明可以并行学习成员视觉词汇本和相应的成员分类器,具有很好的并行性和可缩放性。

本项发明的主要贡献在于提出了一种结合不同大小视觉词汇本的图像分类方法。本发明能有效减少图像分类的监督程度,综合利用多种有效信息,并行学习物体模型,有效提高图像分类的效率和准确度。

发明内容

为了解决图像分类不能有效融合多种信息和由于描述图像的矢量的高维度,传统的机器学习方法趋向于产生非常不稳定且泛化能力差的模型的问题,本发明提供了一种结合不同大小视觉词汇本的图像分类方法。

本发明将集成学习的优势应用到图像分类中,不同综合层次的特征用来形成视觉词汇本集体。基于视觉词汇本集体上,同一副图像能得到不同的量化矢量。所以,一个分类器集体能在同一训练图像集的不同表达矢量集上学习得到。既然每个成员利用一种图像信息,当用这个分类器集体来分类新的图像时,可以得到意想不到的满意结果。集成方法通过结合多个模型的预测来提高现存算法的性能。

与分类器集体相似,使用视觉词汇本集体来提高视觉词汇本的质量和鲁棒性。词汇本一般是用标准的聚类算法从训练图像集中学习得到,所以使用词汇本集体也可以达到提高聚类算法质量的目的。视觉词汇本集体用来表达不同类型的图像信息。在构建了一个差异性视觉词汇本集体后,就可以得到高差异性的分类器集体,其中的每个成员分类器分别根据不同的图像特征来建立物体模型。所以使用此分类器集体去分类新的图像时,可以得到更好的、更鲁棒的结果。高差异性的集体对于减少建立一个准确模型所需要的监督程度也非常有效。 

本发明直接使用多分辨率信息来量化图像,并行使用来自于不同综合层的多种可用线索分类图像。为了利用不同粒度的信息来分类物体,图像在基于不同大小的视觉词汇本上量化,这些不同大小的视觉词汇本可以捕获不同粒度的图像特征。然后基于不同大小的视觉词汇本,训练图像集得到不同的量化矢量集,从而可以学习到不同的分类器,每种分类器根据图像不同粒度的信息得到物体不同的模型,集成这些分类器模型来分类新的图像,包括以下步骤:

步骤1. 用兴趣点检测子提取训练图像的兴趣点,然后用描述子描述提取出来的兴趣点;

步骤2. 随机选择一部分描述好的兴趣点,在其上运行聚类算法得到一个成员视觉词汇本,通过设置不同的簇个数作为聚类算法的参数,得到具有不同大小的成员视觉词汇本;

步骤3. 基于这个成员视觉词汇本对训练图像集进行量化;

步骤4. 在量化后的训练数据集上学习一个分类器;

步骤5. 重复步骤2到步骤4,生成预设大小的视觉词汇本集体和分类器集体;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西理工大学,未经江西理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210007079.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top