[发明专利]基于最大期望参数估计的多分类器集成方法无效
申请号: | 201010566285.7 | 申请日: | 2010-11-30 |
公开(公告)号: | CN102024030A | 公开(公告)日: | 2011-04-20 |
发明(设计)人: | 王向阳;陈景伟 | 申请(专利权)人: | 辽宁师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 曲永祚 |
地址: | 116029 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 最大 期望 参数估计 分类 集成 方法 | ||
技术领域
本发明所述的基于最大期望参数估计的多分类器集成方法,属于多媒体信息中基于相关反馈的图像检索领域,主要涉及到一种对多个单一分类器用最大期望参数估计方法进行集成的基于相关反馈的图像检索方法。
背景技术
目前随着多媒体技术的快速发展及Internet技术的日益普及,数字图像的来源越来越广泛,每天各个领域都会产生数以千兆字节的图像信息。如何从浩瀚的图像信息中快速准确的查找出用户所需要的信息成为了迫切需要解决的问题,基于内容的图像检索技术应运而生,成为信息检索领域的研究热点,得到了国际学术界广泛研究。所谓基于内容的图像检索,就是根据图像的颜色、纹理、形状等特征,按照某种相似度计算方法,从图像库中找出与用户事先想要查询的图像最相似的若干幅图像。由于图像底层视觉特征与图像高级语义之间存在代沟,因此人们提出了基于反馈的图像检索方法来解决这一问题。早期的相关反馈技术主要采用启发式方法,并可大致分为两类:查询点移动和权值调整。前者通过修改查询向量的方式移动查询点,使得移动后的查询点靠近特征空间中正样本集中的区域;后者通过调整特征分量权重的方式修改距离度量公制,以加强那些能使正样本聚拢或能把正、负样本的特征分量。启发式方法基于这样一种假设:所有正样本大致被包含在特征空间中一个超椭球区域内,但是,该假设过于理想,实际应用中很难满足。目前,学者们更倾向于将相关反馈过程看作机器学习问题,即系统根据用户反馈信息训练一个学习器,然后利用学习器来预测数据库中图像与查询图像之间的相关程度。其中,基于支持向量机(SVM)的相关反馈方法由于支持向量机具有很好的模式分类性能而被广泛应用。然而,相关反馈是一种典型的小样本学习问题,即训练样本数远远小于特征空间维数,这种情况严重限制了SVM的学习性能。因此本发明提出了一种基于最大期望参数估计的集成方法将多个学习器组合起来,皆在创建一个改进的复合学习模型。
所谓最大期望参数估计方法(EM),是一种在不完全数据情况下计算极大似然估计或者后验分布的迭代算法,是一种针对概率模型设计的迭代优化技术。它分为计算期望(E)和极大化(M)两步,这种方法主要应用于图像分割领域。由于在本发明中,我们需要训练若干个分类器,然而各个分类器的样本的分类性能不同,因此我们将最大期望参数估计方法引入到基于反馈的图像检索领域,在构造分类器时,根据每个分类器性能的不同,用改方法为其加一个权值,最后再将各个单一分类器集成。这样能有效的克服单个分类器稳定性弱,分类误差大等问题,针对上述现有技术中所存在的问题,研究设计一种新型的基于最大期望参数估计的多分类器集成方法,从而克服现有技术中所存在的问题是十分必要的。
发明内容
鉴于上述现有技术中所存在的问题,本发明的目的是研究设计一种新型的基于最大期望参数估计的多分类器集成方法,从而解决单个分类器稳定性弱,分类误差大等问题。本发明所述的基于最大期望参数估计的多分类器集成方法包括提取单元、检索单元、标记单元和学习单元;
步骤一:提取单元
该单元是提取图像库中每幅图像的底层视觉特征,然后将提取的特征放入特征库中,主要提取的底层视觉特征有颜色特征、纹理特征和形状特征;
步骤二:检索单元
该步骤属于一个人机交互的过程,用户随机从图像库中选取一幅示例图像,然后系统将特征库中每幅图像特征与该图像进行相似度比较,最后返回给用户与该示例图像最相似的N幅图像,其中N=10;
步骤三:标记单元
该步骤要对进行学习训练的样本图像进行标记;
步骤四:学习单元
该单元主要包括三个步骤,
一构造分类器asymmetric bagging SVM;
二构造分类器random subspace SVM;
三为两类分类器加权来集成为一个分类器。
本发明所述的提取单元包括如下三个步骤:
步骤一、颜色的提取,用颜色直方图作为颜色特征;首先将颜色空间由RGB转化到HSV空间,然后将HSV颜色空间量化成64份,最后统计落在每一份中像素点的个数;
步骤二、纹理的提取,用离散小波变换后的均值和方差作为纹理特征;首先对图像进行3级小波变换,然后计算每级变换后3个高频子带的均值和方差;
步骤三、形状的提取,用边缘方向直方图作为形状特征;首先用Sobel算子提取图像边缘,然后统计图像边缘点在水平、45°、垂直、135°方向像素点个数。
本发明所述的检索单元是特征向量之间相似度比较,具体步骤为:
步骤一、用户任选一幅示例图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁师范大学,未经辽宁师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010566285.7/2.html,转载请声明来源钻瓜专利网。