[发明专利]一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法在审
| 申请号: | 201410055126.9 | 申请日: | 2014-02-18 |
| 公开(公告)号: | CN103942573A | 公开(公告)日: | 2014-07-23 |
| 发明(设计)人: | 王爽;焦李成;张雪;陈阳平;马晶晶;马文萍;侯彪 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06K9/66 | 分类号: | G06K9/66 |
| 代理公司: | 西安智萃知识产权代理有限公司 61221 | 代理人: | 李东京 |
| 地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 空间 关系 潜在 狄利克雷 模型 自然 场景 图像 分类 方法 | ||
技术领域
本发明属于图像处理技术领域,特别涉及一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法。
背景技术
在过去的十年里,自然场景图像分类已经成为图像处理技术领域里一个很重要的研究主体。自然场景图像分类有很广泛的应用,如目标识别与检测和智能车辆或机器人导航等领域。由于自然场景图像类内差异性、照明条件差异性和图像本身尺度差异性较大,使其仍然是具有挑战性的问题。
自然场景图像分类的分类方法大致可以分为两类:一类是基于低层语义模型的自然场景图像分类方法;一类是基于中层语义模型的自然场景图像分类方法。早期的一些自然场景图像分类方法大多数是应用低层信息建立模型的,这些方法采用全局统计信息,如运用全局的颜色或者纹理特征直方图表示图像。尽管这些方法的时间复杂性较低,但是它们通常应用于人为场景图像和室内场景图像分类,并且分类结果较差。近期关于自然场景图像分类的方法都是基于中层语义模型的,它们弥补了高层语义信息和低层语义信息之间的鸿沟,并解决层次分类定义重叠问题,因此得到了广泛应用。
由于图像的语义大都通过区域对象来体现,采用基于区域的方法对图像进行场景分类是一种合理有效的方法。但是在场景图像分类训练集中,往往不具体指定图像区域和目标之间的对应关系,而且图像区域之间往往存在着语义概念相关性,这给基于区域的有监督学习算法造成了困难。图像区域间的相关性是指同一幅图像的一些图像区域往往对应着相同的语义概念,且对应不同语义的图像区域间往往也存在的关联性。比如对一幅含有“天空”、“云彩”等语义概念的图像进行分割后,某一图像区域含有目标语义“天空”,与它相邻的图像区域也会包含有“天空”的概念,而且不同的语义概念“云彩”和“天空”具有较高的同时出现的频率,它们对应的不同图像区域之间也存在着语义相关性。Wang等人提出了一种结合底层视觉特征分布和区域间关系的图像区域标注的概率模型,它有效地利用了图像区域间的关系,对图像区域进行标注。但是Wang等人提出的算法需要事先标记每一个图像区域对应的语义概念,然后建立含有同一语义概念的图像区域训练集,需要大量人工标记。然而通常情况下并不能够提供这样的训练集,而且该文中使用的表示概念类的高斯分布模型较为简单,实验测试 也仅在较小的数据集上进行。为了减少生成中间语义所需的人工标记工作,一些采用文本主题模型的方法被用于自然场景图像分类,这些方法主要以Lifeifei和Quelhas等人提出的自然场景图像分类方法为代表。这些方法通常先提取图像中的尺度不变特征,然后将图像的尺度不变特征通过聚类生成一个字典来表示聚类中心,然后通过字典映射得到一个表示图像的稀疏表示向量,最后应用文本分类中的概率潜在语义分析方法和潜在狄利克雷模型等主题分析方法来找出图像的潜在语义主题分布,从而完成图像的场景分类。
上述方法或对人工标记的需求很大,或通常是根据图像中视觉词汇出现的总体情况来进行场景分类的,由于没有考虑图像的空间信息,因此往往不能得到准确率高的分类结果。
发明内容
本发明的目的在于针对上述已有方法的不足,提出一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法,以减少人工标记的需求,具有处理较大数据的能力,并通过引入图像空间信息,提高分类正确率。
为实现上述目的,本发明的技术方案,一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法,其特征是:包括如下步骤:
(1)分别建立自然场景图像分类训练集和图像分类测试集;
(2)用空间金字塔分块方法分别对自然场景图像分类训练集和图像分类测试集中的图像进行图像分块,得到图像块集合P={P1,P2,…,Pi,…,Pn},其中Pi为图像的第i个图像块,n为图像的分块总数;
(3)提取训练集中图像的图像块集合P的采样点尺度不变特征集合F,生成字典D:
(3a)用网格采样方法对训练集中图像的图像块集合P进行网格采样,得到图像的图像块网格采样点集SP={SP1,SP2,…,SPi,…,SPn},其中SPi为图像第i个图像块的网格采样点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410055126.9/2.html,转载请声明来源钻瓜专利网。





