[发明专利]一种基于目标及其空间关系特性的图像场景分类方法无效
| 申请号: | 201110214985.4 | 申请日: | 2011-07-29 |
| 公开(公告)号: | CN102902976A | 公开(公告)日: | 2013-01-30 |
| 发明(设计)人: | 金标;胡文龙;付琨 | 申请(专利权)人: | 中国科学院电子学研究所 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/66 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周国城 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 目标 及其 空间 关系 特性 图像 场景 分类 方法 | ||
技术领域
本发明属于图像场景分类技术,涉及图像理解、计算机视觉、人工智能、模式识别等领域,是一种基于目标及其空间关系特性的图像场景分类方法。
背景技术
随着多媒体技术与网络技术的发展,产生了大量的图像信息,图像分类和检索越来越受到人们的关注。同时随着计算机技术的快速提高,图像理解获得了快速发展,其理论不断发展,形成了与计算机视觉、人工智能和认知学领域相互关联又相互独立的领域。图像理解就是对图像的语义解释,利用图像低层视觉特征以及高层知识信息实现目标识别、语义分析以及场景分类。图像场景分类作为图像理解的基本任务之一,是指从多幅图像中区分出具有相似或相同特征的图像,并对这些图像进行正确标记的过程。
目前场景分类方法主要包括基于图像底层特征的方法,以及通过构建中间语义层的方法。第一种方法利用图像的底层特征,如颜色、纹理、边缘等,将图像作为一个整体并直接与监督方法结合,划分如室内/外、城市/山区等场景图像,该类方法只能分类小部分场景。第二种方法通过构建中间语义层,能够实现更多场景类别的识别,如引入文本分析中的概率隐含语义分析模型(Probabilistic latent semantic analysis,pLSA),建立图像模型(文献1:A.Bosch and A.Zisserman,“Scene classification using a hybrid generative/discriminative approach”,IEEE Transactions on Pattern Analysis and Machine Intelligence,v.30no.4,pp.712-727,2008);再如基于图像目标或区域建立贝叶斯模型实现图像场景分类(文献2:M.R.Boutell,J.Luo and C.M.Brown,“Scene parsing using region-based generative models”,IEEE Transactions on Multimedia,v.9 no.a,pp.136-146,2007)。另外,Oliva提出使用粗糙度、宽阔度、伸展度等视觉感知属性描述场景的主要内容结构(文献3:A.Oliva and A.Torralba,“Modeling the shape of the scene:a holistic representation of the spatial envelope”,International Journal of Computer Vision,v.42 n.3,pp.145-175,2001),基于以上特征实现图像场景分类。
场景图像具有很强的认知结构,蕴含场景与目标的包含关系,以及目标之间的空间关系特性。文献1证明了加入空间位置信息可以提高分类正确率,但是该空间信息是绝对的位置特征,至今没有通过建模目标之间的空间关系(拓扑关系、方向关系以及度量关系)实现图像场景分类。
发明内容
本发明的目的是公开一种基于目标及其空间关系特性的图像场景分类方法,通过计算图像中目标之间的空间关系直方图,分类其空间关系,建立融合主题之间空间关系特性的概率隐含语义分析模型(Probabilistic latent semantic analysis fusing spatial relationships between topics,SR-pLSA),最后采用支持向量机(Support vector support,SVM)分类图像场景。弥补了现有图像场景分类方法忽略图像中目标间空间关系特性的缺陷,提高了分类正确率。
为了实现所述的目的,本发明的技术解决方案是:
一种基于目标及其空间关系特性的图像场景分类方法,其包括:
步骤S1,目标空间关系直方图计算:用空间关系直方图表征目标间空间关系特性,包括左和右、上和下、远和近以及包含和不包含,并给出计算方法;
步骤S2,空间关系分类:针对样本图像,标注其目标并赋值目标之间空间关系的隶属度,针对测试样本,用模糊K近邻分类器分类目标之间空间关系直方图,计算其空间关系的隶属度值;
步骤S3,SR-pLSA建模:提出融合主题之间空间关系特性的概率隐含语义分析模型SR-pLSA,建立图像语义模型;
步骤S4,SVM分类:以步骤S3建立样本图像的语义模型,作为支持向量机(SVM)的输入,用训练好的SVM完成图像场景的分类。
所述的图像场景分类方法,其所述步骤S1中,目标空间关系直方图计算包括步骤:
步骤S11:分别求取参考对象以及目标对象区域的点集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院电子学研究所,未经中国科学院电子学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110214985.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基因开关组合物及使用方法
- 下一篇:一种负压治疗系统及其集液盒





