[发明专利]一种视觉与语义相似性约束的图像检索方法在审
申请号: | 201310342904.8 | 申请日: | 2013-08-07 |
公开(公告)号: | CN103425768A | 公开(公告)日: | 2013-12-04 |
发明(设计)人: | 毛金莲 | 申请(专利权)人: | 浙江商业职业技术学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 张法高 |
地址: | 310053 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视觉 语义 相似性 约束 图像 检索 方法 | ||
技术领域
本发明涉及非负矩阵分解和基于内容的图像检索,尤其涉及基于非负矩阵分解的图像检索方法。
背景技术
随着数字成像技术的飞速发展,以及各式各样的数码产品的出现,视频图像资源变得异常丰富,图像检索技术也随之成为研究热点。
在已有的图像检索技术中,基于内容的图像检索技术通过从图像提取各式各样的视觉特征,然后采用特殊的算法计算用户提交的待检索图像与图像数据库中各个图片之间的距离,从而依据特征距离的大小,对图像进行排序,返回给用户距离值较小的图像,从而实现对图像数据库中图像的检索。
在众多的基于内容的图像检索算法中,数据降维算法是使用最为广泛的一种方法。其基本思想是原始图像特征空间存在一定的不足,无法有效地将不同类型的图像区分开来,因此希望寻找一个特殊的子空间,在该子空间上不同类型的图像相互分开,而同类型的图像彼此聚拢。具体而言,这里型的方法包括主成分分析(Principal Component Analysis,PCA),线性鉴别分析(Linear Discriminant Analysis,LDA),非负矩阵分解(Nonnegative Matrix Factorization,NMF)和各种流形学习算法,如多维标度分析(Multidimensional Scaling,MDS),局部线性嵌套(Local Linear Embedded,LLE),局部保持投影(Local Preserving Projection,LPP)等。
与其他方法不同,NMF对降维后的数据添加了非负性约束,其目标在于求解两个非负矩阵U和V,使得X≈UV。由于非负性约束的引入,使得NMF能够学习得到具有局部特征的基矩阵U,也获得了一种与人们认知中局部构成整体所一致的基于局部的数据表达方法。因此,该方法被广泛应用到图像检索,人脸识别,数字识别,文本分类等等应用中。
在基于内容的图像检索应用中,Liang等人将NMF的初始化过程扩展为有监督的初始化,然后使用NMF在隐含语义索引中,用来寻找从底层视觉特征到高层语义特征之间的关系。BeAbdallah等人则采用NMF构建图像的隐含表达,用来提高图像的标注准确性。Caicedo等人基于NMF生成多模态图像表达,并在构建NMF目标函数的时候考虑图像语义信息。
然而,在传统的NMF算法框架以及其的各种变种中,研究者多是从如何提高学习得到的特征的局部性,鉴别性和算法模型的凸性方面进行考虑。如何有效地融合图像所具有的低层视觉特征和高层语义特征,这方面的研究相对比较少。本文依据L1图在视觉特征的自动选择特性,构建视觉L1图约束,同时采用传统的KNN图对图像的语义特征构建语义KNN图约束,然后将这两种约束条件引入到传统的NMF算法框架中,从而在同一NMF算法框架中实现同时对底层视觉特征相似性和高层语义相似性的考虑。基于所提出的算法框架,可以有效地学习出保持图像视觉与语义相似性的图像特征基矩阵U。利用该矩阵,可以实现对图像的检索。
发明内容
本发明的目的是克服现有基于非负矩阵分解网络图像检索技术的不足,提供一种保持视觉和语义相似性约束的图像检索方法。
视觉和语义相似性约束的图像检索方法包括如下步骤:
1)采用两种不同的构图算法:L1图和KNN图,分别对图像视觉相似性和语义相似性进行建模:
对视觉相似性建模,以图像集原始视觉特征X=[x1,...,xn]作为L1图的顶点,L1图的边权重矩阵W=[w1,...,wn],其中wi计算如下:,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江商业职业技术学院,未经浙江商业职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310342904.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:压力机平衡缸
- 下一篇:一种机场LED探照灯及其透镜