[发明专利]基于判别相关分析的跨媒体检索方法有效
申请号: | 201210133488.6 | 申请日: | 2012-04-28 |
公开(公告)号: | CN102663447A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 谭铁牛;王亮;王威 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/64 | 分类号: | G06K9/64;G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 判别 相关 分析 媒体 检索 方法 | ||
技术领域
本发明涉及模式识别和机器学习领域,尤其是一种基于判别相关分析的跨媒体检索方法。
背景技术
近年来,大量出现的多媒体数据呈现两个明显的特点:高维度性和多源性,例如同一个语义概念可以由网络上的文字、图片、视频等多种内容来表示。此外,互联网用户还主要通过文本关键字搜索所需要的信息,这主要是因为搜索引擎无法理解不同模态媒体之间的相互关系,从而限制了搜索引擎的发展。特征降维揭示了高维数据在低维空间中的流形结构以及不同模态数据之间的相关性,在信息检索、模式分类,信息可视化等领域发挥了重大的作用。
单模态数据的特征降维方法有很多,主成份分析(Principal Component Analysis)把原始数据投影到具有最大方差的主方向上;线性判别分析(Linear Discriminant Analysis,LDA)是一种有监督降维方法,在充分利用类别信息的条件下找到一个投影子空间,使得不同类别的特征具有最优的判别性;局部线性嵌入(Locally Linear Embedding)是最早的非线性局部保留方法,每个数据点与其最近邻数据点的线性关系在投影空间中得以保留;LE(Laplacian Eigenmaps)在投影空间中保留了局部两个数据点的距离,LPP(Locality Preserving Projection)是其线性近似算法;多层自编码网络(Multilayer Autoencoder Network)是主成份分析方法的非线性扩展。有研究工作指出,虽然非线性方法处理模拟数据性能很好,但是对于现实数据却不一定比传统的主成份分析方法好,而且以上提到的这些方法均不能直接应用于多模态跨媒体检索。
多模态数据的特征降维方法研究并不是很多,典型相关分析(Canonical Correlation Analysis,CCA)是其中最为有名的多变量数据分析方法,它把多模态数据分别线性投影到同一子空间,使得多模态变量具有最大相关性;与典型线性相关不同,PLS(Partial Least Square)在投影空间中使多模态变量具有最大协方差;在多层自编码网络的启发下,多模态深度学习网络被提出来为不同模态数据学习共同的表示。总之,以上方法更多的是以最大化多模态变量的相关性为目标去寻找投影空间,而忽略了最大化多模态数据中不同类别数据的判别性,而判别性在多模态数据检索与分类任务中往往非常重要。
发明内容
现有多模态数据分析方法普遍没有考虑数据的判别性,本发明提供了一种基于判别相关分析(Discriminant Correlation Analysis,DCA)的方法,它融合了典型相关分析和线性判别分析的思想,同时优化多种模态数据的相关性和不同类别数据的判别性。
本发明所提出的一种基于判别相关分析的跨媒体检索方法,其特征在于,该方法包括以下步骤:
步骤1,建立包括一一对应的图像和文本对的跨媒体训练数据库并提取该数据库中不同模态样本的特征向量,得到相应的特征数据点集;
步骤2,分别对图像与文本两个模态的特征数据点集进行均值预处理,使得每个模态的特征数据点集的均值为0;
步骤3,将经过均值预处理的特征数据点集进行线性投影变换,并根据得到的投影空间设定一关于线性投影变量的目标函数;
步骤4,使用特征值求解法求解所述目标函数,得到线性投影向量a和b;
步骤5,建立包括一一对应的图像和文本对的跨媒体测试数据库;
步骤6,输入待检索对象,并分别提取待检索对象的特征向量以及跨媒体测试数据库中与待检索对象属于不同模态的对象集的特征数据点集;
步骤7,对步骤6得到的特征向量和特征数据点集分别进行所述均值预处理;
步骤8,使用所述步骤4得到的线性投影向量a和b对经过均值预处理的特征向量和特征数据点集分别进行线性投影变换;
步骤9,计算待检索对象的投影变量与对象集的投影变量之间的欧式距离,并对所有的欧式距离进行升序排序,前n个欧式距离对应的对象数据即是在所述跨媒体测试数据库中检索得到的与待检索图像相关的另一模态的对象。
本发明方法能够对特征数据进行有效地降维,从而广泛地应用在其他很多多模态工作中,比如多模态生物特征识别。实验证明,本发明方法在跨媒体检索中比典型相关分析,以及典型相关分析与线性判别分析的简单组合性能都要好。
附图说明
图1是本发明方法的实现流程图;
图2是本发明方法在一个模拟数据集上与其他相关方法的对比结果。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210133488.6/2.html,转载请声明来源钻瓜专利网。