[发明专利]基于判别相关分析的跨媒体检索方法有效
申请号: | 201210133488.6 | 申请日: | 2012-04-28 |
公开(公告)号: | CN102663447A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 谭铁牛;王亮;王威 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/64 | 分类号: | G06K9/64;G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 判别 相关 分析 媒体 检索 方法 | ||
1.一种基于判别相关分析的跨媒体检索方法,其特征在于,该方法包括以下步骤:
步骤1,建立包括一一对应的图像和文本对的跨媒体训练数据库并提取该数据库中不同模态样本的特征向量,得到相应的特征数据点集;
步骤2,分别对图像与文本两个模态的特征数据点集进行均值预处理,使得每个模态的特征数据点集的均值为0;
步骤3,将经过均值预处理的特征数据点集进行线性投影变换,并根据得到的投影空间设定一关于线性投影变量的目标函数;
步骤4,使用特征值求解法求解所述目标函数,得到线性投影向量a和b;
步骤5,建立包括一一对应的图像和文本对的跨媒体测试数据库;
步骤6,输入待检索对象,并分别提取待检索对象的特征向量以及跨媒体测试数据库中与待检索对象属于不同模态的对象集的特征数据点集;
步骤7,对步骤6得到的特征向量和特征数据点集分别进行所述均值预处理;
步骤8,使用所述步骤4得到的线性投影向量a和b对经过均值预处理的特征向量和特征数据点集分别进行线性投影变换;
步骤9,计算待检索对象的投影变量与对象集的投影变量之间的欧式距离,并对所有的欧式距离进行升序排序,前n个欧式距离对应的对象数据即是在所述跨媒体测试数据库中检索得到的与待检索图像相关的另一模态的对象。
2.根据权利要求1所述的方法,其特征在于,所述步骤1和6中,分别使用尺度不变特征变换算法和隐狄雷克雷分布算法对图像和文本进行特征提取。
3.根据权利要求1所述的方法,其特征在于,所述步骤3中的线性投影变换表示为:
u=aTx
,
v=bTy其中,x和y分别为图像与文本两个模态特征数据点集对应的变量集合,a和b分别为对应的投影向量,u和v为经过线性投影变换得到的投影变量。
4.根据权利要求3所述的方法,其特征在于,根据得到的投影空间设定目标函数的步骤进一步包括以下步骤:
步骤3.1,计算投影空间中投影变量u和v的协方差cov(u,v);
步骤3.2,计算图像与文本两个模态特征数据点集在投影空间中的类间方差和类内方差σB和σW;
步骤3.3,根据计算得到的协方差cov(u,v)、类间方差σB和类内方差σW设定目标函数。
5.根据权利要求4所述的方法,其特征在于,所述步骤3.1中,投影变量u和v的协方差cov(u,v)表示为:
其中,∑定义为此协方差的特征矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210133488.6/1.html,转载请声明来源钻瓜专利网。