[发明专利]基于隐空间学习和双向排序学习的跨媒体排序方法有效

专利信息
申请号: 201310410565.2 申请日: 2013-09-10
公开(公告)号: CN103559191A 公开(公告)日: 2014-02-05
发明(设计)人: 吴飞;汤斯亮;卢鑫炎;邵健;庄越挺 申请(专利权)人: 浙江大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 张法高
地址: 310027 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 空间 学习 双向 排序 媒体 方法
【权利要求书】:

1.一种基于隐空间学习和双向排序学习的跨媒体排序方法,其特征在于包括如下步骤:

1)将文本检索图像的排序样本和图像检索文本的排序样本统一构建为训练样本;

2)对构建得到的训练样本进行基于隐空间学习和双向排序学习的跨媒体排序学习,得到多媒体语义空间以及跨媒体排序模型;

3)使用学习得到的跨媒体排序模型进行跨媒体排序:用户提交查询例子后,首先找到该查询例子在多媒体语义空间的坐标,然后根据跨媒体对象在多媒体语义空间内的坐标,计算查询例子与其他所有跨媒体对象在多媒体语义空间的相似度,并根据该相似度,对所有跨媒体对象进行排序。

2.根据权利要求1所述的一种基于隐空间学习和双向排序学习的跨媒体排序方法,其特征在于,所述的步骤1)包括:

1)对训练样本里的所有文本文档利用词袋模型进行特征表达,并利用TF-IDF方法对每个单词进行加权,文本最终被表示为t∈Rm,其中m为文本空间的维数;

2)对训练样本里的所有图像文档提取SIFT局部特征点,并对这些局部特征点进行K-Means聚类,用聚类中心构建码本以及视觉单词。然后对每张图片,通过欧氏距离最近邻计算该图片的每个局部特征点应该属于码本里的哪一个视觉单词,最后和对文本文档的处理一样,利用词袋模型和TF-IDF方法进行特征表达,图像最终被表示为p∈Rn,其中n为图像空间的维数;

3)对文本检索图像方向而言,对每一个查询文本,构建一个图像的排序列表,其中列表中的图像被标记为查询语义相关或者语义不相关,因此每个文本检索图像的训练样本被表示为三元组其中N为训练样本个数,ti为检索文本,pi为图像集合,是图像集合上的排序,y表示整个排序空间;

4)对图像检索文本方向而言,对每一个查询图像,构建一个文本文档的排序列表,其中列表中的文本文档被标记为查询语义相关或者语义不相关,每个图像检索文本的训练样本被表示为三元组M为训练样本个数,pj为检索图像,tj是文本文档集合,是文本文档集合上的排序;

5)将两个方向上的查询列表合并起来得到统一的训练样本。

3.根据权利要求1所述的一种基于隐空间学习和双向排序学习的跨媒体排序方法,其特征在于,所述的步骤2)包括:

1)使用结构支持向量机构建一个优化问题,其目标函数是使得映射函数在结构风险和经验风险之间取得折中:

minU,V,ξ1,ξ2λ2||U||F2+λ2||V||F2+1NΣi=1Nξ1,i+1MΣj=N+1N+Mξ2,js.t.i{1,...,N},yy:δF(ti,pi,y)Δ(yi*,y)-ξ1,ij{N+1,...,N+M},yy:δF(pj,tj,y)Δ(yj*,y)-ξ2,j.---(1)]]>

其中,是将文本映射到隐空间的映射矩阵,是将图像映射到隐空间的映射矩阵,k是隐空间的维数,ξ1,i和ξ2,j是松弛变量。定义的函数F如下:

F(t,p,y)=Σip+Σjp-yij(Ut)TV(pi-pj)|p+|·|p-|---(2)]]>

δF(ti,pi,y)=F(ti,pi,yi*)-F(ti,pi,y)---(3)]]>

F(p,t,y)=Σit+Σjt-yij(Vp)TU(ti-tj)|t+|·|t-|---(4)]]>

δF(pj,tj,y)=F(pj,tj,yj*)-F(pj,tj,y)---(5)]]>

其中,p+和p-分别表示与查询文本t相关的图像集合和与查询文本t不相关的图像集合,t+和t-分别表示与查询图像p相关的文本集合,与查询图像p不相关的文本集合。yij的值根据排序y来决定:如果文档i比文档j的排序靠前,则yij=1,否则yij=-1。此外,定义损失函数为Δ(y*,y)=1-MAP(y*,y),MAP是Mean Average Precision,一种信息检索里常用的性能测量标准,MAP值越大,排序性能越好,损失函数的值就越小;

2)输入双向的排序样本作为优化问题的训练样本,求解得到参数U和V。

4.根据权利要求1所述的一种基于隐空间学习和双向排序学习的跨媒体排序方法,其特征在于,所述的步骤3)包括:

1)对输入为文本查询样本t的情况下,对所有图像pi根据以下公式计算其与查询样本的相似度:f(t,pi)=(Ut)TVpi,然后按相似度从大到小对图像进行排序;

2)对输入为图像查询样本p的情况下,对所有文本文档ti根据以下公式计算其与查询样本的相似度:f(ti,p)=(Uti)TVp,然后按相似度从大到小对文本文档进行排序。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310410565.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top