[发明专利]跨媒体稀疏哈希索引方法有效

专利信息
申请号: 201310410588.3 申请日: 2013-09-10
公开(公告)号: CN103473307A 公开(公告)日: 2013-12-25
发明(设计)人: 吴飞;张寅;余宙;邵健;庄越挺 申请(专利权)人: 浙江大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 张法高
地址: 310027 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 媒体 稀疏 索引 方法
【权利要求书】:

1.一种跨媒体稀疏哈希索引方法,其特征在于包括如下步骤:

1)对多个模态数据之间的关联关系利用超图进行统一建模;模态内的相似性使用数据的底层特征的欧氏距离,模态间的关联利用不同模态数据已知的关联关系;

2)将统一超图约束引入多模态字典学习的框架内,使得学习得到的多模态字典能保留模态内的相似性以及模态间的关联关系;

3)将学习得到的字典作为哈希函数,对新的数据利用对应模态的字典进行稀疏编码;

4)将稀疏编码通过哈希策略转化为稀疏编码集,并使用类jaccard距离来计算集合之间的相似度。

2.根据权利要求1所述的一种跨媒体稀疏哈希索引方法,其特征在于所述的步骤2)包括:

给出如下基于最小重建误差的目标函数,以实现多模态字典学习:

minA,Dx,Dy||X-DxAx||F2+||Y-DyAy||F2+Ω(A)s.t.||dkx||F21,||dky||F21,k=1,2,...K---(1)]]>

其中X=[x1,x2,...,xNx]Rpx×Nx,Y=[y1,y2,...,yNy]Rpy×Ny]]>是两个模态的数据,px,py为相应模态的数据的维度,Nx,Ny为数据的个数;Dx=[d1x,d1x,...dKx]Rpx×K,Dy=[d1y,d1y,...dky]Rpy×K]]>是数据集X和Y对应的字典;为;K为组成字典的元素的个数,组成Dx和Dy的元素个数相同使得不同模态的数据被映射到统一的字典空间里;是数据集X和Y中每个数据用对应的字典重建的稀疏系数;

此外,是来自不同模态数据对应的重建系数集合,并在目标函数中添加了额外的正则约束项Ω(A),来实现两个目标:1)重建系数尽可能稀疏,以防止目标函数的“过拟合”,也能起到数据压缩的作用,2)重建系数保持了在超图中的不同模态数据之间关联关系,使得学到的字典具有好的鲁棒性;综合如上两个目标,给出如下的正则项Ω(A):

Ω(A)=λ||A||1+α2ΣeEΣ{vi,vj}eω(e)δ(e)||ai-aj||2=λ||A||1+αTr(ALhAT)---(2)]]>

Ω(A)由两项组成,分别对应了之前定义的两个目标:稀疏和超图关联关系保持。

其中Lh为超图拉普拉斯矩阵,具体的定义如下:

Lh=I-Dv-1/2HWDe-1HTDv-1/2---(3).]]>

其中I是单位矩阵,H是关联矩阵,Dv,De为超图的顶点和超边的度的构建的对角矩阵,W为超边的权重构建的对角矩阵。

3.根据权利要求1所述的一种跨媒体稀疏哈希索引方法,其特征在于所述的步骤4)包括:

假设数据x的用其模态学习得到的字典Dx进行稀疏编码后得到再将稀疏编码通过哈希方法生成稀疏编码集:

SC+(ax)={i|i1,2,...,K,ifaix>σ}SC-(ax)={i|i1,2,...,K,ifaix<-σ}---(4)]]>

其中σ为设定的阈值,SC+(·)和SC_(·)对应两个量化函数,生成稀疏编码ax的系数为正值和负值对应的下标集合;

此外,针对多个稀疏编码集,采用类似于jaccard相似度的度量机制来衡量它们之间的相似性,具体的相似度计算公式如下:

Sim(ax,ay)=12(|SC+(ax)SC+(ay)||SC+(ax)SC+(ay)|+|SC-(ax)SC-(ay)||SC-(ax)SC-(ay)|)---(5)]]>

在实现高效地基于稀疏编码集的检索时,有两种可选的方法:

●当K不大时,使用K维的二值向量来表达稀疏编码集,将稀疏编码集合的“交”和“并”的操作就转变为硬件实现的高效AND和OR位运算;

当K较大时,所有稀疏编码集对应K维的二值向量可能无法一次性加载到内存中来进行计算,使用另一种方法:使用min-Hash作为稀疏编码集的哈希函数,然后建立LSH索引,从而支持高效的检索。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310410588.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top