[发明专利]跨媒体稀疏哈希索引方法有效
申请号: | 201310410588.3 | 申请日: | 2013-09-10 |
公开(公告)号: | CN103473307A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 吴飞;张寅;余宙;邵健;庄越挺 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 张法高 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 媒体 稀疏 索引 方法 | ||
1.一种跨媒体稀疏哈希索引方法,其特征在于包括如下步骤:
1)对多个模态数据之间的关联关系利用超图进行统一建模;模态内的相似性使用数据的底层特征的欧氏距离,模态间的关联利用不同模态数据已知的关联关系;
2)将统一超图约束引入多模态字典学习的框架内,使得学习得到的多模态字典能保留模态内的相似性以及模态间的关联关系;
3)将学习得到的字典作为哈希函数,对新的数据利用对应模态的字典进行稀疏编码;
4)将稀疏编码通过哈希策略转化为稀疏编码集,并使用类jaccard距离来计算集合之间的相似度。
2.根据权利要求1所述的一种跨媒体稀疏哈希索引方法,其特征在于所述的步骤2)包括:
给出如下基于最小重建误差的目标函数,以实现多模态字典学习:
其中
此外,是来自不同模态数据对应的重建系数集合,并在目标函数中添加了额外的正则约束项Ω(A),来实现两个目标:1)重建系数尽可能稀疏,以防止目标函数的“过拟合”,也能起到数据压缩的作用,2)重建系数保持了在超图中的不同模态数据之间关联关系,使得学到的字典具有好的鲁棒性;综合如上两个目标,给出如下的正则项Ω(A):
Ω(A)由两项组成,分别对应了之前定义的两个目标:稀疏和超图关联关系保持。
其中Lh为超图拉普拉斯矩阵,具体的定义如下:
其中I是单位矩阵,H是关联矩阵,Dv,De为超图的顶点和超边的度的构建的对角矩阵,W为超边的权重构建的对角矩阵。
3.根据权利要求1所述的一种跨媒体稀疏哈希索引方法,其特征在于所述的步骤4)包括:
假设数据x的用其模态学习得到的字典Dx进行稀疏编码后得到再将稀疏编码通过哈希方法生成稀疏编码集:
其中σ为设定的阈值,SC+(·)和SC_(·)对应两个量化函数,生成稀疏编码ax的系数为正值和负值对应的下标集合;
此外,针对多个稀疏编码集,采用类似于jaccard相似度的度量机制来衡量它们之间的相似性,具体的相似度计算公式如下:
在实现高效地基于稀疏编码集的检索时,有两种可选的方法:
●当K不大时,使用K维的二值向量来表达稀疏编码集,将稀疏编码集合的“交”和“并”的操作就转变为硬件实现的高效AND和OR位运算;
当K较大时,所有稀疏编码集对应K维的二值向量可能无法一次性加载到内存中来进行计算,使用另一种方法:使用min-Hash作为稀疏编码集的哈希函数,然后建立LSH索引,从而支持高效的检索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310410588.3/1.html,转载请声明来源钻瓜专利网。