[发明专利]一种基于层次结构的跨模态可变长度哈希检索方法有效
| 申请号: | 201911141734.0 | 申请日: | 2019-11-20 |
| 公开(公告)号: | CN111078952B | 公开(公告)日: | 2023-07-21 |
| 发明(设计)人: | 祁晓君 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903 |
| 代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红;陈栋梁 |
| 地址: | 400065 重*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 层次 结构 跨模态 可变 长度 检索 方法 | ||
1.一种基于层次结构的跨模态可变长度哈希检索方法,其特征在于,包括以下步骤:
步骤1、对多模态数据集构建近邻图,其中数据集中的图像数据与文本数据一一对应,为了简化表达,下文中我们使用图文对来表示多模态数据集中的一对图文数据;分别提取图像与文本的不同特征,通过结合图像特征和文本特征来构建图文对训练集与图文对数据库之间的相似度矩阵;
步骤2、通过相似度矩阵来选取具有代表性的图文对构建自底向上的图文对层次结构,其中选取的图文对强连接于未被选取的图文对,每一层中选择出的图文对作为下一层的初始图文对,再次进行下一层图文对的选取,直到选出的代表点足够少并且能够代表整体的数据集,此时选择出的顶层图文对分别代表各个不同局部区域的相似图文对;
步骤3、构建顶层代表图文对之间的相似度矩阵,在单模态监督离散哈希检索方法的基础上,假设图像数据和文本数据存在共同的潜在抽象语义空间,在此空间内可以直接进行查询和检索;将图像数据和文本数据的哈希编码分别投影到潜在的抽象语义空间,并根据内积计算出图像和文本数据间的相似度矩阵;
步骤4、将图像数据与文本数据分别投影到各自最优长度的哈希编码空间,通过迭代优化求解出相应的投影矩阵,相似度关联矩阵,以及各模态数据最优长度的紧凑哈希编码;
步骤5、使用相似度传递矩阵自顶向下插值返回到底层完整数据,得到待查询数据的哈希编码与数据库中所有数据哈希编码的相似性排序;
步骤6、根据相似性排序来得出与待查询数据相似的所需数据返回给用户并检测其精确度;
所述步骤1中,对图像和文本成对数据建立近邻图,构建图文对训练集与图文对数据库之间的相似度矩阵,具体包括:
设为图像数据集,为文本数据集,d1和d2分别为图像和文本数据的维度,n为图像和文本数据对的样本个数,R为全体实数集;
对数据库中的图文对建立k近邻图G[0](V[0],W[0]),其中V[0]表示数据库中的所有图文对,表示每对图文之间的相似度矩阵;
所述步骤3中,首先构建顶层代表图文对数据的相似度矩阵,假设多模态数据集存在共同的潜在抽象语义空间V,在此空间中多模态数据可以直接查询和检索,则图像的哈希编码BX和文本的哈希编码BY投影到潜在抽象语义空间的形式分别为:
则在V空间中数据间的相似性表示如下:
记W=W1TW2,则W为图像与文本之间的相似性,具体的目标函数为:
其中PX、PY分别表示图像数据和文本数据的投影矩阵。
2.根据权利要求1所述的一种基于层次结构的跨模态可变长度哈希检索方法,其特征在于,所述步骤2中,构建层次结构的核心是构建图文对之间的强连接图;对于图文对数据库自底向上的层次结构中的第s层,是从第s-1层的图文对中选择出的图文对作为代表图文对,在第s-1层中而不在第s层中,即未被选中的图文对则需强连接于第s层的代表图文对,不同层次之间的图文对使用相似传递矩阵F[n]来相互表示,其中n表示相应的层数;每层的相似度矩阵都可通过底层的相似度矩阵传递,具体表示如下:
W[i]=F[i-1]T…F[1]TF[0]TW[0]F[0]F[1]…F[i-1],i=1,2,...,s。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911141734.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于alpha波的差错抑制脑机接口方法
- 下一篇:一种数控电脑雕刻机





