[发明专利]基于类标传递的半监督跨模态哈希检索方法有效
申请号: | 201811645529.3 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109857892B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 王泉;王笛;田玉敏;尚斌;赵辉;万波;杨鹏飞 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/51;G06V10/774 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 传递 监督 跨模态哈希 检索 方法 | ||
1.一种基于类标传递的半监督跨模态哈希检索方法,包括如下:
(1)获取测试数据和训练数据及其各自对应的特征矩阵:
从图片数据库中获取图片和文本的多模数据集,将数据集中的10%的数据作为测试数据,剩下的数据作为训练数据;
测试数据包括测试图片集T1和测试文本集T2;
训练数据包括训练图片集X1和训练文本集X2,将X1中的5%的数据分为监督训练图片集剩下的分为无监督训练图片集将X2中的5%的数据分为监督训练文本集剩下的分为无监督训练文本集监督训练图片集和监督训练文本集拥有共同的类标矩阵Yc;
(2)通过类标传递获取无监督训练数据图片集的类标矩阵和无监督训练文本集的类标矩阵
(3)根据上述参数构造监督哈希的目标函数G:
其中,Bc表示监督训练数据的哈希码矩阵,表示无监督训练图片集的哈希码矩阵,无监督训练文本集的哈希码矩阵,U1表示图片类标矩阵与图片哈希码矩阵之间的投影矩阵,U2表示文本类标矩阵与文本哈希码矩阵之间的投影矩阵,P1表示图片哈希码矩阵与图片特征矩阵之间的投影矩阵,P2表示文本哈希码矩阵与文本特征矩阵之间的投影矩阵,表示矩阵的Frobenius范数,R(·)表示正则化项,λ表示类标-哈希码误差项参数,μ表示哈希码-特征误差项参数,γ表示正则化项参数;
(4)迭代求解目标函数,得到更新后的图片哈希码矩阵和文本哈希码矩阵以及两个投影矩阵P1,P2;
(5)求得测试图片集T1和测试文本集T2的哈希码;
(6)计算测试数据哈希码与训练数据哈希码之间的汉明距离,再将其从小到大进行排序,前s个对应的训练数据即为查询结果,s≥1。
2.根据权利要求1所述的方法,其特征在于,所述步骤(2),其实现如下:
2a)设类标传递包括模态间类标传递和模态内部类标传递,其传递方程分别表示如下:
其中,f1(Z)为模态间类标传递方程,yi表示另一个模态监督训练数据的类标,Xi表示另外一个模态监督训练数据的特征,n表示另外一个模态监督训练数据的个数,T表示转置,Z表示待预测类标的数据特征向量,W和V分别为两个模态数据的投影矩阵,S=WTV;
f2(Z)为模态内部类标传递方程,yj表示同一模态监督训练数据的类标,Zj表示同一模态监督训练数据的特征,αj表示第j个权重参数,K(Zj,Z)为核函数,m表示同一模态监督训练数据的个数;
2b)将模态间类标传递方程和模态内部类标传递方程相结合得到最终的类标传递方程为:
f(Z)=f1(Z)+f2(Z);
2c)根据类标传递方程,得到类标传递的目标函数J:
其中,γ表示类标误差项的参数,m表示监督训练数据的个数,yj表示监督训练数据的类标,Zj表示监督训练数据的特征向量,f(Zj)表示将Zj带入到2b)中的类标传递方程,λ表示成对数据误差项的参数,l表示成对数据的数量,Xk,Yk分别表示两个模态成对数据的特征向量,||·||∑表示迹范数;
2d)利用梯度下降法求解2c)中的目标函数,得到矩阵S和权重参数[α1,...,αj,...,αm];
2e)分别通过2a)-2d)得到两个模态的类标传递方程fI(Z)和fT(Z),通过下式得到无监督训练图片集的类标矩阵和无监督训练文本集的类标矩阵
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811645529.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种查询方法及装置
- 下一篇:图片检索方法、装置、计算机设备及存储介质