[发明专利]基于多标签投影在线哈希算法的图像检索方法在审
申请号: | 202211280617.4 | 申请日: | 2022-10-19 |
公开(公告)号: | CN115618039A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 曹媛;贾文哲;桂杰 | 申请(专利权)人: | 中国海洋大学 |
主分类号: | G06F16/58 | 分类号: | G06F16/58;G06V10/74 |
代理公司: | 青岛海昊知识产权事务所有限公司 37201 | 代理人: | 刘艳青 |
地址: | 266100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 标签 投影 在线 算法 图像 检索 方法 | ||
本发明公开了一种基于多标签投影在线哈希算法的图像检索方法。本发明改进的哈希算法中首先建立一个查询池,其中记录了每个中心点的最近邻居;当新的查询到达时,只有相应的潜在邻居的二进制代码被更新。此外,还建立了一个考虑多标签监督信息的相似性矩阵,并引入多标签投影损失来进一步保持多标签数据之间的相似性。实验结果表明,在两个基准数据集上,利用本发明,图像数据的在线查询时间显著减少,且具有高精度。
技术领域
本发明属于图像检索技术领域,具体涉及一种基于多标签投影在线哈希算法的图像检索方法。
背景技术
哈希算法因其时间和存储优势而被广泛研究用于解决大规模近似最近邻搜索问题。近年来,出现了一些在线哈希方法,可以更新哈希函数以适应新的流数据,实现动态检索。然而,现有的在线哈希方法需要在查询到达时用最新的哈希函数更新整个数据库,这导致随着流数据的不断增加,检索效率低下。另一方面,这些方法忽略了实例之间的监督关系,尤其是在多标签的情况下。
随着互联网上可用数据量的增加,近似最近邻搜索在许多应用中取得了广泛的成功,例如计算机视觉和跨模态检索问题。基于哈希的方法由于其在数据存储和计算效率方面的优势而引起了人工神经网络搜索的广泛关注。哈希旨在将高维特征映射到紧凑的二进制代码中,同时保留原始空间和二进制空间之间的相似性。现有的流行哈希方法大多基于批量学习策略,这阻碍了他们适应数据集增长和多样化的能力,因为计算成本可能变得棘手和不可行。因此,在线哈希方法应运而生,它通过从流数据中更新哈希函数来展示良好的性能-复杂性权衡。在线哈希的重点是在连续流数据的基础上不断更新哈希函数和哈希表,且成本较低。
在线哈希一般可分为无监督哈希和监督哈希。无监督的在线哈希大致基于Leng等人提出的“草图”的思想。草图是一个较小的特征矩阵,保留了数据库的主要特征。通过实现矩阵分解,哈希函数可以动态有效地更新。有监督的在线哈希基于标签信息学习哈希函数,可以缩小语义鸿沟。Huang等人提出的在线核哈希算法首次尝试以成对输入的方式更新哈希函数。使用在线被动-主动策略,可以保留有关流数据的重要信息。Cakir利用互信息作为目标函数,并根据它更新哈希表,克服了哈希表频繁更新的问题。Lin研究了现有数据和新数据之间的相关性,提出了基于平衡相似度的离散在线哈希(BSODH)。BSODH设置了两个平衡因子来解决由不对称图引起的“不平衡问题”,并通过离散化的方法对其进行优化,从而大大提高了准确性。Lin等人认为Hadamard矩阵是一种更具鉴别性的码本,通过给Hardamard矩阵的每一列分配一个唯一的标签作为目标,以便具有相同标签的数据将具有近似的哈希码,从而哈希函数被更新。
尽管现有的有监督的在线哈希方法有效地更新哈希函数,但是哈希表更新过于频繁以至于不能获得高的搜索效率。具体来说,由于哈希函数不断更新,当新的查询到达时,整个哈希表需要根据最新的哈希函数进行更新。否则,查询由最新的哈希函数嵌入,但数据库的哈希码是基于以前的哈希函数,这是不对称的,毫无疑问会导致低准确率。然而,随着数据库的不断增加,更新整个哈希表非常耗时,这是在线哈希的核心问题之一。
另一方面,大多数现有的监督散列方法有助于构造码本,并为每个码字分配唯一的标签。这种策略忽略了例子之间的相似关系,尤其是在多标签的情况下。例如,图1给出了四个点的标签信息。大多数现有方法认为如果它们共享至少一个公共标签,则两个数据样本相同(相似度等于1),否则,相似度等于0(图1中不存在边的两点)。显然,第3点和第2点之间的相似度应该高于第4点和第2点之间的相似度。然而,现有的方法认为这两种情况是一样的,这是不合理的。此外,这些方法大多只考虑了一种相似性准则,即相似矩阵或标签,而忽略了不同角度损失函数的构造。
发明内容
本发明的目的是提供一种基于多标签投影在线哈希算法的图像检索方法,以弥补现有技术的不足。
本发明改进的哈希算法中首先建立一个查询池,其中记录了每个中心点的最近邻居;当新的查询到达时,只有相应的潜在邻居的二进制代码被更新。此外,还建立了一个考虑多标签监督信息的相似性矩阵,并引入多标签投影损失来进一步保持多标签数据之间的相似性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国海洋大学,未经中国海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211280617.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种佛司可林芳烃衍生物及其制备方法
- 下一篇:一种多功能测温红外成像设备