[发明专利]大规模细粒度图像检索中的属性感知哈希编码学习方法有效
申请号: | 202111223861.2 | 申请日: | 2021-10-21 |
公开(公告)号: | CN113656632B | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 魏秀参 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/51;G06N3/04;G06N3/08 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 陈鹏 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大规模 细粒度 图像 检索 中的 属性 感知 编码 学习方法 | ||
本发明公开了一种大规模细粒度图像检索中的属性感知哈希编码学习方法,包括以下步骤:通过卷积神经网络提取图像中的全局特征与局部特征信息;构建哈希学习模块,将高维度的图像特征信息提取到低维度的哈希空间并构建哈希特征解码器,通过无监督的方式引导哈希学习过程中的属性特征提取方式;增强哈希模块学习得到的每个维度属性的鉴别能力,去除每个维度属性特征之间的冗余相关性,使得每个维度的属性特征都有自己独特且完整的表达含义。本发明通过卷积神经网络与注意力机制提取图像中的局部与全局特征,通过建立属性特征解码器并使特征向量拥有自正交特性,引导哈希学习保留相对完整且重要的整体图像特征信息,可以获得更高的图像检索准确率。
技术领域
本发明属于计算机视觉领域,具体涉及一种大规模细粒度图像检索中的属性感知哈希编码学习方法。
背景技术
细粒度图像检索作为细粒度图像分析的重要组成部分,近年来得到了越来越多的关注。细粒度图像识别是计算机视觉和模式识别领域的基础研究课题,旨在研究对某一传统语义类别下细粒度级别的不同子类类别进行视觉识别任务,如不同子类的狗、不同子类的鸟、不同车型的汽车等……细粒度图像识别被计算机视觉国际权威学者、ICCVHelmholtz奖及Marr奖获得Serge Belongie教授称为“视觉感知嵌入的基石性工作”。由于细粒度图像中的物体对象在类间差异中只有细微的视觉差异,缺又在姿态、规模等类内差异上有较大的变化,因此有较大的检索难度。
哈希学习是通过机器学习的方法,将数据映射成二进制串的形式,能显著减少数据的存储和通信开销,从而有效提高学习系统的效率。哈希学习的目的是学到数据的二进制哈希码表示,使得哈希码尽可能地保留原空间中的近邻关系,即保相似性。具体来说,每个数据点会被一个紧凑的二进制串编码,在原空间中相似的两个点应当被映射到哈希码空间中相似的两个点。哈希方法大致分为两类,即数据无关方法和数据依赖方法。在数据无关的哈希方法中,模型中的哈希函数通常随机生成,且独立于任何训练数据,但检索性能的提高需要用哈希码的长度换取。数据依赖的哈希方法试图从一些训练数据中学习哈希函数,称为学习哈希算法。与数据无关的方法相比,学习哈希算法可以用更短的哈希码实现更高的准确性。因此,在实际应用中学习哈希算法比数据无关方法更流行。随着深度学习的兴起,一些学习哈希方法将深度特征学习集成到哈希框架中,获得了很好的性能。在以往的工作中,针对大规模图像检索,已经提出了许多深度哈希方法。与深度无监督哈希方法相比,深度监督哈希方法能够充分挖掘语义信息,获得更高的检索精度。
虽然现在的深度学习哈希算法已经有了很好的检索效果,但是都仅限于粗粒度的数据检索。在很多情况下,以狗的图片搜索为例,人们不仅仅希望搜索的得到的图片是狗而不是其他动物,还希望这是什么品种的狗,比如是柯基还是萨摩耶。在这样的情况下,目前已有的学习哈希方法的检索准确率非常低。另一方面,现有的学习哈希方法得到的二进制编码没有任何实际意义,这样图片的存储与检索结果将不会具有任何可解释性。因此需要提出一种新的,可以在细粒度检索环境中得到具有高准确率响应结果的有实际含义的学习哈希方法。
发明内容
本发明的目的在于提供一种大规模细粒度图像检索中的属性感知哈希编码学习方法。
实现本发明目的的技术方案为:一种大规模细粒度图像检索中的属性感知哈希编码学习方法,包括以下步骤:
步骤1,通过卷积神经网络提取图像中的全局特征与局部特征信息;
步骤2,构建哈希学习模块,将高维度的图像特征信息提取到低维度的哈希空间并构建哈希特征解码器,通过无监督的方式引导哈希学习过程中的属性特征提取方式;
步骤3,增强步骤2中哈希模块学习得到的每个维度属性的鉴别能力,去除每个维度属性特征之间的冗余相关性。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述大规模细粒度图像检索中的属性感知哈希编码学习方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111223861.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种煤层群的冲击地压井下防治方法
- 下一篇:显示装置及其驱动方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序