[发明专利]一种基于自编码器的无监督哈希方法有效
申请号: | 201911284130.1 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111078911B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 张博麟;钱江波;陈海明;严迪群;董一鸿 | 申请(专利权)人: | 宁波大学 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/63;G06K9/62;G06V10/762;G06N3/04;G06N3/08 |
代理公司: | 宁波诚源专利事务所有限公司 33102 | 代理人: | 徐雪波;邓青玲 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 编码器 监督 方法 | ||
一种基于自编码器的无监督哈希方法,包括:建立栈式去噪自编码器并使用训练集对其进行训练,栈式去噪自编码器包括依次全连接的M个编码层、哈希层和M个解码层;再使用栈式去噪自编码器中的参数建立与栈式去噪自编码器的结构相同的栈式自编码器并将训练集中的图像分批输入到其中进行训练;移除最终的栈式自编码器中的解码器,将保留的M个编码层及哈希层作为检索网络;将待检索的图像输入到该检索网络中得到哈希层的输出,并对哈希层的输出结果进行量化获得哈希码,计算该待检索图像与数据库中图像的哈希码之间的汉明距离,将数据库中与待检索图像汉明距离最小的图像作为该待检索图像的检索结果。该无监督哈希方法同时具有优越的检索和聚类效果。
技术领域
本发明涉及一种基于自编码器的无监督哈希方法。
背景技术
哈希是一种利用映射函数将高维特征向量转换为二进制码的方法,在快速检索数据方面取得了显著的成功。近年来,卷积神经网络(CNN)的快速发展推动了近似最近邻检索的发展。特别是,与有监督哈希方法相比,由于无监督散列方法不需要标记的训练数据,所以它已经得到越来越多的关注。受限玻尔兹曼机首先被用来在无监督哈希方法中编码哈希码。然而,由于过于复杂和需要预训练使得RBM基本上难以实施。近年来,随着深层神经网络的发展,尤其是生成对抗网络的发展,许多研究在哈希学习中取得了显著的成绩。
然而,这些方法中的大多数只能将哈希学习用于单一的数据检索任务,有申请号为CN201410305838.1(授权公告号为CN104021234B)的中国发明专利公开了一种基于自适应位分配哈希算法的大规模图像库检索方法,包括:从待检索图像库中选取部分图像作为训练集,提取训练集的GIST特征;利用PCA对训练集的特征数据进行投影,再对训练数据计算每一维的离散度;根据不同维的离散度,自适应地分配不同的位数来编码数据;根据每一维的编码长度和阈值编码每一维,得子编码,拼接成对数据的完整编码;对查询图像和待检索图像库中特征数据的处理与训练过程对应,分别计算待检索图像和查询图像特征的哈希编码;计算两者之间的汉明距离,由此快速检索相似图像。该发明具有很好的普适性,能很好地保持原始特征数据的近邻结构,利用哈希方法对数据进行编码,既减少了数据的存储空间又提高了查询的检索效率。但由于该检索方法中是自适应地分配不同的位数来编码数据,因此该方法并不是无监督学习方法,编码结果受影响较大,因此需要进一步改进。
发明内容
本发明所要解决的技术问题是针对现有技术的现状,提供一种同时具有良好的检索效果和聚类效果的基于自编码器的无监督哈希方法。
本发明解决上述技术问题所采用的技术方案为:一种基于自编码器的无监督哈希方法,用于在数据库存储的图像中检索出与待检索图像最相似的图像,其特征在于:包括以下步骤:
步骤1、在数据库存储的图像中选取部分图像组成训练集;
步骤2、建立栈式去噪自编码器,并初始化栈式去噪自编码器中的参数;其中建立的栈式去噪自编码器包括依次全连接的M个编码层、带有n个神经元的哈希层和M个解码层;M个编码层和哈希层共同组成编码器,M个解码层组成解码器;M为通过实验确定的最优正整数,n为预设的正整数;
步骤3、将训练集中的所有图像依次输入到步骤2中建立的栈式去噪自编码器中进行预训练,得到预训练之后的栈式去噪自编码器;
步骤4、建立与步骤2结构相同的栈式自编码器,将步骤3中预训练之后得到的栈式去噪自编码器中的参数作为栈式自编码器中的初始参数;
步骤5、将训练集中的所有图像分批输入到栈式自编码器中进行训练,最终得到训练完成的栈式自编码器;具体包括以下步骤:
步骤5-1、将第一批次的所有图像依次经过M个编码层和哈希层后得到哈希层的输出数据计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911284130.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:空间推进剂自主补加流程的测试系统和方法
- 下一篇:配电柜