[发明专利]一种基于自编码器的无监督哈希方法有效

专利信息
申请号: 201911284130.1 申请日: 2019-12-13
公开(公告)号: CN111078911B 公开(公告)日: 2022-03-22
发明(设计)人: 张博麟;钱江波;陈海明;严迪群;董一鸿 申请(专利权)人: 宁波大学
主分类号: G06F16/51 分类号: G06F16/51;G06F16/63;G06K9/62;G06V10/762;G06N3/04;G06N3/08
代理公司: 宁波诚源专利事务所有限公司 33102 代理人: 徐雪波;邓青玲
地址: 315211 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 编码器 监督 方法
【说明书】:

一种基于自编码器的无监督哈希方法,包括:建立栈式去噪自编码器并使用训练集对其进行训练,栈式去噪自编码器包括依次全连接的M个编码层、哈希层和M个解码层;再使用栈式去噪自编码器中的参数建立与栈式去噪自编码器的结构相同的栈式自编码器并将训练集中的图像分批输入到其中进行训练;移除最终的栈式自编码器中的解码器,将保留的M个编码层及哈希层作为检索网络;将待检索的图像输入到该检索网络中得到哈希层的输出,并对哈希层的输出结果进行量化获得哈希码,计算该待检索图像与数据库中图像的哈希码之间的汉明距离,将数据库中与待检索图像汉明距离最小的图像作为该待检索图像的检索结果。该无监督哈希方法同时具有优越的检索和聚类效果。

技术领域

本发明涉及一种基于自编码器的无监督哈希方法。

背景技术

哈希是一种利用映射函数将高维特征向量转换为二进制码的方法,在快速检索数据方面取得了显著的成功。近年来,卷积神经网络(CNN)的快速发展推动了近似最近邻检索的发展。特别是,与有监督哈希方法相比,由于无监督散列方法不需要标记的训练数据,所以它已经得到越来越多的关注。受限玻尔兹曼机首先被用来在无监督哈希方法中编码哈希码。然而,由于过于复杂和需要预训练使得RBM基本上难以实施。近年来,随着深层神经网络的发展,尤其是生成对抗网络的发展,许多研究在哈希学习中取得了显著的成绩。

然而,这些方法中的大多数只能将哈希学习用于单一的数据检索任务,有申请号为CN201410305838.1(授权公告号为CN104021234B)的中国发明专利公开了一种基于自适应位分配哈希算法的大规模图像库检索方法,包括:从待检索图像库中选取部分图像作为训练集,提取训练集的GIST特征;利用PCA对训练集的特征数据进行投影,再对训练数据计算每一维的离散度;根据不同维的离散度,自适应地分配不同的位数来编码数据;根据每一维的编码长度和阈值编码每一维,得子编码,拼接成对数据的完整编码;对查询图像和待检索图像库中特征数据的处理与训练过程对应,分别计算待检索图像和查询图像特征的哈希编码;计算两者之间的汉明距离,由此快速检索相似图像。该发明具有很好的普适性,能很好地保持原始特征数据的近邻结构,利用哈希方法对数据进行编码,既减少了数据的存储空间又提高了查询的检索效率。但由于该检索方法中是自适应地分配不同的位数来编码数据,因此该方法并不是无监督学习方法,编码结果受影响较大,因此需要进一步改进。

发明内容

本发明所要解决的技术问题是针对现有技术的现状,提供一种同时具有良好的检索效果和聚类效果的基于自编码器的无监督哈希方法。

本发明解决上述技术问题所采用的技术方案为:一种基于自编码器的无监督哈希方法,用于在数据库存储的图像中检索出与待检索图像最相似的图像,其特征在于:包括以下步骤:

步骤1、在数据库存储的图像中选取部分图像组成训练集;

步骤2、建立栈式去噪自编码器,并初始化栈式去噪自编码器中的参数;其中建立的栈式去噪自编码器包括依次全连接的M个编码层、带有n个神经元的哈希层和M个解码层;M个编码层和哈希层共同组成编码器,M个解码层组成解码器;M为通过实验确定的最优正整数,n为预设的正整数;

步骤3、将训练集中的所有图像依次输入到步骤2中建立的栈式去噪自编码器中进行预训练,得到预训练之后的栈式去噪自编码器;

步骤4、建立与步骤2结构相同的栈式自编码器,将步骤3中预训练之后得到的栈式去噪自编码器中的参数作为栈式自编码器中的初始参数;

步骤5、将训练集中的所有图像分批输入到栈式自编码器中进行训练,最终得到训练完成的栈式自编码器;具体包括以下步骤:

步骤5-1、将第一批次的所有图像依次经过M个编码层和哈希层后得到哈希层的输出数据计算公式为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911284130.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top