[发明专利]基于t分布哈希的图像检索方法及系统有效

专利信息
申请号: 201711350971.9 申请日: 2017-12-15
公开(公告)号: CN107944045B 公开(公告)日: 2019-02-05
发明(设计)人: 王建民;龙明盛;黄超;刘斌 申请(专利权)人: 清华大学
主分类号: G06F16/53 分类号: G06F16/53;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 王莹;李相雨
地址: 100084 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 分布 图像 检索 方法 系统
【说明书】:

发明提供一种基于t分布哈希的图像检索方法及系统,在通过构建的深度卷积网络对图片生成低维图像表征时,设计合理的损失函数,将汉明空间中相似图片对应的数据点充分地聚拢,使得检索时可以在更小的汉明距离基准下找到更多的相似数据点;另外,由于采用了汉明距离作为排序基准,在模型训练和图像数据库初始化完成后,对于给定的查询图像检索速度非常快。

技术领域

本发明涉及图片检索技术领域,更具体地,涉及一种基于t分布哈希的图像检索方法及系统。

背景技术

目前,在互联网时代,随着互联网上多媒体资源的不断增加,如何从大规模数据中快速、有效的查找到相关的数据,无论是在时间上还是空间上都是一个极大的考验。随着互联网的飞速发展,大容量、高维度的图像大数据在搜索引擎和社会网络中越来越普遍,也吸引了越来越多的关注,如何快速有效的进行图像检索分析是一个亟需解决的问题。针对这一问题,一个非常常用且有效的解决方法是哈希,即将高维数据转换为紧凑的二进制码,并为相似的数据生成相似的二进制码。本发明重点关注数据相关的哈希方法,经证明,该类方法比数据不相关的哈希方法(如局部敏感哈希)更有效。

在哈希算法的研究领域下,有两类重要的研究问题,一者是近邻查询,一者是等距查询。近邻查询的目标是在数据集中找出与给定样本最接近的数据点,等距查询的目标是给定误差值之后,找出所有数据集中与给定样本误差不大于给定误差值的数据点。本发明重点关注等距查询问题。

过去的哈希方法已经达到了不错的检索效果,但是,这些哈希方法一方面都不能保证在小汉明距离内,查找得到的数据点足够的多,换句话说,在低维空间中,待检索数据周围的点太过于稀疏,需要更大的距离限制才能保证查询到足够多的数据点;另一方面,这些方法通常查询过慢。

发明内容

本发明提供一种克服上述问题或者至少部分地解决上述问题的一种基于t分布哈希的图像检索方法及系统。

根据本发明的一个方面,提供一种图像检索方法,包括:

将待查询图片输入预先训练后的深度卷积网络,生成所述待查询图片的低维图像表征;

对所述低维图像表征生成对应的哈希编码,得到待查询图片的哈希编码;

计算待查询图片的哈希编码与数据库中每一张模板图片的哈希编码之间的汉明距离;

将与所述待查询图片的哈希编码的汉明距离小于等于预设距离的模板图片确定为与所述待查询图片匹配的模板图片。

在上述技术方案的基础上,本发明还可以作如下改进。

进一步的,所述深度卷积网络包括由五层卷积层和两层全连接层组成的子网络以及一个全连接量化层;

所述将待查询图片输入预先训练后的深度卷积网络,生成所述待查询图片的低维图像表征具体包括:

将所述待查询图片输入预先训练后的深度卷积网络,通过所述子网络生成所述待查询图片的高维图像表征;

将所述待查询图片的高维图像表征输入所述全连接量化层,生成待查询图片的低维图像表征。

进一步的,所述对所述低维图像表征生成对应的哈希编码,得到待查询图片的哈希编码具体包括:

根据生成的所述待查询图片的低维图像表征,采用双曲正切函数激活并二值化生成哈希编码,得到待查询图片的哈希编码。

进一步的,通过如下方式预先训练深度卷积网络:

将训练集中的所有图片分为多批,对其中每一批图片进行轮询训练,并采用反向传播算法对所述深度卷积网络进行优化。

进一步的,所述将训练集中的所有图片分为多批,对其中每一批图片进行轮询训练,并采用反向传播算法对所述深度卷积网络进行优化具体包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711350971.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top