[发明专利]基于t分布哈希的图像检索方法及系统有效
申请号: | 201711350971.9 | 申请日: | 2017-12-15 |
公开(公告)号: | CN107944045B | 公开(公告)日: | 2019-02-05 |
发明(设计)人: | 王建民;龙明盛;黄超;刘斌 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于t分布哈希的图像检索方法及系统,在通过构建的深度卷积网络对图片生成低维图像表征时,设计合理的损失函数,将汉明空间中相似图片对应的数据点充分地聚拢,使得检索时可以在更小的汉明距离基准下找到更多的相似数据点;另外,由于采用了汉明距离作为排序基准,在模型训练和图像数据库初始化完成后,对于给定的查询图像检索速度非常快。 | ||
搜索关键词: | 基于 分布 图像 检索 方法 系统 | ||
【主权项】:
1.一种图像检索方法,其特征在于,包括:将待查询图片输入预先训练后的深度卷积网络,生成所述待查询图片的低维图像表征;对所述低维图像表征生成对应的哈希编码,得到待查询图片的哈希编码;计算待查询图片的哈希编码与数据库中每一张模板图片的哈希编码之间的汉明距离;将与所述待查询图片的哈希编码的汉明距离小于等于预设距离的模板图片确定为与所述待查询图片匹配的模板图片;其中,通过如下方式预先训练深度卷积网络:将训练集中的所有图片分为多批,对其中每一批图片进行轮询训练,并采用反向传播算法对所述深度卷积网络进行优化;其中,所述将训练集中的所有图片分为多批,对其中每一批图片进行轮询训练,并采用反向传播算法对所述深度卷积网络进行优化具体包括:将每一批图片中的每一张图片均输入深度卷积网络,生成每一张图片的低维图像表征,并采用双曲正切函数进行激活,生成对应的连续编码;根据任意两张图片对应的连续编码,计算任意两张图片组成的图片对之间的交叉熵损失;根据每一张图片对应的连续编码,计算每一张图片在二值化过程中的量化损失;根据任意两张图片组成的图片对之间的交叉熵损失和每一张图片的量化损失,计算所有图片对的平均交叉熵损失L和所有图片的平均量化损失Q;根据所述L和Q,计算出一批图片中所有的图片的最终损失C,并利用计算出来的最终损失C对所述深度卷积网络进行优化,采用优化后的深度卷积网络对下一批的图片进行训练,直到训练集中的图片均训练完毕;其中,采用如下公式计算所有图片对的平均交叉熵损失L:
其中,
为原始编连续编码之间的相似度量函数,N表示一批图片中所有图片的数量,||.||表示向量长度,b表示每一张图片生成的哈希编码的维度,
为双曲正切函数,Sij表示连续编码对应的原始图像之间的相似性,以0和1区分不相似和相似;整理后得到:![]()
S={sij};其中,zi和zj分别表示第i张图片和第j张图片的连续编码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711350971.9/,转载请声明来源钻瓜专利网。
- 上一篇:消息队列大数据去重处理方法
- 下一篇:大规模高维数据快速检索方法及系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序