[发明专利]一种有监督深度哈希快速图片检索方法及系统有效
申请号: | 201710555687.9 | 申请日: | 2017-07-10 |
公开(公告)号: | CN107423376B | 公开(公告)日: | 2019-12-27 |
发明(设计)人: | 王延峰;周越夫;黄衫衫;张娅 | 申请(专利权)人: | 上海媒智科技有限公司 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06N3/04;G06N3/08 |
代理公司: | 31317 上海恒慧知识产权代理事务所(特殊普通合伙) | 代理人: | 徐红银 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监督 深度 快速 图片 检索 方法 系统 | ||
本发明提出一种有监督深度哈希快速图片检索方法及系统,方法包括:构建用于快速图像检索的深度卷积神经网络H″;将图库中的图片依次输入深度卷积神经网络H″后得到实值特征,经过量化操作后得到哈希码并储存在本地;将每一张查询图片q输入至深度卷积神经网络H″并量化得到哈希码h(q),再计算哈希码h(q)与所有存储在本地的哈希码之间的汉明距离,将汉明距离为小的认作相似度为高,以此进行排序,最终根据检索数量要求返回相应数量的最为相似的图片。本发明基于现有的深度神经网络,利用三元组标签数据进行图片特征表达的学习采用三元组量化损失函数,用于构建有监督深度哈希模型,从而实现既快速又精准的图片检索。
技术领域
本发明涉及计算机视觉和图像处理领域,具体地,涉及一种基于三元组量化损失函数有监督深度哈希快速图片检索方法及系统。
背景技术
随着信息技术的高速发展,海量的数据不断生成,其中图片数据的规模更是以指数增长,极大的数据量使得直接检索相似图像带来极大的时间与空间开销。故而,如何从海量图像中快速检索相似图像已成为亟需攻克的难题。哈希作为能将图片映射为低维二进制代码的方法成为常见的解决方法。近年来深度卷积神经网络得以快速发展,基于此的深度哈希方法在快速图像检索领域已展现出巨大的潜力。特别地,有监督的深度哈希方法受到了广泛的关注。
目前,Liu等人(Liu,H.,Wang,R.,Shan,S.,&Chen,X.(2016).Deep supervisedhashing for fast image retrieval.In Proceedings of the IEEE Conference onComputer Vision and Pattern Recognition(pp.2064-2072)),提出的有监督深度哈希方法是检索精度最高的方法之一。该方法核心思想主要包括:(1)利用了成对标签对深度卷积神经网络进行有监督训练;(2)设计对比损失函数使得相似图片的特征之间距离尽量小,而非相似图片特征之间的距离尽量远;(3)设计量化损失函数,使得网络学习到的实值特征是近似二值化的;(4)通过门槛函数对实值特征进行量化操作,得到哈希码后再做检索。Liu等人的目的是基于深度卷积神经网络学习到表达能力较强且近似离散的描述子,他们认为这样在量化为哈希码的过程中,图片的语义信息将最大程度地得以保留。
然而该方法的缺陷在于,降低量化导致的语义信息丢失并不等价于学习近似二值化的图片特征;相反,这对于网络学习任务来说是极强的限制条件,使得学习到的特征本身只包含了极少的语义信息,换言之,Liu等人设计的量化损失函数导致方法结果仅为次优解。
发明内容
针对现有技术中存在的上述不足,本发明的目的是提出一种基于三元组量化损失函数的有监督深度哈希快速图片检索方法及系统,以降低现有哈希方法的量化损失。
为实现上述目的,本发明是通过以下技术方案实现的:为实现快速图像检索,基于现有的深度神经网络架构,利用三元组标签数据进行图片特征表达的学习。区别于现有深度哈希方法,本发明设计了一种适合于特征量化的三元组量化损失函数,用于构建有监督深度哈希模型。该三元组量化损失函数在提取高表达能力的实值特征的同时,驱使网络在保留特征表达能力的基础上输出更适合于后续量化处理的实值特征,最终得到高表达能力的哈希码,从而实现既快速又精准的图片检索。
根据本发明的一个方面,提供了一种有监督哈希快速图片检索方法,包括:
S1:构建用于快速图像检索的深度卷积神经网络H″;
对于每张图片a,随机分配一张相似图片p与一张非相似图片n,构成一组三元组训练样本(a,p,n);
在已有的深度神经网络模型末端叠加低维哈希层,构成深度卷积神经网络H,深度卷积神经网络H经过三次复制得到三路并行且参数共享的深度卷积神经网络H′;
将所述三元组训练样本(a,p,n)输入到深度卷积神经网络H′开始训练,同时对该训练样本进行缩放与裁剪;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海媒智科技有限公司,未经上海媒智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710555687.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数码打印机
- 下一篇:一种纸品印刷生产系统