[发明专利]一种利用基于深度语义排序哈希编码的图像检索方法有效
申请号: | 201510272498.1 | 申请日: | 2015-05-25 |
公开(公告)号: | CN104834748B | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 王亮;谭铁牛;黄永祯;赵放 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 排序 哈希函数 哈希码 哈希 语义 图像检索 构建 随机梯度下降法 标签图像数据 卷积神经网络 模型目标函数 语义相似度 标签图像 标签信息 汉明距离 计算测试 检索图像 深度特征 损失函数 图像测试 学习图像 语义空间 语义信息 三元组 相似度 训练集 代理 保留 优化 联合 学习 | ||
本发明公开了一种利用基于深度语义排序哈希编码的图像检索方法,该方法包括以下步骤:将多标签图像数据集中的部分图像作为训练集,剩下的图像作为图像测试集;使用深度卷积神经网络来构建深度哈希函数;根据图像的多标签信息,构建出图像间的语义相似度排序;以基于三元组的代理排序损失函数做为实际的模型目标函数,并使用随机梯度下降法来优化深度哈希函数;用学习到的深度哈希函数计算图像的哈希码,通过计算测试图像的哈希码与训练集中每一个图像的哈希码之间的汉明距离来检索图像。本发明方法能够保留多标签图像在语义空间中的多级相似度,并且联合学习图像的深度特征表达和哈希编码,从而避免了语义信息的损失。
技术领域
本发明涉及模式识别与机器学习领域,特别涉及图像哈希编码与检索。
背景技术
网络图片的爆炸性增长使得基于内容的图像检索显得日趋重要。哈希编码由于其效率高、易存储等特性,已经被广泛的用于大规模图像检索当中。尽管如此,大部分的基于语义标签的哈希编码方法只解决了二元的相似度量(即相似或者不相似)问题,但是对于多标签图像中的多级语义相似度量去不能够很好的处理。此外,大部分的哈希编码方法的流程一般是首先提取手工设计的特征表达,然后在此基础上学习深度哈希函数。这些手工设计的特征更倾向于描述表观而非语义信息,并不适合用来处理涉及复杂语义结构的任务。
发明内容
(一)本发明要解决的技术问题
本发明的目的是提出一种利用基于深度语义排序哈希编码的图像检索的方法。基于深度语义排序的深度哈希函数学习方法来保留多标签图像中的复杂的多级语义结构。其利用深度卷积神经网络构建多层的深度哈希函数,并根据图像间共同标签的数目推导出语义排序列表用于监督深度哈希函数学习。同时,使用一种基于代理排序损失函数的算法来解决学习过程中的多变量非光滑排序度量优化问题。
(二)本发明的技术方案
本发明所提出的一种利用基于深度语义排序哈希编码的图像检索方法包括以下步骤:
步骤S0:将多标签图像数据集中的部分图像作为训练集,剩下的图像作为图像测试集;
步骤S1:使用深度卷积神经网络(CNN)构建深度哈希函数;
步骤S2:根据图像的多标签信息,构建出图像间的语义相似度排序;
步骤S3,以基于三元组的代理排序损失函数做为实际的模型目标函数,并使用随机梯度下降法和反向传播算法来优化深度哈希函数;
步骤S4:用步骤S3学习到的深度哈希函数计算图像的哈希码;
步骤S5,通过计算测试图像的哈希码与训练集中每一个图像的哈希码之间的汉明距离,并根据汉明距离来检索图像。
(三)本发明的有益效果:
本发明方法利用语义排序损失学习深度哈希函数,能够保留多标签图像中的多级语义结构,能够保留图像在语义空间中的多级相似度;并且这种使用排序监督的深度学习模型可以联合学习图像的深度特征表达和哈希编码,具有更强的语义学习能力从而避免了语义信息的损失。
附图说明
图1是本发明利用基于深度语义排序哈希编码的图像检索方法流程图。
图2是深度哈希函数的结构示意图。
图3是一些检索示例。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510272498.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序