[发明专利]一种利用基于深度语义排序哈希编码的图像检索方法有效
申请号: | 201510272498.1 | 申请日: | 2015-05-25 |
公开(公告)号: | CN104834748B | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 王亮;谭铁牛;黄永祯;赵放 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 排序 哈希函数 哈希码 哈希 语义 图像检索 构建 随机梯度下降法 标签图像数据 卷积神经网络 模型目标函数 语义相似度 标签图像 标签信息 汉明距离 计算测试 检索图像 深度特征 损失函数 图像测试 学习图像 语义空间 语义信息 三元组 相似度 训练集 代理 保留 优化 联合 学习 | ||
1.一种利用基于深度语义排序哈希编码的图像检索方法,其特征在于,该方法包括以下步骤:
步骤S0:将多标签图像数据集中的部分图像作为训练集,剩下的图像作为图像测试集;
步骤S1:使用深度卷积神经网络构建深度哈希函数;
步骤S2:根据图像的多标签信息,构建出图像间的语义相似度排序;
步骤S3:以基于三元组的代理排序损失函数做为实际的模型目标函数,并使用随机梯度下降法和反向传播算法来优化深度哈希函数;
步骤S4:用步骤S3学习到的深度哈希函数计算图像的哈希码;
步骤S5:计算测试图像的哈希码与训练集中每一个图像的哈希码之间的汉明距离,并根据汉明距离来检索图像。
2.根据权利要求1所述的方法,其特征在于,所述深度哈希函数为多层的深度哈希函数,多层的深度哈希函数包含一个七层深度卷积神经网络,以及一个哈希编码层。
3.根据权利要求1所述的方法,其特征在于,所述深度哈希函数为一个深度哈希函数时h(x;w)的定义如下:
h(x;w)=sign(wT[fa(x);fb(x)]) (1)
其中,sign(.)为符号函数,x为数据库样本,w表示哈希编码层的权值,T表示转置,fa(x)和fb(x)分别表示来自于第一个全连接层和第二个全连接层的特征向量。
4.根据权利要求1所述的方法,其特征在于,利用一组所述深度哈希函数h(x;W),获得K比特的哈希码,所述一组深度哈希函数h(x;W)表示如下:
h(x;W)=[h1(x;w1),h2(x;w2),..,hK(x;WK)], (2)
其中,hK(x;wK)为第K个深度哈希函数;wK为第K个深度哈希函数的哈希编码层的权值,W=[w1,w2,...,wK]是一组深度哈希函数的权值,为了保证检索速度,哈希码的比特数K的取值为1≤K≤256。
5.根据权利要求1所述的方法,其特征在于,按照所述语义相似度的等级对数据库样本x进行排序,获得一个关于查询样本q的语义排序列表。
6.根据权利要求1所述的方法,其特征在于,使用三元组的代理排序损失函数作为学习过程中实际要最小化的图像目标函数,用于避免对排序评价标准的直接优化;在一组三元哈希码组上定义所述代理排序损失函数表示如下:
其中h(q)为查询样本q的哈希码,h(xi)和h(xj)为数据库样本xi和xj的哈希码,ri和rj表示数据库样本xi和xj分别与的查询样本q的相似度等级,M是排序列表的长度,[.]+=max(0,.)表示取该值与0相比较大的那个值;δdH(·)表示两个样本对的汉明距离之差,即表示为δdH(h(q),h(xi),h(xi))=dH(h(q),h(xi))-dH(h(q),h(xi));dH(.,.)表示样本对的汉明距离,即为查询样本q和数据库样本x的汉明距离;ρ是间隔参数,用于控制两个查询样本对(q,xi)和(q,xj)的汉明距离间应该满足的最小间隔;ω是自适应权重由下式给出:
其中,Z是定义归一化常量。
7.根据权利要求6所述的方法,其特征在于,给定训练集并令训练集中的所有样本分别做为查询样本q,学习深度哈希函数来优化关于查询样本q的排序;基于代理排序损失函数和深度哈希函数,模型目标函数由带正则项约束的经验损失给出:
其中,W=[w1,w2,..,wK]是一组深度哈希函数的权值,是排序代理损失,h(.;W)是公式(2)中的深度哈希函数,α和β是正则项系数,表示在数据集中的查询样本的每一个比特上求均值,是平衡性惩罚项,用于使哈希码的每一比特在整个训练集上的均值保持在0左右,使得学习过程的收敛更加稳定;是权值衰减项,用于惩罚过大的权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510272498.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序