[发明专利]一种基于三元组网络的深度哈希图像检索方法在审
申请号: | 202111448102.6 | 申请日: | 2021-11-30 |
公开(公告)号: | CN114168782A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 曹从军;陈星;廖开阳;周建 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/53;G06F16/51;G06F16/55;G06N3/04;G06N3/08 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 刘娜 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 三元 组网 深度 希图 检索 方法 | ||
1.一种基于三元组网络的深度哈希图像检索方法,其特征在于,具体按照如下步骤实施:
步骤1,采用并列的三个Alexnet网络模型为CNN网络模型,并在每个Alexnet网络模型的倒数第二个全连接层fc7层后添加隐藏层,即就是添加哈希层,且三个Alexnet网络模型之间共享权重参数;
步骤2,选用图像数据集CIFAR-10,将其划分为训练集和测试集,以训练集图像作为步骤1构建的CNN网络模型的输入图像,每个输入图像均为一个三元组图像,包括锚点图像、正样本图像和负样本图像,其中正样本图像和锚点图像为同一类别,负样本图像与锚点图像为不同类别;
步骤3,将每个输入图像的锚点图像、正样本图像和负样本图像分别输入至一个Alexnet网络模型中,锚点图像、正样本图像和负样本图像分别在输出fc7层和哈希层产生一个输出fc7层的深度特征和一个代表图像特征的初步哈希码;
步骤4,为CNN网络模型引入一个三元组损失函数,使用步骤3生成的初步哈希码通过最小化三元组损失函数,使得锚点图像、正样本图像在特征空间的距离小于锚点图像和负样本图像在特征空间的距离,完成对CNN网络模型的优化;
步骤5,将测试集图像与查询图像输入到步骤4优化的CNN网络模型中对应输入锚点图像的Alexnet网络模型中,得到对应的哈希编码和fc7层深度特征,其中测试图像和查询图像均为锚点图像,计算查询图像与测试集图像对应的二进制哈希编码的汉明距离,根据设定的阈值,如果汉明距离小于阈值,则认为查询图像与测试集图像相似,在测试集图像中得到m个最相似的候选图像集,然后计算查询图像向量与候选集图像的深度特征向量的欧式距离,按照从小到大排序获得最终的检索结果,在候选图像集中找到n个最相似的图像,即就是查询图像最相似n图像。
2.根据权利要求1所述的一种基于三元组网络的深度哈希图像检索方法,其特征在于,所述图像数据集CIFAR-10共60000张,训练集分10类,每类5000张,测试集分10类,每类1000张。
3.根据权利要求1所述的一种基于三元组网络的深度哈希图像检索方法,其特征在于,所述步骤4中的使得锚点图像、正样本图像在特征空间的距离小于锚点图像和负样本图像在特征空间的距离,即就是:
S(xi,xi+)S(xi,xi-) (2)
等价于
S2(xi,xi+)S2(xi,xi-) (3)
其中,xi为锚点图像,xi+为正样本图像,即与xi同一类别的样本图像,xi-为负样本图像,即与xi不同样类别的样本图像,S(x,x`)表示两张图像x和x`的相似性,即就是S(xi,xi+)为锚点图像和正样本图像的相似性,S(xi,xi-)锚点图像和负样本图像的相似性,根据此将三元组损失函数定义如下:
loss(xi,xi+,xi-)=max{0,g+S2(xi,xi+)-S2(xi,xi-)} (4)
式中,loss(xi,xi+,xi-)代表三元组损失函数,其中,g为度量同类别图像对与不同类别图像对之间距离的阈值参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111448102.6/1.html,转载请声明来源钻瓜专利网。