[发明专利]基于注意力机制和哈希的图像检索方法、装置及存储介质有效
| 申请号: | 202010558250.2 | 申请日: | 2020-06-18 |
| 公开(公告)号: | CN111723220B | 公开(公告)日: | 2023-03-10 |
| 发明(设计)人: | 龙军;魏翔翔;朱磊 | 申请(专利权)人: | 中南大学 |
| 主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/53;G06F16/58;G06N3/0464;G06N3/084 |
| 代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 龚燕妮 |
| 地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 注意力 机制 图像 检索 方法 装置 存储 介质 | ||
1.一种基于注意力机制和哈希的图像检索方法,其特征在于,包括:
针对原始数据集中每一张图像,基于预先训练好的基于注意力机制的哈希特征提取模型得到每一张图像的离散哈希编码,进而建立与该原始数据集对应的图像特征库;
基于预先训练好的基于注意力机制的哈希特征提取模型得到待检测图像的离散哈希编码;
在图像特征库中查询与待检测图像的离散哈希编码汉明距离最近的数据,该数据在原始数据集中对应的图像即为检索结果;
其中,所述基于注意力机制的哈希特征提取模型为基于带有标签的数据集对注意力哈希网络模型训练得到,该注意力哈希网络模型包含依次连接的五个卷积-池化层、注意力模块、两个全连接层、哈希层;
所述基于注意力机制的哈希特征提取模型通过如下方法训练得到:
构建训练集:从已设置标签的原始数据集中选取Z幅带标签图像作为训练集其中样本xi表示第i幅图像;
构建注意力哈希网络模型:该注意力哈希网络模型包含依次连接的五个卷积-池化层、注意力模块、两个全连接层、哈希层;
训练注意力哈希网络模型:
从训练集中挑选出用于训练的三元组图像对样本集合;
定义目标损失函数为:
其中,xa为锚样本,xp为正例样本,xn为负例样本,N为三元组图像对样本数量,α和β均为超参数,fi∈(-1,1)k代表图像xi的连续哈希编码,D(fi,fj)表示fi与fj的汉明距离,其中k为哈希编码的位数;
基于三元组图像对样本集合和目标损失函数,训练注意力哈希网络模型,得到基于注意力机制的哈希特征提取模型;
所述哈希层的神经元数等于目标哈希编码的位数k,其激活函数为:
其中,ρ为大于1的超参数。
2.根据权利要求1所述的基于注意力机制和哈希的图像检索方法,其特征在于,所述注意力模块为CBAM方法中的通道和空间注意力模块。
3.根据权利要求2所述的基于注意力机制和哈希的图像检索方法,其特征在于,所述通道和空间注意力模块的处理过程表示如下:
其中,表示数组元素对应相乘;F表示输入注意力模块的中间层特征图;一维通道注意力图Mc(F)通过如下过程得到:
通道注意力模块将输入的中间层特征图F分别经过最大池化和平均池化处理后,再将所得结果输入共享多层感知机,然后将得到的输出对应元素相加,最后经过sigmoid函数激活处理,得到最终的Mc(F);
二维空间注意力图Ms(F1)通过如下过程得到:
空间注意力模块将输入的中间特征F1做基于channel的最大池化和平均池化,然后将所得两个结果进行拼接,再经过卷积操作进行降维,最后经过sigmoid函数激活处理,得到最终的Ms(F1);
最后基于F1和Ms(Fl)得到的具有注意力能力的特征F2。
4.根据权利要求1所述的基于注意力机制和哈希的图像检索方法,其特征在于,所述训练注意力哈希网络模型过程中,采用小批量梯度下降法作为优化器,设置初始学习率为0.002,哈希层学习率是其他层学习率的10倍,α=β=0.3k,k为哈希编码的位数,训练batchsize为128,训练迭代总次数为1000次,每隔200次各层学习率减小一半,直至网络收敛或者达到迭代总次数停止,即得到最终的基于注意力机制的哈希特征提取模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010558250.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





