[发明专利]一种基于高阶深度哈希学习的图像检索方法有效
| 申请号: | 201810919209.6 | 申请日: | 2018-08-14 |
| 公开(公告)号: | CN109241313B | 公开(公告)日: | 2021-11-02 |
| 发明(设计)人: | 张建新;吴悦;张强 | 申请(专利权)人: | 大连大学 |
| 主分类号: | G06F16/53 | 分类号: | G06F16/53;G06F16/51;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 大连八方知识产权代理有限公司 21226 | 代理人: | 卫茂才 |
| 地址: | 116622 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 图像 检索 方法 | ||
1.一种基于高阶深度哈希学习的图像检索方法,其特征在于,该方法包括以下步骤:
步骤S1:构造包含图像数据及标签的图像数据集,并划分为训练集、测试集和检索图像集三部分,训练集用于模型训练,测试集和检索图像集用于模型测试;
步骤S2:高阶深度哈希网络由基础特征子网络、高阶池化子网络、哈希子网络及损失子网络依次衔接构成,其中:
S21:基础特征子网络使用VGG-F网络的1-14层构建;
S22:高阶池化子网络设计为协方差池化层,其将基础特征子网络输出的深度特征转化为样本协方差矩阵,然后基于特征值分解和矩阵幂获得高阶深度特征;
S23:哈希子网络由哈希隐层和激活层构建,哈希隐层将高阶特征线性映射到指定编码位的全连接层,配合激活层将数值变化至[0,1]范围;
S24:损失子网络由全连接层和Softmax交叉熵损失层组成,仅用于指导网络训练;
步骤S3:高阶深度哈希网络模型的端对端训练,包括模型特征前向传播和误差反向传播两个过程;
步骤S4:根据学习到的高阶深度哈希网络,计算测试集和检索图像集的深度高阶哈希码;
步骤S5:计算测试集与检索图像集哈希码之间的汉明距离,将最小汉明距离对应的图像作为检索结果输出,用平均精度均值指标评判该方法整体性能。
2.根据权利要求1所述的基于高阶深度哈希学习的图像检索方法,其特征在于,步骤S3中模型特征前向传播利用训练集作为网络输入,经过基础特征子网络、高阶池化子网络,获得高阶深度特征,该特征由哈希子网络映射为[0,1]范围的可编码特征,具体计算公式如下:
H=WHT[UF(Λ)UT]+σ
其中,H=[h1,h2,...hN],WHT∈R4096×K表示哈希层的权重,K代表哈希码比特位数,σ∈RK代表K维偏置向量,U和Λ分别代表前向过程产生的协方差矩阵通过特征值分解得到的正交阵和对角阵。
3.根据权利要求1所述的基于高阶深度哈希学习的图像检索方法,其特征在于,步骤S3中的误差反向传播利用交叉熵损失函数作为目标函数,衡量哈希码预测值和图像真实标签之间的差别,误差值计算公式如下:
其中,M代表数据集的标签数目,N是图片个数,xi代表第i张图片经过全连接层的输出,yi代表第i张图像的真实标签,代表可编码特征经Softmax操作映射为各标签的预测概率,在反向传播中采用随机梯度下降法,利用链式法则对各参数逐层求偏导,确定反向传播误差,不断更新网络模型的参数,优化高阶深度哈希网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连大学,未经大连大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810919209.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:旋律的填词方法、装置及终端设备
- 下一篇:一种基于深度学习的快速人脸检索方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





