[发明专利]一种基于深度学习的图像检索方法和装置有效

专利信息
申请号: 201810597022.9 申请日: 2018-06-11
公开(公告)号: CN110110120B 公开(公告)日: 2021-05-25
发明(设计)人: 曾凡锋;胡胜达;王宝成 申请(专利权)人: 北方工业大学
主分类号: G06F16/583 分类号: G06F16/583
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 邱晓锋
地址: 100144 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 图像 检索 方法 装置
【权利要求书】:

1.一种基于深度学习的图像检索方法,其特征在于,包括以下步骤:

1)搭建深度神经网络,用于图像二进制哈希编码提取;

2)将训练集图像分批输入深度神经网络,对深度神经网络的模型进行训练,并保存训练好的深度神经网络模型;

3)载入深度神经网络模型,将训练集的所有图像输入深度神经网络中,获取具有语义信息的二进制哈希编码,同时采用传统的二进制哈希编码方法获取具有视觉信息的二进制哈希编码,利用具有语义信息的二进制哈希编码和具有视觉信息的二进制哈希编码建立本地特征库;

4)将待检索图像输入深度神经网络,获取相应的具有语义信息的二进制哈希编码,并采用传统的二进制哈希编码方法获取该待检索图像的具有视觉信息的二进制哈希编码,将获取的待检索图像的二进制哈希编码与本地特征库进行比对,通过计算相似度获得检索结果;

步骤1)所述深度神经网络的每一层池化层都有平均池化层和最大池化层,并且随着网络深度的加深,每一层池化层的网络输出层数增多,同一层池化层输出的特征图尺寸相同;在特定的网络层将池化层所有输出的特征图串联起来,并再次经过若干个卷积层进行卷积操作,实现所有特征图的特征融合效果;在深度神经网络的输出部分,采用一个全局平均池化层将深度神经网络的输出转化为向量,最后经过若干个全连接层,将深度神经网络的输出降到指定的二进制哈希编码长度;

步骤2)采用对比损失函数进行深度神经网络的训练,所述对比损失函数采用以下步骤计算:

a)对于给定的任意批次图像I={I0,I1,...IN-1},其标签为Y={y0,y1...yN-1},N为一个批次图像的大小,取任意图像对Ii、Ij,i,j∈[0,N],有对比损失函数损失值Lpair(Ii,Ij):

其中,δ(Ii,Ij)表示图像对是否相似,d(Ii,Ij)表示图像对之间的距离,margin为边缘系数;

δ(Ii,Ij)和d(Ii,Ij)的定义分别为:

其中,yi和yj分别为第i,j张图像的标签,y'i,k和y'j,k分别神经网络第i、j张图像在第k个节点的输出值,m神经网络输出节点的个数,数值上与提取的二进制哈希编码长度相同;

b)对于一个批次内所有图像对存在总的损失值L:

结合Lpair(Ii,Ij)定义,L改写为:

2.如权利要求1所述的方法,其特征在于,步骤1)所述深度神经网络的数据集划分方法为:如果在实际的应用场景中并没有大量的可用训练图像,则另取与本应用场景相近的图像数据集,将其作为训练集,否则将现有数据集划分为训练集和测试集,每张图像都有各自的标签,标签根据实际的需求设置,每张图像的标签能够不唯一。

3.如权利要求1所述的方法,其特征在于,步骤3)将神经网络获得的具有语义信息的二进制哈希编码与采用多种传统的二进制哈希编码方法得到的具有视觉信息的二进制哈希编码相结合作为图像的特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学,未经北方工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810597022.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top