[发明专利]一种深度强相关哈希学习的大规模图像检索方法有效
申请号: | 201911321749.5 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111125411B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 黄青松;单文琦;刘利军;冯旭鹏 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/55;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 相关 学习 大规模 图像 检索 方法 | ||
1.一种深度强相关哈希学习的大规模图像检索方法,其特征在于:所述深度强相关哈希学习的大规模图像检索方法的具体步骤如下:
Step1、从图像数据集中抽取数据构成训练图像数据,其次对图像进行预处理操作,输入图像经过卷积子网络,把图像信息映射到特征空间中,得到一个局部式特征表示;
Step2、再经过全连接层,把上层得到的局部式特征表示映射到样本标记空间中,再进入哈希层进行降维及哈希编码;
Step3、再进入强相关损失层,利用强相关损失函数计算出当前迭代的损失值;最后返回损失值,根据损失值更新网络参数,驱动模型的训练;
Step4、通过深度强相关哈希模型学习到目标区域的特征表示和相应的哈希码;分别输入图像库图像和待检索图像得到一个哈希码特征库和待检索图像的哈希码,再比较待检索图像的哈希码与特征库中的哈希码之间的汉明距离完成检索的部分;
所述步骤Step3的具体步骤如下:
Step3.1、强相关损失层从Step2.2接收一个1×1×N的特征矩阵,N=哈希码位数,通过强相关损失函数计算得到一个1×1×L的特征矩阵,L=类别数,将强相关损失层分为损失层1和损失层2;其中,损失层1为通过强相关损失函数得到1×1×L的特征矩阵,损失层2为利用损失层1得到的特征矩阵计算损失值;
Step3.2、假定,当前样本的真实标签为i,其它标签为j;强相关损失层的输入为哈希层的输出,记为x,x的维度为1×K;进入损失层1,通过设计的强相关损失函数式,其中,m、β为超参数,m的取值为正整数,β∈(0,1),wki,wkj属于权重矩阵W,W的维度为K×L,αi,αj为权重相关系数,zi表示当前样本的真实标签对应的值,zj为其余标签对应的值;得到损失层1的输出矩阵,记为Z,Z的维度为1×L,L=类别数;
Step3.3、由Step3.2得到的输出矩阵进入损失层2,通过交叉熵函数计算损失值,公式如下所示:
zi、zj来自Z;
Step3.4、利用强相关损失层得到的损失值能够进行反向传播,驱动网络的训练。
2.根据权利要求1所述的深度强相关哈希学习的大规模图像检索方法,其特征在于:所述步骤Step1的具体步骤如下:
Step1.1、使用CIFAR-10数据集,其包含60000张尺寸为32x32的彩色图像,为了节省训练时间,将图像尺寸转换成128x128进行训练;
Step1.2、数据共有十个类别,每个类别拥有6000张图像,为了更好地训练模型及评估性能,从每个类别随机抽取1000张图像作为验证集,再随机抽取1000张图像做为检索测试集,剩余的4000张图像作为训练集;
Step1.3、输入图像依次经过五个卷积层,即卷积子网络,把图像信息映射到特征空间中,得到一个局部式特征表示。
3.根据权利要求1所述的深度强相关哈希学习的大规模图像检索方法,其特征在于:所述步骤Step2的具体步骤如下:
Step2.1、再经过全连接层6以及全连接层7,把得到的局部式特征表示映射到样本标记空间中,其中全连接层6的输出特征矩阵为1×1×4096,全连接层7的输出特征矩阵为1×1×4096;
Step2.2、得到的输出特征矩阵再进入哈希层进行降维及哈希编码,哈希层输出N维的图像特征,N为设置的哈希码位数;
Step2.3、通过Step2.2得到一个松弛哈希码特征库,根据下式其中s(x)由sigmoid函数得出,将松弛的哈希码转换成二分哈希码,得到一个二分哈希码特征库。
4.根据权利要求3所述的深度强相关哈希学习的大规模图像检索方法,其特征在于:所述步骤Step4的具体步骤如下:
Step4.1、待检索图像通过深度强相关哈希模型得到相应的松弛哈希码,再将松弛哈希码转换为二分哈希码,使用完整的二分哈希码进行图像检索;
Step4.2、采用汉明距离来衡量待检索图像的二分哈希码与Step2.3得到的特征库中的二分哈希码之间的相似度,再比较待检索图像的哈希码与特征库中的哈希码之间的汉明距离完成检索的部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911321749.5/1.html,转载请声明来源钻瓜专利网。