[发明专利]一种基于改进的深度残差卷积神经网络和深度哈希的高清遥感图像快速检索方法在审
申请号: | 202110073782.1 | 申请日: | 2021-01-20 |
公开(公告)号: | CN112650877A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 卓力;谢斌;郝鑫岩;南云昊;余清华 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/51;G06F16/22;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 深度 卷积 神经网络 遥感 图像 快速 检索 方法 | ||
1.一种基于改进的深度残差卷积神经网络和深度哈希的高清遥感图像快速检索方法,其特征在于:
步骤1:构建数据集
使用的原始数据集为公共遥感图像数据集,对图像进行缩放或裁剪,归一化为224×224大小;
步骤2.1:深度残差卷积神经网络结构的改进
在现有的ResNeXt-50的最后一个池化层后面再连接了2个全连接层,以实现将ResNeXt-50原有的2048维深度特征降维至96维;第1个全连接层包含512个神经元,该全连接层后连接ReLU激活函数进行非线性变换,再添加一个dropout来避免过拟合,其中dropout参数采用默认值p=0.5;进行dropout处理后连接第2个全连接层,其包括有96个神经元,将特征维度降维至96维;
步骤2.2:网络训练
利用ImageNet数据集对ResNeXt-50进行预训练,得到初始的网络模型参数;接下来,将ImageNet预训练的网络模型迁移到遥感图像数据集上,即对ResNeXt-50后面连接的2个全连接层参数进行随机初始化;
损失函数设为Likelihood Loss+Quantization Loss;其中Likelihood Loss(J1)和Quantization Loss(J2)分别表示为:
J1=-s*Θ+Θ'+log(1+e-||Θ||) (1)
J2=η||X-sgn(X)||2 (2)
Loss=mean(J1)+mean(J2) (3)
其中:
s=LYT为1×C的行矩阵,L=[0,xt,…,0]T为1×N维的行矩阵,该矩阵中仅有一个元素xt=10≤t≤N-1,其余组成元素均为0,表示训练集图片对应的类别标签,其中N为图像类别数;
为1×C维的行矩阵,C为训练集图像数目,X=[x1,x2,…,xM]T为最后一个全连接层的输出,M为特征维数;
U为C×M维的矩阵,而U中每行数据将利用索引对应的X进行更新,即最后一个全连接层输出的图像的低维深度特征;
Θ'是将Θ中小于0的元素均置0后得到的矩阵;
Y为C×N维的矩阵,Y中每行数据将利用索引对应的L进行更新,η是用来正则化的超参数,设置为η=0.1;
*表示哈达马乘积,mean(·)表示计算矩阵中所有元素平均值,sgn(·)为哈希函数;
利用随机梯度下降算法方法对参数进行迭代训练40个epochs,得到优化后的网络模型;
步骤2.3:低维深度特征的提取
利用训练得到的改进ResNeXt-50作为骨干网络,将最后一个全连接层的输出提取出来,作为图像的低维深度特征;该特征用矢量X表示,X=[x1,x2,…,xM]T,M表示特征维数;中M=96;
步骤3:特征哈希库的生成与关联
利用DPSH算法中的哈希函数对步骤.3中生成的低维深度特征进行哈希映射,得到二值哈希码;哈希函数表示如下:
其中xi∈X,i=1,2…,M;
经过映射,得到低维深度特征对应的二值哈希码,哈希码的维数与低维深度特征的维数相同;
将每幅图像的物理地址低维深度特征、二值哈希码与一一对应,建立“图像物理地址—低维深度特征—二值哈希码”关联对,并将这些关联存储至数据库系统,构建哈希特征库,作为索引,用于检索;
步骤4:遥感图像的快速检索;
步骤4.1:对待检索的遥感图像大小进行归一化处理,处理后的图像大小为224×224;
步骤4.2:将归一化的遥感图像输入到训练得到的网络模型中,提取图像的低维特征,再利用步骤3生成哈希码;
步骤4.3:将哈希码与构建的特征哈希库的哈希码逐一进行相似性比较,比较时使用汉明距离来衡量两个哈希码之间的相似度,计算公式如下:
其中,X=(x1,x2,…,xM)和Y=(y1,y2,…,yM)分别表示两个哈希码,M为哈希编码长度(为96),d为二者之间的汉明距离;d值越小,则表明两幅图像的相似度越高;
对特征哈希库中的所有记录与待检索图像的哈希码逐一进行相似度比较,并按照d值由小至大进行排序,取出排序靠前的若干条记录中的低维特征;
步骤4.4:将步骤4.3取出的低维深度特征与待检索图像的低维深度特征进行L2距离度量,并按照相似度大小进行重排序,按照重排序结果从数据库中提取出遥感图像返回给用户;
n维空间中两个点x1(x11,x12,…,x1n)与x2(x21,x22,…,x2n)间的L2距离定义如下;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110073782.1/1.html,转载请声明来源钻瓜专利网。