[发明专利]基于局部随机敏感自编码器的哈希图像检索方法有效
申请号: | 202210252512.1 | 申请日: | 2022-03-15 |
公开(公告)号: | CN114610940B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 卢肃;田星;吴永贤;陈伟能 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/51;G06N3/0455;G06F18/22;G06N3/06;G06N3/08;G06N20/10;G06V10/74;G06V10/82 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 局部 随机 敏感 编码器 希图 检索 方法 | ||
1.基于局部随机敏感自编码器的哈希图像检索方法,其特征在于,包括以下步骤:
1)对图像数据库中的图像提取GIST特征,作为局部随机敏感自编码器模型的输入数据;
GIST特征提取是将图像划分为小区域块,随后对每个小区域块与不同方向和不同尺度的Gabor滤波器进行滤波,在每个小区域块内取平均值,最后将每个小区域块的平均值级联起来得到GIST特征,GIST特征表示为:
式中,Xn是指图像数据库中第n张图像的GIST特征,局部随机敏感自编码器模型将Xn作为训练样本,x1,x2,x3,…,xD分别是图像每个小区域块与各个Gabor滤波器进行滤波之后的平均值,共有N张图像;
2)建立局部随机敏感自编码器模型,将图像的GIST特征输入模型进行训练,包括以下步骤:
2.1)建立自编码器模型,表示为:
式中,RMSE是指自编码器模型,Xn是指模型的训练样本,即步骤1)中得到的第n张图像的GIST特征,共有N张图像,是指Xn输入自编码器模型之后对应的模型的输出值,自编码器模型通过编码-解码的步骤输出与输入数据维度一致且尽可能相似的输出值,h(·)是模型编码层的输出,f(·)是模型解码层的输出;
2.2)根据局部随机敏感度,建立局部随机敏感自编码器模型;局部随机敏感度能够评估模型对训练样本与其对应的小幅扰动的样本之间差异的敏感性,通过将局部随机敏感度加入到模型中,通过训练,能够使模型学习到更好的特征值,增强模型的鲁棒性;在机器学习任务中,期望未知样本与训练样本的偏差距离在Q以内,否则,这个数据库并不适用于要研究的问题;假设与训练样本Xn偏差在[-Q,Q]范围内的扰动样本集合为SQ(Xn),能够将SQ(Xn)表示为:
SQ(Xn)={X|X=Xn+ΔX}Q
s.t.ΔX∈[-Q,Q]
式中,X是指扰动样本集合中的一个样本,ΔX是指扰动样本与训练样本Xn的偏差范围,Q是指扰动样本与训练样本的偏差距离;
建立的局部随机敏感自编码器模型表示为:
式中,RLGE是指局部随机敏感自编码器,p(Xn)是指Xn在SQ(Xn)中的未知概率密度函数;
局部随机敏感度是所有训练样本输入模型后的输出与其对应的扰动样本输入模型后的输出之间的均方误差的期望值:
式中,是指局部随机敏感度,Xn+ΔX是指与训练样本Xn偏差在[-Q,Q]范围内的扰动样本,E是指数学期望;
将概率为1-η的霍夫丁不等式应用到局部随机敏感自编码器中,得到:
式中,A是指自编码器解码输出值的上界,B是指自编码器解码输出值均方误差的上界,η是霍夫丁不等式的概率,共有N个训练样本,是指不等式的上界;
总的来说,局部随机敏感自编码器包括自编码器以及局部随机敏感度两个部分;对每个训练样本,生成H个在偏差范围[-Q,Q]内均匀分布的扰动样本,与训练样本一同输入局部随机敏感自编码器模型中进行训练;局部随机敏感自编码器能够表示为:
式中,每个训练样本共有H个对应的扰动样本;
2.3)将二值化约束加入到步骤2.2)建立的局部随机敏感自编码器模型中,训练样本输入模型后能够直接获得哈希编码,从而保留更多训练样本的特征信息,生成更高质量的哈希编码;将二值化约束加入到局部随机敏感自编码器模型后,模型的训练就成为了NP-hard的问题,大大增加了模型的训练难度,但通过引入辅助变量及交替优化的方法,将原本的NP-hard问题转化为可求解的问题,从而能够正常训练模型;加入二值化约束及辅助变量后,步骤2.2)中建立的局部随机敏感自编码器模型的目标函数最终表示如下:
s.t.Zn∈{0,1}L,n=1,2,3,...,N
式中,argmin是指求解使得右边求和式取得最小值的参数值,其中待求解的参数值包括辅助变量Zn以及局部随机敏感自编码器模型编码层的输出h(Xn),Zn是训练样本Xn对应的带有二值化约束的辅助变量,其维度与模型编码层的输出h(Xn)的维度一致,L是模型编码层中神经元的数量,μ与λ均是系数,在最小化该公式的过程中,通过逐渐增大μ,模型编码层的输出h(Xn)与辅助变量Zn将越来越相似,即h(Xn)将越来越接近二值化,最终满足模型的二值化约束;
3)使用交替优化方法训练局部随机敏感自编码器模型,得到图像的哈希编码,包括以下步骤:
3.1)使用ITQ算法初始化局部随机敏感自编码器模型中的辅助变量Zn,逐渐增大局部随机敏感自编码器模型目标函数中的系数μ与λ,在这个过程中,不断重复接下来的步骤,交替优化训练局部随机敏感自编码器模型,直到辅助变量不再变化且辅助变量与模型编码层输出相等时,模型训练完毕,停止训练,模型编码层的输出即为图像的哈希编码;
3.2)固定辅助变量Zn,在编码过程中,训练L个支持向量机SVM,L是局部随机敏感自编码器模型编码层神经元的数量,每个支持向量机都作为模型编码层的一个神经元;
3.3)固定辅助变量Zn,在解码过程中,由于在步骤2)建立的局部随机敏感自编码器模型中使用的是线性解码器,此时解码过程能够转换成线性回归问题:
式中,Xn是指模型的训练样本,即步骤1)中得到的第n张图像的GIST特征,共有N张图像,Xn+ΔX是指与训练样本Xn偏差在[-Q,Q]范围内的扰动样本,Q是指扰动样本与训练样本的偏差距离,每个训练样本共有H个对应的扰动样本,ΔX是指扰动样本与训练样本Xn的偏差范围,h(·)是指模型编码层的输出,f(·)是指模型解码层的输出,Zn是训练样本Xn对应的带有二值化约束的辅助变量,μ与λ均是系数,W是模型编码层与解码层间的权值矩阵,b是解码层的偏置值;
上式属于最小平方问题,为便于计算,忽略偏置值b,其解为:
W=YZT(ZZT+λ(h(Y+ΔX)-h(Y))(h(Y+ΔX)-h(Y))T)-1
式中,Y是指所有训练样本Xn组成的矩阵,Z是指所有与训练样本Xn对应的辅助变量Zn组成的矩阵,Y+ΔX是指所有扰动样本组成的矩阵,ΔX是指扰动样本与训练样本Xn的偏差范围[-Q,Q],Q是指扰动样本与训练样本的偏差距离,h(·)是指模型编码层的输出,T是指矩阵的转置;
3.4)固定局部随机敏感自编码器模型的权值矩阵与偏置值,优化辅助变量Zn,此时,局部随机敏感自编码器模型目标函数中的部分变量为固定值,在使目标函数的值最小化的过程中不起作用,能够将目标函数重写为:
arg min||Xn-f(Zn)||2+μ||Zn-h(Xn)||2
式中,arg min是指求解使得右边求和式取得最小值的参数值,其中待求解的参数值包括辅助变量Zn;通过枚举求出使上式右边求和式取得最小值的辅助变量Zn;
4)计算图像哈希编码间的汉明距离,根据汉明距离进行升序排序,得到图像数据库中与检索的图像之间汉明距离最小的图像,即为与检索的图像最为相似的图像;
将要检索的图像的GIST特征向量输入步骤3)中训练完成的局部随机敏感自编码器模型,得到检索的图像对应的哈希编码;计算检索的图像的哈希编码与步骤3)中得到的图像数据库中所有图像的哈希编码之间的汉明距离,根据汉明距离进行升序排序,得到图像数据库中与检索的图像之间汉明距离最小的图像,即为与检索的图像最为相似的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210252512.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于商用车的冷却模块
- 下一篇:一种测量少量细胞翻译组的方法及其应用