[发明专利]一种基于自编码器的无监督哈希方法有效
申请号: | 201911284130.1 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111078911B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 张博麟;钱江波;陈海明;严迪群;董一鸿 | 申请(专利权)人: | 宁波大学 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/63;G06K9/62;G06V10/762;G06N3/04;G06N3/08 |
代理公司: | 宁波诚源专利事务所有限公司 33102 | 代理人: | 徐雪波;邓青玲 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 编码器 监督 方法 | ||
1.一种基于自编码器的无监督哈希方法,用于在数据库存储的图像中检索出与待检索图像最相似的图像,其特征在于:包括以下步骤:
步骤1、在数据库存储的图像中选取部分图像组成训练集;
步骤2、建立栈式去噪自编码器,并初始化栈式去噪自编码器中的参数;其中建立的栈式去噪自编码器包括依次全连接的M个编码层、带有n个神经元的哈希层和M个解码层;M个编码层和哈希层共同组成编码器,M个解码层组成解码器;M为通过实验确定的正整数,n为预设的正整数;
步骤3、将训练集中的所有图像依次输入到步骤2中建立的栈式去噪自编码器中进行预训练,得到预训练之后的栈式去噪自编码器;
步骤4、建立与步骤2中栈式去噪自编码器的结构相同的栈式自编码器,将步骤3中预训练之后得到的栈式去噪自编码器中的参数作为栈式自编码器中的初始参数;
步骤5、将训练集中的所有图像分批输入到栈式自编码器中进行训练,最终得到训练完成的栈式自编码器;具体包括以下步骤:
步骤5-1、将第一批次的所有图像依次经过M个编码层和哈希层后得到哈希层的输出数据计算公式为:
其中,tanh(.)为双曲正切函数,z为实数;WH为最后一个编码层与哈希层之间预设的权值,WH为n*d的矩阵;aiM为第M个编码层的输出数据,aiM为d*1的矩阵,d为第M个编码层中的神经元数目,i=1,2,3...m;m为每一批次的所有图像数量;bH为最后一个编码层与哈希层之间预设的偏置,bH为n*1的矩阵;将计算得到的矩阵中的每个元素作为z值分别代入tanh(z)函数中进行计算;
步骤5-2、将哈希层的输出数据作为第一个解码器的输入,依次经过M个解码层,最终得到第M个解码层的输出数据,该输出数据为第i幅图像xi重构后的数据;
步骤5-3、使用聚类方法计算步骤5-1中得到的哈希层输出数据的初始类簇中心,得到C个初始类簇中心,记为μj,j=1,2,3...C,C为正整数;
步骤5-4、根据步骤5-3中的C个初始类簇中心计算聚类损失Lc,并根据该批次中的所有输入图像与重构后的图像计算重构损失Lr,以及计算后续对哈希层的输出结果进行量化过程中的量化损失Lh,最后计算总的损失函数L,计算公式为:
L=γLc+αLr+βLh;
其中,γ为预设的聚类损失权重,α为预设的重构损失权重,β为预设的哈希量化损失权重;γ0,α0,β0;
步骤5-6、使用总损失函数对每个编码层的权值进行更新,并使用重构损失对每个解码层的权值进行更新,得到该批次图像训练完成后参数更新的栈式自编码器;
步骤5-7、依次将下一批次的图像输入到上一批次训练完成的栈式自编码器中进行训练,直至当某一批次的图像训练完成后得到的栈式自编码器收敛,则训练完成,将此时得到的栈式自编码器作为最终的栈式自编码器;
步骤6、移除最终的栈式自编码器中的解码器,将保留的M个编码层及哈希层作为检索网络,且将步骤5最终得到的栈式自编码器中的参数作为该检索网络中的参数;
步骤7、将某幅待检索的图像输入到该检索网络中,待检索的图像依次经过M个编码层及哈希层后最终得到哈希层的输出,并对哈希层的输出结果进行量化获得哈希码,使用同样的方法计算出数据库中所有图像对应的哈希码,最后计算该待检索图像对应的哈希码与数据库中存储的图像对应的哈希码之间的汉明距离,将数据库中与待检索图像汉明距离最小的图像作为该待检索图像的检索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911284130.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:空间推进剂自主补加流程的测试系统和方法
- 下一篇:配电柜