[发明专利]一种基于集成学习的零样本哈希检索方法在审

专利信息
申请号: 202011092264.6 申请日: 2020-10-13
公开(公告)号: CN112364192A 公开(公告)日: 2021-02-12
发明(设计)人: 赵钰莹;赖韩江;印鉴 申请(专利权)人: 中山大学
主分类号: G06F16/53 分类号: G06F16/53;G06F16/51;G06F16/583;G06N20/20
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 刘俊
地址: 510260 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 集成 学习 样本 检索 方法
【说明书】:

本发明提供一种基于集成学习的零样本哈希检索方法,该方法将集成学习的方法应用于零样本图片检索问题,使用VGG‑16提取图片的高维实数特征,然后用全连接层和激活函数将高维实数特征转化为低维二进制哈希码,在保证检索效果的前提下,减少了存储空间。之后,利用集成学习的训练方法,更新哈希模型,从而使模型具有更强的泛化能力,使模型在新类别的图片上的检索效果也大大提升。

技术领域

本发明涉及计算机视觉领域,更具体地,涉及一种基于集成学习的零样本哈希检索方法。

背景技术

随着互联网的快速发展,各种各样的数据呈爆炸式增长,包括图片、文字、视频等各类信息。这就导致了人们将会耗费大量时间来寻找自己感兴趣的内容,当人们带着目标来浏览网页或者使用手机软件时,面对如此巨大的数据库,成千上万条信息陈列在界面上,往往很难通过肉眼来迅速找到所有目标信息,因此检索系统应运而生。

图片检索是检索系统的一个重要组成部分。哈希技术一直被用于快速图片检索领域。将图片标签作为监督信息,来训练深度神经网络,能使哈希技术的效果变得更好。然而,网络上每天都在产生新的概念、新的图片,这为检索系统带来了新的挑战:零样本问题,也就是当训练好的模型遇到从未见过的新类别图片时,检索效果会变得非常差。为了解决这个问题,在本发明中提出了一个零样本的哈希检索方法,利用集成学习的思想,提升模型的泛化能力,从而使模型在遇到新类别的图片时,也能有良好的检索效果。

集成学习主要是组合多个弱监督模型以得到一个更好更全面的强监督模型,它是将几种机器学习技术组合成一个预测模型的元算法,以达到减小方差、偏差或改进预测的效果。集成学习方法主要分为两大类:关于数据集的集成、关于模型融合的集成。其中,关于数据集的集成是指,利用Bootstrap方法进行抽样得到多个数据集,或者通过更新各个样本权重的方式来改变数据分布,分别训练多个模型进行组合,比如Bagging和Boosting方法;关于模型融合的集成是指,采取不同的方式组合多个学习器,从而获得更好的效果,对于回归问题,可以使用平均法;对于分类问题,可以使用多数投票法。

申请号为201510200864.2的专利说明书中公开了一种基于集成哈希编码的快速图像检索方法,本申请首先提取训练图像和查询图像的SIFT特征,并利用M种哈希算法对训练图像进行初始哈希编码;然后利用集成学习中的一致性约束准则对初始哈希编码结果进行再学习,得到集成哈希映射矩阵;最后重新对训练图像和查询图像进行集成哈希编码,并在集成哈希编码的基础上通过计算查询图像与训练图像之间的汉明距离来进行快速检索。本发明中的集成哈希编码能够同时融合不同哈希算法的特点和优势,解决了单一哈希算法判别力不足和适用范围的局限性问题,从而使得图像的快速检索更加准确和高效。然而,该专利无法实现结合了划分数据集和组合模型两种策略来提升模型的泛化能力,检索效果也大大提升。

发明内容

本发明提供一种基于集成学习的零样本哈希检索方法,该方法结合了划分数据集和组合模型两种策略来提升模型的泛化能力,检索效果也大大提升。

为了达到上述技术效果,本发明的技术方案如下:

一种基于集成学习的零样本哈希检索方法,包括以下步骤:

S1:将训练集按照类别标签分为类别不重叠的两部分A和B;

S2:分别用A、B和A+B作为训练数据,通过VGG-16模型和一层全连接层,得到训练样本的哈希码;

S3:利用三元组损失,得到训练过程中的损失;

S4:利用SWA方法训练更新网络,得到收敛后的模型;

S5:步骤S2中的3个数据集训练可以得到3个不同的模型,求它们求平均值,得到最终的集成模型;

S6:计算集成模型在测试集上的检索结果。

进一步地,所述步骤S1的具体过程是:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011092264.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top