[发明专利]一种基于难样本挖掘的图像检索方法及系统在审
申请号: | 202111645521.9 | 申请日: | 2021-12-29 |
公开(公告)号: | CN114297431A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 魏巍;游戈;李琳 | 申请(专利权)人: | 山西大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/62;G06N3/04;G06N3/08;G06V10/764;G06V10/774;G06V10/74 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 赵兴华 |
地址: | 030006 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 样本 挖掘 图像 检索 方法 系统 | ||
本发明涉及一种基于难样本挖掘的图像检索方法及系统,首先构建初始深度学习网络,所述深度学习网络包括初始主干网络、初始嵌入层和初始分类层;然后基于AM‑Softmax损失函数对所述深度学习网络进行训练,得到训练深度学习网络,所述训练深度学习网络包括训练主干网络、训练嵌入层和训练分类层;再基于所述训练分类层的参数,对所述训练嵌入层进行训练,得到收敛嵌入层,基于所述训练主干网络、所述收敛嵌入层和所述训练分类层构建收敛深度学习网络;最后基于所述收敛深度学习网络,得到待挖掘图像集中每个图像的特征向量,进一步得到每个图像的相似度。本发明加速了深度学习模型的收敛,提高了图像检索技术的性能。
技术领域
本发明涉及图像检索技术领域,特别是涉及一种基于难样本挖掘的图像检索方法及系统。
背景技术
图像检索技术是支撑目前日益流行且普遍繁荣的电商平台的重要技术,可以极大地满足客户的需求以及促进电子商务的进一步普及。现有一个图片库,给定一张查询用的图片,图像检索任务即利用查询图片与库中图片所提取特征向量之间的距离,从大到小进行排序,以获得图片库中与查询图片相同或者相似的图片。
在机器学习领域,距离的概念从诞生之日起就一直有着广泛的应用。它提供了一种数据间相似性的度量,即距离近的数据要尽可能相似,距离远的数据要尽可能不同。这种相似性学习的思想应用在分类问题上是著名的最近邻分类,该方法将待测样本的类别分配为距其最近的训练样本的类别。这种最近邻分类思想催生了距离度量学习的产生。欧氏距离作为一种简洁有效的度量工具得到了度量学习算法的广泛青睐,然而,单一形式的距离度量无法普适所有实际问题。因此,度量学习希望能够结合数据自身特点,学习一种有效的度量方式,用于求解目标问题。早期度量学习算法的产生,极大地改善了基于距离分类器的分类性能、基于距离聚类的无监督问题以及特征降维的表现。
随着深度学习的飞速发展,结合深度神经网络在语义特征抽取、端到端训练优势的深度度量学习,逐步进入人们的眼帘。相比于经典度量学习,深度度量学习可以对输入特征做非线性映射,在计算机视觉领域得到了广泛的应用。标准的深度度量学习通常使用对比损失或三元损失,通过挖掘两个或三个正负样本来约束类内距和扩大类间距。这为训练样本的采样带来了挑战,由于训练样本数量极多,因此只能挖掘有意义的样本参与训练。若负样本选取过难,则易导致训练不稳定;若选取过简单,则易导致损失函数无梯度,不利于模型的收敛。难样本挖掘也应运而生,传统的方法对于简单样本和难样本一视同仁,因此存在以下缺点:
1)基于全局样本的难样本挖掘方法,通过计算在整个数据集中挑选难样本来构建的方法,这种方法可以挑选到高质量的难样本,但是由于数据集较大,往往会有很大的计算开销。
2)基于局部样本的难样本挖掘方法虽然计算开销较小,但往往只是基于一小部分样本与样本在嵌入空间中的欧式距离来在计算时对样本对进行加权,这样做忽略了全局的语义信息,无法充分地挖掘有意义的样本参与训练。
发明内容
有鉴于此,本发明提供了一种基于难样本挖掘的图像检索方法及系统,加速深度学习模型的收敛,提高图像检索技术的性能。
为实现上述目的,本发明提供了如下方案:
一种基于难样本挖掘的图像检索方法,包括:
构建初始深度学习网络,所述深度学习网络包括初始主干网络、初始嵌入层和初始分类层;
基于AM-Softmax损失函数对所述深度学习网络进行训练,得到训练深度学习网络,所述训练深度学习网络包括训练主干网络、训练嵌入层和训练分类层;
基于所述训练分类层的参数,对所述训练嵌入层进行训练,得到收敛嵌入层,基于所述训练主干网络、所述收敛嵌入层和所述训练分类层构建收敛深度学习网络;
基于所述收敛深度学习网络,得到待挖掘图像集中每个图像的特征向量,进一步得到每个图像的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111645521.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于断路半导体开关的脉冲发生器
- 下一篇:改性苯并噁嗪树脂及其制备方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序