[发明专利]基于多任务哈希学习的图像检索方法有效
| 申请号: | 201810902426.4 | 申请日: | 2018-08-09 |
| 公开(公告)号: | CN109165306B | 公开(公告)日: | 2021-11-23 |
| 发明(设计)人: | 周书仁 | 申请(专利权)人: | 长沙理工大学 |
| 主分类号: | G06F16/53 | 分类号: | G06F16/53;G06N3/04;G06N3/08 |
| 代理公司: | 长沙新裕知识产权代理有限公司 43210 | 代理人: | 周跃仁 |
| 地址: | 410114 湖南省长沙市天心区万家*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 任务 学习 图像 检索 方法 | ||
本发明公开了一种基于多任务哈希学习的图像检索方法。首先确定深度卷积神经网络模型;其次利用多任务学习机制设计损失函数;然后确定卷积神经网络模型训练方法,结合损失函数,并利用反向传播方法对模型进行优化;最后输入图像至卷积神经网络模型,并将模型的输出转换生成哈希编码,进行图像检索。所述卷积神经网络模型由卷积子网络和全连接层组成;所述卷积子网络由第一卷积层、最大池化层、第二卷积层、平均池化层、第三卷基层及空间金字塔池化层依次组成;所述全连接层由隐含层、哈希层及分类层组成。所述模型训练方法有联合式和分离式两种训练方法。本发明的方法可对单标签和多标签图像进行有效检索,检索性能比其他深度哈希方法更佳。
技术领域
本发明属于图像检索技术领域,涉及一种基于多任务哈希学习的图像检索方法。
背景技术
考虑到互联网中越发膨胀的数字图像资源,采用线性搜索的方式在如此庞大的图像库中进行信息检索将会造成巨大的计算开销和存储开销,因此在CBIR技术的应用过程中,“维数灾难”问题时有发生。为了能够解决这一问题,近些年来,近似最近邻搜索逐渐成为了研究者们重点关注的一部分,哈希方法就是其中的典型代表。哈希方法的目标通常是让初始的图像数据经由哈希函数计算得出一串固定长度的二值编码,实现对于图像表征的降维,有利于减少存储开销。而在相似性计算阶段,利用汉明距离计算哈希编码之间的相似性还可以提高检索效率。哈希的高效使得它被广泛地研究并且应用到了实际中。
起初,数据无关型哈希方法是学者们研究的重点,这种方法一般来说都是人为对哈希函数进行设计,特点是与训练数据完全无关。局部敏感哈希方法LSH就是数据无关型哈希方法的典型代表。LSH方法是通过随机投影一些超平面来划分原始的特征空间,然后构造保持相似性的哈希编码。不过尽管有严谨的理论进行支撑,但是该方法在实际应用中一般都要求哈希编码的位数足够长才能够实现不错的检索效果,而这又将会导致存储开销的增长。
后来,针对数据无关型哈希方法的局限性,研究者们提出了数据依赖型哈希方法,即哈希学习方法。哈希学习方法的特点是与训练数据息息相关,这种方法的哈希函数都是从训练数据中学习得来的,所以不像数据无关方法一样具有普适性。但是数据依赖型方法的优点就在于对哈希编码的长度要求不高也能实现非常好的效果。数据依赖型方法还可以按照训练样本数据的类别再次划分成三类:
无监督哈希方法:此类方法利用无标签图像数据进行训练来构造哈希函数,相比其它两类更具有通用性,迭代量化ITQ、谱哈希SH等方法是其中的典型。迭代量化方法在对图像进行降维操作后,通过旋转矩阵尽量减少量化误差,这样构造出的哈希函数能够减小图像转化为二进制编码时造成的信息损失。谱哈希方法在学习哈希函数时将图像对之间的加权hamming距离最小化,根据图像对之间的相似性确定权重。
有监督哈希方法:此类方法则是充分结合了图像的语义标签、图像对的相似度等监督信息来训练哈希函数,因此有监督哈希方法的检索性能通常都会优于无监督方法,并且能够获得更加紧凑的二值编码。典型关联分析迭代量化是关于迭代量化方法的一种扩展,简称为CCA-ITQ,利用典型关联分析和标签信息对图像进行降维,再将量化误差最小化。最小化损失哈希方法MLH则是通过样本对之间的相似度信息来设计铰链损失函数。上述利用线性投影的方式学习哈希函数的方法无法适用于线性不可分的样本数据,因此,研究者们又提出了监督核哈希KSH和二进制重构嵌入BRE这类基于核(kernel) 的方法。
半监督哈希方法:针对上述两类方法的优、劣情况进行分析后,学者们还提出了一种半监督哈希SSH,SSH将监督信息的经验误差最小化,同时将二进制编码的方差最大化。而半监督标签哈希SSTH则是通过有监督学习的形式来构建标签与二进制编码之间的联系,同时通过无监督学习的形式实现相似性保留。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙理工大学,未经长沙理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810902426.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:区块链的构造方法、介质及系统
- 下一篇:一种特征检索方法、装置和存储介质
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





