[发明专利]一种基于深度学习与低秩矩阵优化的哈希图像检索方法有效
| 申请号: | 201910368358.2 | 申请日: | 2019-05-05 |
| 公开(公告)号: | CN110188227B | 公开(公告)日: | 2022-11-18 |
| 发明(设计)人: | 陈泽彬;周万义;青春美;尹红艳;吴婷婷 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06F16/583 | 分类号: | G06F16/583;G06V10/75;G06V10/764 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 矩阵 优化 希图 检索 方法 | ||
本发明公开了一种基于深度学习与低秩矩阵优化的哈希图像检索方法,包括以下步骤:S1、获取图像数据,对数据进行标注和预处理,构造图像检索的数据集,并将其分为训练集与测试集;S2、搭建深度特征提取网络,构建深度哈希网络主干;S3、将训练集输入深度哈希网络主干,基于极大化概率似然和低秩正则化损失函数,构建哈希网络;S4、对哈希网络进行训练;S5、将测试集与训练集图像分别输入哈希网络,生成二值哈希编码,计算相互的汉明距离;S6、返回训练集中汉明距离最小图片作为检索结果。本发明克服了直接用二值化连续值特征编码到汉明空间造成的相似性信息破环和量化误差大的问题,提高了基于哈希表征的图像检索方法的性能。
技术领域
本发明属于哈希图像检索与人工智能技术领域,特别涉及一种基于深度学习与低秩矩阵优化的哈希图像检索方法。
背景技术
近几年,互联网技术、智能硬件和多媒体技术得到了前所未有的发展,涌现出了大量的网络数据,特别是移动设备的广泛使用,使得各种各样的图片数据充满着网络平台和电子通讯设备,如何更加精确高效地对海量图片资源进行匹配与检索,无论在理论研究还是在商业应用中,都具有重大的价值,比如电商购物平台中相似产品的推荐、人脸检索等等。
目前的图像检索方法主要包括基于文本标签的检索和基于图像内容的检索。传统的图像检索方式基于图片对应的文本标签作为检索的关键词,为了达到精确的检索,往往需要对图片进行大量的语义标签上的标注。受制于人力成本与时间成本,加之标注时易于引入主观判断上的偏差和有限语义标注信息在表达丰富图像内容上的局限性,基于语义标签的图像检索往往优势不足。近年来,随着深度学习的发展,特别是深度卷积神经网络的出现,使得模型的表征能力大大提升,基于图像内容的检索的得到快速的发展并得到了广泛应用。谷歌、百度等各大搜索引擎相继采用“以图搜图”的图片检索方式,使图片检索技术在灵活性和准确度上得到很大的提高。
哈希表征学习是图像检索领域的常用算法,其旨在将高维度的数据信息编码成紧凑的二值哈希码,并利用生成的哈希码结合相应的度量学习方式,如汉明距离,进行相似性的判断。由于其存储与检索的高效性,在信息检索和计算机视觉领域得到了广泛的关注。卷积神经网络作为人工神经网络的一种,具有识别二维形状的多层感知器这种网络结构以及平移、比例缩放、倾斜或者其他形式几何变换不变性,其类似于生物神经网络,具有权值共享网络结构,减少了权值的数量,大大降低了网络模型的复杂度,已经成为当前语音和图像识别领域的研究热点。得益于卷积神经网络的局部感知和强大的特征提取能力,深度学习在图像分类任务上取得前所未有的突破。在这样的背景下,基于卷积神经网络相的哈希表征学习方法也被广泛的研究和探索,通过结合卷积神经网络强大的拟合和特征提取能力与哈希方法的高效性,整个系统可以实现端到端的训练,目前这类方法在很多大型标准数据集上都取得了最优的检索性能。
然而之前的这类方法都是先通过学习连续性特征编码,然后通过一个独立的后处理步骤将连续特征编码二值化成哈希编码,这种方法无法很好的学习到保留相似性的特征表示,也不能有效的控制量化误差,大大限制了检索性能的提高。
发明内容
本发明的目的是为了解决上述现有技术存在的缺陷,并提供一种结合低秩矩阵优化和哈希表示学习的基于内容的快速图像检索方法,该方法在图像检索系统生成二值哈希码的过程上加上低秩的限制条件,在汉明空间更好地保留数据之间的相似性关系,从而大幅降低了常规的基于哈希编码的图像检索方法中直接对连续编码取整造成的量化误差和精度损失。在训练过程中,利用深度神经网络提取图像中的高层语义特征和训练过程中的正负反馈信息,以低秩优化方法训练出具有更加精确表征图像信息的模型。
本发明通过以下技术方案如下。
一种基于深度学习与低秩矩阵优化的哈希图像检索方法,包括以下步骤:
S1、获取图像数据,对数据进行标注和预处理,构造图像检索的数据集,并将其分为训练集与测试集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910368358.2/2.html,转载请声明来源钻瓜专利网。





