[发明专利]基于深度学习和哈希的图像检索方法有效
申请号: | 201510901348.2 | 申请日: | 2015-12-07 |
公开(公告)号: | CN105512289B | 公开(公告)日: | 2018-08-14 |
发明(设计)人: | 张晨民;赵慧琴;彭天强 | 申请(专利权)人: | 郑州金惠计算机系统工程有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 陈大通 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 哈希函数 图像检索 量化误差 哈希 卷积神经网络 准确率 图像底层特征 内在关系 深度特征 特征表达 提取图像 图像特征 学习能力 二值化 分类器 哈希码 学习 检索 图像 挖掘 引入 | ||
本发明涉及一种基于深度学习和哈希的图像检索方法,利用深度卷积神经网络强大的学习能力,提取图像深层特征,克服现有技术中利用图像底层特征而导致特征表达能力不强、检索精度低的问题;并引入哈希层构造哈希函数,将图像深度特征的学习和哈希函数的构造在同一过程中完成,挖掘图像特征与哈希函数内在关系,大大提高图像检索准确率;将量化误差的损失加入到深度卷积神经网络的损失层,增强了哈希码的表达能力,通过Softmax分类器损失模块和量化误差损失模块,有效降低哈希函数中的二值化造成的量化误差,进一步提高图像检索的准确率。
技术领域
本发明涉及图像检索领域,特别涉及一种基于深度学习和哈希的图像检索方法。
背景技术
随着大数据时代的到来,互联网图像资源迅猛增长,如何对大规模图像资源进行快速有效地检索以满足用户需求亟待解决。为了在大规模图像集中进行快速有效地检索,哈希技术将原始图像保持相似性地映射为二进制哈希码。由于二进制哈希码在汉明距离计算上的高效性和存储空间上的优势,哈希码在大规模图像检索非常地高效。基于内容的图像检索通过提取图像视觉底层特征来实现图像的内容表达。与这些底层特征相比,深度卷积神经网络更能够获得图像的内在特征,利用深度卷积神经网络提取的特征在目标检测、图像分类和图像分割等方面都表现出了良好的性能。中国专利(申请号:201010196539.0,公开号:CN101894130A)提出的公开了一种基于稀疏表达和拉普拉斯图的哈希索引方法,首先提取图像底层特征,进一步通过聚类得到视觉单词,然后利用有权重的拉普拉斯-贝尔特拉米算子的特征方程和特征根,求得欧式空间到汉明空间的映射函数,得到低维空间汉明向量,该方法哈希函数的构造假设训练数据服从均匀分布,使其应用受限;又如中国专利(申请号:201410441091.2,公开号:CN104182538A)公开了一种基于半监督哈希的图像检索方法,首先提取原始图像的底层特征,使用类标传递方法求训练数据的类标,根据类标产生编码;然后使用训练数据及其编码训练支持向量机分类器,最后数据根据支持向量机分类器的分类产生哈希编码,该方法中哈希构造算法对数据的分布没有要求,且检索精度有所提高,但它仍旧将图像特征提取和哈希函数的构造过程分为完全独立的两个过程,不能得到很好的哈希码表示图像,其检索精确度有待进一步的提高。Kevin Lin等在文章“DeepLearning of Binary Hash Codes for Fast Image Retrieval”中提出了一种利用深度卷积网络框架同时学习特征和哈希函数的算法,该文章中采用类别标签作为监督信息。该方法的不足之处是:它没有考虑到将连续值阈值化为哈希码时产生的量化误差,从而使得检索精度降低。
现有的基于哈希的图像检索技术基本上都是首先提取图像底层特征,然后构造保持图像特征相似性的哈希函数;最后,利用哈希函数将底层特征图像特征映射为哈希码,用哈希码表示图像用于大规模的图像检索,以发挥哈希码在存储空间少和汉明距离计算速度快的优势,将图像特征提取和哈希函数的构造过程分为完全独立的两个过程,不能构造出表达能力强哈希码表示图像,使得检索准确率低。
发明内容
针对现有技术中的不足,本发明提供一种基于深度学习和哈希的图像检索方法,同时学习图像特征和哈希编码的深度卷积网络架构,在该架构中加入哈希层和将连续值量化为二进制编码所引起的量化误差损失,利用该架构生成表达能力非常强的哈希码,大大提高图像检索的准确率,解决现有技术中因生成的哈希码表达能力不强而引起检索准确率较低的问题。
按照本发明所提供的设计方案,一种基于深度学习和哈希的图像检索方法,具体包含如下步骤:
步骤1.将图像数据集及其对应的类别标签信息分别对应分成两部分,一部分作为训练样本集,另一部分作为测试样本集,其中,训练样本集和测试样本集中每个样本均包括一张图像及对应的类别标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州金惠计算机系统工程有限公司,未经郑州金惠计算机系统工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510901348.2/2.html,转载请声明来源钻瓜专利网。