[发明专利]基于双边随机投影的图像感知哈希方法有效
| 申请号: | 201310391189.7 | 申请日: | 2013-08-31 |
| 公开(公告)号: | CN103412960A | 公开(公告)日: | 2013-11-27 |
| 发明(设计)人: | 王秀美;高新波;季秀云;田春娜;李洁;韩冰;邓成;王颖;王斌 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
| 地址: | 710071*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 双边 随机 投影 图像 感知 方法 | ||
技术领域
本发明属于图像处理领域,更进一步涉及大规模图像数据的快速检索领域中的基于双边随机投影的图像感知哈希方法。本发明可有效的对图像进行二元编码,提高图像检索性能,具有实际应用价值。
背景技术
近年来,随着互联网和信息技术的发展,大数据越来越受到人们的关注。国际数据公司的研究结果表明,截止到2012年,全球产生的数据量已跃升至ZB级别。图像数据是大数据的重要成员,是人们沟通交流的重要方式。特别是在当今互联网、电子商务及移动终端迅速发展的时代,图像更是人们生产和生活中不可或缺的部分。为了在大数据中快速有效地检索到用户所需要的信息,人们依据某些准则对原始数据进行编码,用一定长度的哈希码来表示数据。由于哈希码由比特值组成,这正是计算机擅长处理的数据格式,因此能够大大加快信息检索速度。本发明提出的哈希方法,是近似最近邻的搜索方法,在精度要求不是很严格的情况下,针对人们当前的迫切需求进行设计,具有现实应用价值。
天格科技(杭州)有限公司申请的专利“一种基于局部敏感哈希的相似人脸快速检索方法”(申请号:201310087561.5,公开号:CN103207898A)公开了一种基于局部敏感哈希的人脸图像哈希索引方法。该方法通过人脸区域检测、眼睛和嘴巴特征检测和特征提取、肤色检测、人脸肤色分布特征提取等步骤将图像表示为人脸特征向量,然后利用局部敏感哈希方法对人脸特征向量构建索引,从而提高查询时的速度。该专利申请提出的方法存在的不足之处是:局部敏感哈希方法是一种基于概率模型的非数据驱动型方法,一方面算法精度虽然有理论保证,但精度比较低;另一方面受随机性的影响,方法的稳定性也不能令人满意。
大连理工大学提出的专利申请“基于多哈希表映射误差最小化的图像检索方法”(申请号:201110357850.3,公开号:CN102508910A)公开了一种基于多哈希表映射误差最小化的图像哈希索引方法。该方法首先提取图像特征,然后计算训练特征的主成分方向并采用迭代量化法对主成分方向进行优化,将待检索特征和查询特征投影到优化后的主成分方向上,得到其对应的哈希码。然后对先前训练特征进行能量弱化得到新的训练特征,重复该过程得到多组哈希码。该方法克服了单哈希表在召回率较高时汉明球半径较大的缺点,又采用相同哈希码长的多个哈希表,提高了检索的准确率。但是,本专利申请提出的方法存在的不足之处是:一方面主成分方向是通过线性降维方式得到的,而大多数数据是具有非线性特性的,且后续的迭代优化主成分方向过程会增加算法时间复杂度;另一方面对于大数据而言,多哈希表的构建无疑大大增加了存储空间的占用率。
浙江大学提出的专利申请“基于稀疏降维的谱哈希索引方法”(申请号:201010196539.0,公开号:CN101894130A)公开了一种基于稀疏表达和拉普拉斯图的哈希索引方法。该方法首先提取图像底层特征进一步得到视觉单词,然后利用有权重的拉普拉斯-贝尔特拉米算子的特征方程和特征根,求得欧式空间到汉明空间的映射函数,得到低维空间汉明向量。该方法用稀疏降维方式代替谱哈希的主成分分析降维方式,增加了结果的可解释性。但是,该专利申请提出的方法存在的不足之处是:该方法仍没有避免谱哈希模型中强制训练数据服从均匀分布的前提假设,使其应用价值受到限制。
发明内容
本发明的目的在于克服上述已有技术的不足,提出一种基于双边随机投影的图像感知哈希方法,改善了单边随机投影的不稳定性,节省了哈希编码的存储空间,降低了查询时间复杂度,有效提高了图像信息检索的查准率与查全率。
实现本发明目的的技术思路是,首先在训练阶段,对图像训练数据矩阵进行低秩近似,得到最优右投影矩阵,对最优右投影矩阵的列向量进行分组正交化,得到最优投影向量,计算图像训练数据在最优投影向量下的哈希值,得到图像训练数据哈希编码;测试阶段,计算图像测试数据在最优投影向量下的哈希值,得到图像测试数据的哈希编码,计算测试数据与训练数据间的汉明距离,得到测试数据在汉明空间下的近邻点。
为实现上述目的,本发明包括如下主要步骤:
(1)预处理:
1a)调用图像数据库中的原始图像数据;
1b)采用GIST方法,对原始图像数据提取图像底层特征,得到图像特征数据;
1c)对图像特征数据取均值,用图像特征数据中的每个图像特征数据分别减去该均值,得到相应的图像特征数据的中心化向量;
1d)对每个图像特征数据中心化向量的各个分量的平方相加后,再开根号得到该向量的模;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310391189.7/2.html,转载请声明来源钻瓜专利网。





