[发明专利]一种基于重构约束的矩阵分解哈希方法有效
| 申请号: | 201810746141.6 | 申请日: | 2018-07-09 |
| 公开(公告)号: | CN109255098B | 公开(公告)日: | 2023-01-17 |
| 发明(设计)人: | 陈辉;王海涛;武继刚;孟敏 | 申请(专利权)人: | 广东工业大学 |
| 主分类号: | G06F17/16 | 分类号: | G06F17/16 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
| 地址: | 510006 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 约束 矩阵 分解 方法 | ||
本发明涉及图像处理方法的技术领域,更具体地,涉及一种基于重构约束的矩阵分解哈希方法,该方法首先使用矩阵因式分解技术来学习图片数据和文本数据的共同潜在语义信息;然后通过计算得到一组通用的映射矩阵;之后利用可获得的数据标签信息,将图拉普拉斯约束引入到潜在语义信息中,以增强本方法的识别力;最后通过原始图片与文本的数据重构,减少冗余信息的干扰。本发明通过对原始数据进行重构分离原始数据中的有效信息和冗余信息,增强矩阵因式分解技术的潜在语义信息的获取能力,从而提高了检索的成功率,同时能够很好地适用于大规模的跨模态检索任务。
技术领域
本发明涉及图像处理方法的技术领域,更具体地,涉及一种基于重构约束的矩阵分解哈希方法。
背景技术
随着互联网的快速发展,互联网中的数据表达变得多样化,例如:一个网页中通常会包含图片、文本、视频、音频等多媒体数据。目前传统的检索方式大多基于单模态,即只对相同类型的数据进行检索,如文本检索、图像检索、视频检索等。用户如何在多模态数据中高效地检索到自己想要的数据成为一个具有挑战性的问题。为了解决这个问题,检索领域的研究热点逐渐倾向于跨模态检索。跨模态检索可以提交任何媒体形式的内容以搜索相关的信息,其主要问题是如何度量不同模态数据之间的语义相似性。
近年来,由于基于矩阵因式分解的哈希方法能够很好的挖掘不同模态数据之间的共同语义,这种方法吸引了大量的关注。然而真实世界中的数据往往存在大量冗余信息,会极大的影响多模态数据的语义相似比较,且目前已有的矩阵因式分解哈希方法不能够很好处理这个问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于重构约束的矩阵分解哈希方法,加入对数据的重构约束,保证原始图片和文本信息在映射到共同的语义空间时尽可能多的保留原有数据的特征信息,能够提高检索的精度。
为解决上述技术问题,本发明采用的技术方案是:
提供一种基于重构约束的矩阵分解哈希方法,包括以下步骤:
S1.通过矩阵因式分解学习图片和文本的共同潜在语义空间矩阵S,通过对所述共同语义空间矩阵S与图片矩阵X和文本矩阵Y进行范数运算,得到用于查询项的映射矩阵P1和P2;
S2.对步骤S1中所述共同潜在语义空间矩阵S进行拉普拉斯正则约束;
S3.在步骤S1所述矩阵因式分解框架下,引入数据重构约束,对图片和文本进行重构;所述重构约束表示为X=Q1P1X+E1和Y=Q2P2Y+E2,其中Q*为重构矩阵,P*为映射矩阵,E*表示冗余信息,*可取1和2;
S4.对步骤S1、步骤S2、步骤S3进行整理得到统一待优化的目标函数,然后通过增广拉格朗日乘子法对目标变量进行迭代更新得到最优解P1、P2、S;
S5.通过符号函数sign(·)对步骤S4中共同潜在语义空间矩阵S进行量化,得到图片和文本统一的哈希码。
本发明通过对原始数据进行重构分离原始数据中的有效信息和冗余信息,增强矩阵因式分解技术的潜在语义信息的获取能力,同时能够减少映射过程中信息的丢失,使得生成的哈希码能包含更多的重要的特征信息,因此在进行检索任务时可以返回更加准确的检索结果。
优选地,步骤S1中图片和文本的共同潜在语义空间矩阵S的学习方法如下:
S11.通过矩阵因式分解,将图片矩阵X和文本矩阵Y分解为两个矩阵相乘的形式:X=U1×S,Y=U2×S,其中,U1和U2分别为X和Y矩阵因式分解的因子矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810746141.6/2.html,转载请声明来源钻瓜专利网。





