[发明专利]基于协同矩阵分解的离散监督跨媒体哈希检索方法在审
申请号: | 201910375983.X | 申请日: | 2019-05-07 |
公开(公告)号: | CN110110100A | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 姚涛;唐文静;李阿莉;付海燕;盛国瑞;于泓;刘莉 | 申请(专利权)人: | 鲁东大学 |
主分类号: | G06F16/432 | 分类号: | G06F16/432;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 264025 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于协同矩阵分解的离散监督跨媒体哈希检索方法,包括以下步骤:1)建立跨媒体检索数据库,并将样本对划分为训练集和测试集;2)提取训练集和测试集中所有样本对的特征,并进行去均值;3)分别利用协同矩阵分解和语义嵌入把样本的特征和类别标签投影到低维特征空间和哈希码,并学习一个正交旋转矩阵构建低维特征和哈希码的语义关联,同时为各模态学习哈希函数;5)利用学习的哈希函数生成测试样本的哈希码;6)把训练集中的样本作为待检索样本,把测试集中样本作为查询样本,计算查询样本与待检索样本的汉明距离;7)按汉明距离降序排列,返回前r个异构样本作为检索结果。本发明不仅可实现跨媒体检索,而且训练过程占用资源少、准确率高,具有广阔的应用前景。 | ||
搜索关键词: | 样本 矩阵分解 哈希码 跨媒体检索 汉明距离 检索样本 协同 训练集 哈希 检索 低维特征空间 哈希函数生成 测试 查询 语义 测试样本 哈希函数 检索结果 降序排列 类别标签 旋转矩阵 训练过程 语义关联 占用资源 测试集 准确率 低维 构建 模态 异构 正交 学习 嵌入 投影 数据库 监督 返回 应用 | ||
【主权项】:
1.一种基于协同矩阵分解的离散跨媒体哈希检索方法,其特征在于,该方法包括以下步骤:步骤S1,收集图像和文本样本并对其进行类别标注,生成跨模态检索数据集,并将所有样本对按一定比例划分为训练集和测试集;步骤S2,提取数据集中所有图像和文本样本的特征,并对其进行去均值;步骤S3,利用训练集中的图像、文本样本的特征及其类别标签构建目标函数,
表示所有训练样本的特征,其中
,
表示所有训练图像样本的特征,其中
为图像特征的维度,
为图像和文本样本对的数量,
表示所有训练文本样本的特征,其中
为文本特征的维度;
表示样本对的类标签,其中
为所有类别的数量,如果第
个样本属于第
类,则
;反之,
;具体包括以下步骤:步骤S31,由于异构样本间的语义关联非常复杂,因此首先利用协同矩阵分解,保持样本的模态间相似性学习一个共享子空间,此过程的目标函数定义为:
其中
表示Frobenius范数,
为映射矩阵,
表示共享子空间,
表示子空间的维度,
为图像和文本模态的权重参数,
表示正则项的权重参数;步骤S32,通过学习一个潜在语义映射矩阵,构建样本标签与哈希码间的语义关联,此过程的目标函数定义为:
其中
表示潜在语义矩阵,
为构建样本标签与哈希码间语义关联项的权重参数,
表示训练样本的哈希码;步骤S33,利用正交旋转矩阵构建低维特征和训练样本哈希码的语义关联,此过程的目标函数定义为:
其中
表示正交旋转矩阵,
表示单位矩阵,
为正交旋转矩阵学习的权重参数;步骤S34,利用线性映射作为哈希函数,此过程的目标函数定义为:
其中,
表示图像和文本模态的哈希函数,
表示图像和文本模态哈希函数学习的权重参数;步骤S35,将共享子空间学习、构建标签与哈希码间的语义关联、正交旋转矩阵学习和哈希函数学习的目标函数相加即为本方法的目标函数,定义如下:
其中
表示正则项,
;步骤S4,由于目标函数不仅含有八个未知变量,而且哈希码是离散的,因此目标函数的求解是NP‑HARD问题,但当固定七个变量求解某一变量时,问题变为凸优化问题,因此可利用迭代优化算法进行求解,求解过程包括以下八个步骤:步骤S41,固定其余变量,求解
:丢弃常数项,问题转换为:
对
求偏导,并使它等于0,可得
因此:
步骤S42,固定其余变量,求解
:与求解
类似,可得:
步骤S43,固定其他变量,求解
丢弃常数项,并对
求偏导,并使它等于0可得:
因此
步骤S44,固定其他变量,求解
:与求解
类似,可得:
步骤S45,固定其他变量,求解
:这个子问题是典型的正交普鲁克问题,可以由奇异值分解(Singular Value Decomposition,SVD)方法直接求解;具体而言,首先对
进行奇异值分解,可表示为
,则
;步骤S46,固定其他变量,求解
:去除常数项,问题转换为:
上式可转换为:
因为
和
为常数,因此
存在一个离散闭合解:
步骤S47,固定其他变量,求解
:与求解
类似,可得:
步骤S48,固定其他变量,求解
:与求解
类似,可得:
步骤S49,重复执行步骤S41‑步骤S49至算法收敛或迭代次数达到最大值;步骤S5,把训练集和测试集分别作为待检索样本集和查询集,利用相应模态的哈希函数直接得到查询样本的哈希码;步骤 S6,计算查询样本与待检索样本集中异构样本的汉明距离;步骤 S7,按汉明距离升序排序,并返回前r个样本作为检索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鲁东大学,未经鲁东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910375983.X/,转载请声明来源钻瓜专利网。