[发明专利]一种基于统一稀疏表示的跨媒体检索方法在审
申请号: | 201410356736.2 | 申请日: | 2014-07-24 |
公开(公告)号: | CN104166684A | 公开(公告)日: | 2014-11-26 |
发明(设计)人: | 翟晓华;彭宇新;肖建国 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余功勋 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 统一 稀疏 表示 媒体 检索 方法 | ||
1.一种基于统一稀疏表示的跨媒体检索方法,包括以下步骤:
(1)建立包含多种媒体类型的跨媒体数据库,并将所述数据库分为训练集和测试集,提取每种媒体类型数据的特征向量;
(2)通过训练集的多媒体数据,为每种媒体类型学习跨媒体统一稀疏表示的特征映射矩阵;
(3)根据特征映射矩阵,将测试集中的每种媒体类型映射到统一的空间中,得到跨媒体数据的统一稀疏表示;
(4)基于统一稀疏表示,计算任意媒体数据之间的跨媒体相似性;
(5)将测试集中的每个数据作为查询样例,以整个测试集作为查询目标集进行查询;计算查询样例和查询目标集中媒体数据之间的跨媒体相似性,进而根据相似性得到跨媒体统一检索结果,检索结果包含相关的所有媒体类型数据。
2.如权利要求1所述的方法,其特征在于,所述多种媒体类型为五种媒体类型,包括文本、图像、视频、音频和3D数据。
3.如权利要求2所述的方法,其特征在于,对于文本数据,提取其隐狄雷克雷分布特征向量;对于图像数据,提取其词袋特征向量;对于视频数据,提取其词袋特征向量;对于音频数据,提取其梅尔频率倒谱系数特征向量;对于3D数据,提取其光场特征向量。
4.如权利要求1所述的方法,其特征在于,所述步骤(2)中跨媒体统一稀疏表示学习算法考虑了所有不同媒体类型数据之间的关联关系,同时也考虑了跨媒体数据在映射后的空间中的稀疏性,并保持映射后的统一特征空间样本分布和映射之前的特征空间样本分布接近。
5.如权利要求4所述的方法,其特征在于,步骤(2)所述为每种媒体类型学习跨媒体统一稀疏表示的特征映射矩阵,其建立的目标函数为:
其中P(1),...,P(s)为跨媒体数据库中所有s种媒体类型的映射矩阵,上标(i)表示第i种媒体类型的映射矩阵,矩阵的维度为d(i)×c,可以将原始的特征向量从d(i)维的空间映射到一个统一的c维的统一空间中;和表示一一对应的两个矩阵,这两个矩阵中的一一对应样本表示来自不同媒体类型,而具有同样类别标签的元素;||Z||F表示矩阵Z的Frobenius范数,其定义为:||Z||2,1表示矩阵Z的l2,1范数,其定义为:最小化||Z||2,1能够使得矩阵Z稀疏。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410356736.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生物阻抗测量用电极转接装置
- 下一篇:固定式窗擦