[发明专利]基于同构子空间映射和优化的跨媒体检索方法有效
申请号: | 201410260190.0 | 申请日: | 2014-06-12 |
公开(公告)号: | CN103995903B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 张鸿;聂加梅;张延鹏 | 申请(专利权)人: | 武汉科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 杭州宇信知识产权代理事务所(普通合伙)33231 | 代理人: | 张宇娟 |
地址: | 430081 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 同构 空间 映射 优化 媒体 检索 方法 | ||
1.一种基于同构子空间映射和优化的跨媒体检索方法,其特征在于包括以下步骤:
第一步、基于视听觉特征分析的同构子空间映射
从图像数据库和音频数据库中分别提取视觉特征和听觉特征,得到视觉特征矩阵A和听觉特征矩阵B;通过非线性的核函数,将视觉特征矩阵A和听觉特征矩阵B映射到高维核空间;在高维核空间中进行相关性保持映射,得到同构子空间Z;
第二步、构建跨媒体加权近邻图
分析图像样本和音频样本在同构子空间Z中的距离关系,进而构建跨媒体加权近邻图G(V,E),进行定量分析,得到相应的权重矩阵W和拉普拉斯矩阵L;
第三步、基于目标函数最小化的同构子空间优化
对目标函数进行求解,得出优化后的同构子空间Y的值;
第四步、跨媒体距离度量和检索
当用户提交查询样本进行跨媒体检索时,根据优化后的同构子空间Y中的余弦距离,计算与查询样本最相近的图像样本和音频样本,作为跨媒体检索结果返回。
2.如权利要求1所述的基于同构子空间映射和优化的跨媒体检索方法,其特征在于,第一步所述的基于视听觉特征分析的同构子空间映射包括:
(1)从图像数据库中提取颜色直方图、颜色聚合矢量和Tamura方向度三种视觉特征,得到视觉特征矩阵A;
从音频数据库中提取质心、衰减截止频率、频谱流量和均方根四种听觉特征,采用模糊聚类的方法对听觉特征进行索引,将每个音频样本的听觉特征都统一到相同的维数,得到听觉特征矩阵B;
(2)通过非线性的核函数,将视觉特征矩阵A和听觉特征矩阵B映射到高维核空间;
(3)在高维核空间中,采用典型相关性分析方法进行相关性保持映射,计算目标函数:
max[Φ(A)TΦ(A)Ψ(B)TΨ(B)μ] (1)
式(1)中μ表示组合系数,
T表示转置运算,
max表示最大值,
Φ(A)表示视觉特征矩阵A的典型相关性因子,
Ψ(B)表示听觉特征矩阵B的典型相关性因子,
(4)通过拉格朗日乘子法求解式(1)中的目标函数,计算Φ(A)和Ψ(B)的值;
(5)通过矩阵变换Φ(A)TA和Ψ(B)TB,对视觉特征矩阵A和听觉特征矩阵B进行降维,将所有图像样本和音频样本映射到同构子空间Z。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410260190.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自动调节音频播放系统音量的方法和音频播放装置
- 下一篇:摄像设备及其控制方法