[发明专利]利用标签层次信息的多媒体数据跨模态检索方法及系统有效

专利信息
申请号: 202010771701.0 申请日: 2020-08-04
公开(公告)号: CN111930972B 公开(公告)日: 2021-04-27
发明(设计)人: 罗昕;詹雨薇;许信顺 申请(专利权)人: 山东大学
主分类号: G06F16/432 分类号: G06F16/432;G06N3/04;G06N3/08
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 黄海丽
地址: 250101 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 利用 标签 层次 信息 多媒体 数据 跨模态 检索 方法 系统
【说明书】:

发明公开了利用标签层次信息的多媒体数据跨模态检索方法及系统,包括:获取待检索的第一模态多媒体数据;对待检索的第一模态多媒体数据进行特征提取,得到第一哈希码;将第一哈希码与预存储的第二模态的所有多媒体数据对应的已知哈希码进行距离计算;选择距离最近的若干个哈希码对应的第二模态的多媒体数据,作为检索结果输出。

技术领域

本申请涉及跨媒体检索技术领域,特别是涉及利用标签层次信息的多媒体数据跨模态检索方法及系统。

背景技术

本部分的陈述仅仅是提到了与本申请相关的背景技术,并不必然构成现有技术。

随着多媒体数据的爆发式增长,数据通常被以多种模态来表示,例如图像和文本等。面对海量数据,通常需要进行快速的相似性比较,这是管理和使用数据的基础操作。因此,快速跨模态检索的需求越来越大。为了满足这一需求,使用一种模态的数据来检索另一种模态内相似样本的跨模态哈希方法相继被提出。

跨模态哈希学习属于哈希学习,且具有哈希学习的优点。哈希学习方法是当前存储或检索大规模数据最流行的方法之一。哈希学习方法的主要思想是设计一种通过学习得到的哈希函数,它可以将数据从原始的高维特征空间中的数据表示变换成低维汉明空间中的二进制编码表示。通过这种变换,可以达到降维的目的,可以有效缩减空间消耗;在达到维数降低目的的同时,哈希函数会保持数据之间的相似性。此外,将数据表示成二进制编码的形式,还可以获得快速检索的优势,因为计算机在处理二进制编码间的两两比较有很高的效率,所以可以使检索的速度变得很快。

现有的跨模态哈希学习方法可以有多种划分方法。比如,可以依据是否能够利用数据的监督信息而分为无监督跨模态哈希和有监督跨模态哈希。相较于无监督跨模态哈希方法,监督的跨模态哈希模型可以利用语义信息,因此其学到的哈希函数可以生成质量更高的数据哈希码的表示。比如,根据方法是否能够使用深度学习技术来提取特征及学习哈希函数,跨模态哈希方法又可以分为深度跨模态哈希和非深度跨模态哈希。非深度哈希方法使用手工设计的特征来进行哈希函数和哈希码表示的学习,其将特征提取阶段和哈希学习阶段分离开来,这样的设计会导致次优的学习结果。而深度跨模态哈希方法则将特征提取和哈希学习集成在一个框架内,这样使得这两个阶段可以相互促进,进而提高学习的质量。

在很多真实数据中,如CIFAR-100和Imagenet数据集等,数据对应的语义标签通常携带层次结构。例如,一个简单的包含三层标签的例子:“摩托车”和“卡车”都属于父类“车”,而“船”和“车”都属于父类“交通工具”。这些层次结构包含许多有用的信息,如果在学习过程中充分挖掘其中的信息,显然会提高学习的效果,进而达到提高检索精度的作用。但是,当前大部分现有技术都忽视了标签的层次信息。发明人发现,尽管有极少数方法在学习过程中尝试使用这种层次信息,这些跨模态哈希方法存在以下不足:其为标签层次结构的每一层生成分层的哈希码,并没有考虑跨层标签间的关联信息。

发明内容

为了解决现有技术的不足,本申请提供了利用标签层次信息的多媒体数据跨模态检索方法及系统;

第一方面,本申请提供了利用标签层次信息的多媒体数据跨模态检索方法;

利用标签层次信息的多媒体数据跨模态检索方法,包括:

获取待检索的第一模态多媒体数据;

对待检索的第一模态多媒体数据进行特征提取,得到第一哈希码;

将第一哈希码与预存储的第二模态的所有多媒体数据对应的已知哈希码进行距离计算;选择距离最近的若干个哈希码对应的第二模态的多媒体数据,作为检索结果输出。

第二方面,本申请提供了利用标签层次信息的多媒体数据跨模态检索系统;

利用标签层次信息的多媒体数据跨模态检索系统,包括:

获取模块,其被配置为:获取待检索的第一模态多媒体数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010771701.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top