[发明专利]一种高维空间数据的查询方法、装置及计算机可读介质在审

专利信息
申请号: 201611170584.2 申请日: 2016-12-16
公开(公告)号: CN106777131A 公开(公告)日: 2017-05-31
发明(设计)人: 崔江涛;焦文菲;冯小康;薛文卓;刘畅 申请(专利权)人: 西安电子科技大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 济南信达专利事务所有限公司37100 代理人: 李世喆
地址: 710071 陕*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 空间 数据 查询 方法 装置 计算机 可读 介质
【说明书】:

技术领域

发明涉及查询技术领域,特别涉及一种高维空间数据的查询方法、装置及计算机可读介质。

背景技术

随着多媒体数据爆炸性的增长,海量信息的检索也遇到了前所未有的挑战。由于多媒体数据多为非结构化数据,包括图像、视频和音频等,其语义信息无法直接由底层特征表达,使得传统信息检索不再适用,迫切需要发展面向多媒体数据的检索方法。

通常的做法是为多媒体数据元提取特征向量,把海量多媒体数据库上的相似性检索转化为大规模高维特征向量间的NN(Nearest Neighbor,最近邻)查询问题。给定一个查询对象,在信息库数据集中运用指定度量标准衡量特征向量间的相似性,最终找到和查询对象在特征上最接近的数据元。

然而现有技术在进行相似性查询时,是随机在存储有数据点的各个磁盘页面上进行查询,查询效率较低。

发明内容

本发明实施例提供了一种高维空间数据的查询方法、装置及计算机可读介质,以提高查询效率。

第一方面,本发明实施例提供了一种高维空间数据的查询方法,包括:

针对高维空间的每一个数据点,确定相应的Z值;

将各个数据点按照相应Z值的大小顺序,依次存储到磁盘中的磁盘页面上;

根据每一个数据点相应的Z值和存储有数据点的各个磁盘页面,建立索引表;

确定查询点,并计算所述索引表中每一个磁盘页面与所述查询点的距离;

根据所述索引表中每一个磁盘页面与所述查询点的距离,进行数据查询。

优选地,所述针对高维空间的每一个数据点,确定相应的Z值,包括:

利用下述方式确定高维空间中当前数据点p的Z值:

确定复合LSH函数G,其中,复合LSH函数G中包括m个哈希函数,m为不小于1的整数;

计算当前数据点p在复合LSH函数G下的复合哈希键K=G(p);其中,ki用于表征复合哈希键K中第i个哈希值,每一个哈希值为二进制数;

针对复合哈希键K中包括的每一个哈希值进行位交叉操作,生成当前数据点p的Z值Z(p);

利用上述确定当前数据点p的Z值的方式,确定高维空间中除当前数据点p以外的其他每一个数据点相应的Z值。

优选地,所述根据每一个数据点相应的Z值和存储有数据点的各个磁盘页面,建立索引表,包括:

在每一个磁盘页面上选择第一设定个数的数据点作为相应磁盘页面的代表数据点;

根据每一个代表数据点对应的Z值,构建B+树索引;

将所述B+树索引和存储有数据点的各个磁盘页面,构建为索引表。

优选地,

所述第一设定个数为2;

所述计算所述索引表中每一个磁盘页面与所述查询点的距离,包括:

利用第一公式计算所述索引表中当前磁盘页面与所述查询点q的距离DistPage:

所述第一公式:

其中,Zq用于表征所述查询点q对应的Z值,L和U分别为在该当前磁盘页面上选择的两个代表数据点分别对应的Z值;dist(Zq,L)用于表征Zq与L之间的距离,dist(Zq,U)用于表征Zq与U之间的距离。

优选地,

进一步包括:建立第二设定个数的索引表,以根据所述第二设定个数的索引表执行所述根据所述索引表中每一个磁盘页面与所述查询点的距离,进行数据查询的操作;

所述根据所述索引表中每一个磁盘页面与所述查询点的距离,进行数据查询,包括:

S1:将每一个索引表中距离所述查询点最近的磁盘页面,以及该磁盘页面相邻的一个磁盘页面加载到页面集中;

S2:在所述页面集中计算距离所述查询点最近的目标磁盘页面,将所述目标磁盘页面从所述页面集中取出;

S3:针对取出的所述目标磁盘页面上的各个数据点进行查询,并将所述目标磁盘页面所属索引表中与所述目标磁盘页面相邻的且未加载到所述页面集中的磁盘页面加载到所述页面集中,并继续执行S2-S3,直到S3中进行查询的目标磁盘页面为从所述页面集中取出的第NP个磁盘页面为止,其中,NP为预先设置的第三设定个数。

第二方面,本发明实施例提供了一种高维空间数据的查询装置,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611170584.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top