[发明专利]一种高维空间数据的查询方法、装置及计算机可读介质在审
申请号: | 201611170584.2 | 申请日: | 2016-12-16 |
公开(公告)号: | CN106777131A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 崔江涛;焦文菲;冯小康;薛文卓;刘畅 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南信达专利事务所有限公司37100 | 代理人: | 李世喆 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 空间 数据 查询 方法 装置 计算机 可读 介质 | ||
技术领域
本发明涉及查询技术领域,特别涉及一种高维空间数据的查询方法、装置及计算机可读介质。
背景技术
随着多媒体数据爆炸性的增长,海量信息的检索也遇到了前所未有的挑战。由于多媒体数据多为非结构化数据,包括图像、视频和音频等,其语义信息无法直接由底层特征表达,使得传统信息检索不再适用,迫切需要发展面向多媒体数据的检索方法。
通常的做法是为多媒体数据元提取特征向量,把海量多媒体数据库上的相似性检索转化为大规模高维特征向量间的NN(Nearest Neighbor,最近邻)查询问题。给定一个查询对象,在信息库数据集中运用指定度量标准衡量特征向量间的相似性,最终找到和查询对象在特征上最接近的数据元。
然而现有技术在进行相似性查询时,是随机在存储有数据点的各个磁盘页面上进行查询,查询效率较低。
发明内容
本发明实施例提供了一种高维空间数据的查询方法、装置及计算机可读介质,以提高查询效率。
第一方面,本发明实施例提供了一种高维空间数据的查询方法,包括:
针对高维空间的每一个数据点,确定相应的Z值;
将各个数据点按照相应Z值的大小顺序,依次存储到磁盘中的磁盘页面上;
根据每一个数据点相应的Z值和存储有数据点的各个磁盘页面,建立索引表;
确定查询点,并计算所述索引表中每一个磁盘页面与所述查询点的距离;
根据所述索引表中每一个磁盘页面与所述查询点的距离,进行数据查询。
优选地,所述针对高维空间的每一个数据点,确定相应的Z值,包括:
利用下述方式确定高维空间中当前数据点p的Z值:
确定复合LSH函数G,其中,复合LSH函数G中包括m个哈希函数,m为不小于1的整数;
计算当前数据点p在复合LSH函数G下的复合哈希键K=G(p);其中,ki用于表征复合哈希键K中第i个哈希值,每一个哈希值为二进制数;
针对复合哈希键K中包括的每一个哈希值进行位交叉操作,生成当前数据点p的Z值Z(p);
利用上述确定当前数据点p的Z值的方式,确定高维空间中除当前数据点p以外的其他每一个数据点相应的Z值。
优选地,所述根据每一个数据点相应的Z值和存储有数据点的各个磁盘页面,建立索引表,包括:
在每一个磁盘页面上选择第一设定个数的数据点作为相应磁盘页面的代表数据点;
根据每一个代表数据点对应的Z值,构建B+树索引;
将所述B+树索引和存储有数据点的各个磁盘页面,构建为索引表。
优选地,
所述第一设定个数为2;
所述计算所述索引表中每一个磁盘页面与所述查询点的距离,包括:
利用第一公式计算所述索引表中当前磁盘页面与所述查询点q的距离DistPage:
所述第一公式:
其中,Zq用于表征所述查询点q对应的Z值,L和U分别为在该当前磁盘页面上选择的两个代表数据点分别对应的Z值;dist(Zq,L)用于表征Zq与L之间的距离,dist(Zq,U)用于表征Zq与U之间的距离。
优选地,
进一步包括:建立第二设定个数的索引表,以根据所述第二设定个数的索引表执行所述根据所述索引表中每一个磁盘页面与所述查询点的距离,进行数据查询的操作;
所述根据所述索引表中每一个磁盘页面与所述查询点的距离,进行数据查询,包括:
S1:将每一个索引表中距离所述查询点最近的磁盘页面,以及该磁盘页面相邻的一个磁盘页面加载到页面集中;
S2:在所述页面集中计算距离所述查询点最近的目标磁盘页面,将所述目标磁盘页面从所述页面集中取出;
S3:针对取出的所述目标磁盘页面上的各个数据点进行查询,并将所述目标磁盘页面所属索引表中与所述目标磁盘页面相邻的且未加载到所述页面集中的磁盘页面加载到所述页面集中,并继续执行S2-S3,直到S3中进行查询的目标磁盘页面为从所述页面集中取出的第NP个磁盘页面为止,其中,NP为预先设置的第三设定个数。
第二方面,本发明实施例提供了一种高维空间数据的查询装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611170584.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种索引生成方法、数据检索方法和装置
- 下一篇:数据处理方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置