[发明专利]一种采用双key值的高维索引结构构建方法和检索方法有效
申请号: | 201310365383.8 | 申请日: | 2013-08-21 |
公开(公告)号: | CN103514263A | 公开(公告)日: | 2014-01-15 |
发明(设计)人: | 杨丽芳;黄祥林;吕锐;王永滨 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100024 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种采用双key值的高维索引结构构建方法和检索方法。在本发明中,提出了一种采用双key值的高维到一维转换索引结构DKB-tree,它在高维空间中选取两个参考点将高维空间中的各高维向量映射为双一维key值,统一选取采用相同参考点得到的某一key值作为主key,另一key值作为辅key,每个主key都绑定一个指向其对应辅key的指针,每个辅key都绑定一个指向其对应高维向量的指针。进行检索时,通过主key实现第一层过滤,通过辅key实现再一次过滤。本发明提出的DKB-tree通过简单的双key值大小比较,大大地减少了相似度匹配的运算量,加快检索速度。 | ||
搜索关键词: | 一种 采用 key 索引 结构 构建 方法 检索 | ||
【主权项】:
一种采用双key值的高维索引结构构建方法,其特征在于具体步骤如下:1)在高维空间中选取两个参考点;2)将高维空间中的各高维向量利用高维向量与这两个参考点间的距离映射为双一维key值,统一选取该高维空间中采用相同参考点得到的某一key值作为主key,另一key值作为辅key;3)然后逐一将这些高维向量和对应的主key、辅key插入到DKB‑tree中,该DKB‑tree采用B+‑tree管理上层的主key值,B+‑tree叶子节点层的所有主key形成DKB‑tree的主key层,同时主key层的每个主key都绑定一个指向其对应辅key的指针,每个主key节点对应一个辅key节点,所有辅key形成DKB‑tree的辅key层,每个辅key都绑定一个指向其对应高维向量的指针,这些高维向量根据辅key层其对应辅key的排列顺序按序存储;插入的方法为根据待插入高维向量的主key大小定位其应插入到DKB‑tree主key层的某一节点中,根据该节点及其兄弟节点是否已满,处理的方法为:31)首先判断该节点是否已满,如果该节点未满,则直接将该主key插入到该节点中,其辅key按照主key的排列顺序插入到该节点对应的辅key节点中,待插入特征向量按照辅key的排列顺序插入到该辅key节点对应的高维向量存储位置处,并使该主key产生指向其对应辅key的指针,其对应辅key产生指向待插入高维向量的指针,更新主key所在节点对应的父节点key值;32)如果该节点已满,再判断该节点的左右兄弟节点是否存在未满的 情况,若存在,则结合其左右兄弟节点,进行待插入高维向量和其对应主key、辅key值的插入,并更新其父节点对应的key值;33)若该节点及其左右兄弟节点均满,则结合待插入高维向量的主key值,直接对该节点进行分裂,同时对该节点对应的辅key节点进行对应位置处的辅key插入和分裂,及将待插入高维向量插入到对应的高维向量存储位置处,并将分裂后新产生的主key节点插入到其父节点中,更新其父节点对应的key值,如果父节点也已满,分裂过程继续向上传递,并更新对应的父key值,直到根节点处,产生新的根节点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310365383.8/,转载请声明来源钻瓜专利网。