[发明专利]支持地理结构数据的交互式模糊搜索的高效前缀搜索算法无效
申请号: | 201180060371.3 | 申请日: | 2011-12-14 |
公开(公告)号: | CN103339624A | 公开(公告)日: | 2013-10-02 |
发明(设计)人: | 李晨;姬生乐 | 申请(专利权)人: | 加利福尼亚大学董事会;李晨;姬生乐 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汉昊知识产权代理事务所(普通合伙) 11370 | 代理人: | 罗朋 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 支持 地理 结构 数据 交互式 模糊 搜索 高效 前缀 算法 | ||
1.一种计算机实现的用于从数据集的多个记录中检索信息的方法,该方法包括:
接收来自用户或客户端应用的搜索短语,所述搜索短语具有查询关键词前缀;及
使用所述查询关键词前缀遍历多层空间树,直至结束条件发生,使用地理信息构建所述多层空间树,其具有根节点及包括多个叶子节点的多个子节点,每一叶子节点与相应的记录列表相关联,其中,至少部分所述节点分别与包括对象过滤器和子过滤器的相应混合过滤器相关联,所述对象过滤器直接指向一个或多个记录,及所述子过滤器指向一个或多个用于后续遍历步骤的子节点。
2.根据权利要求1所述的计算机实现的方法,其中,遍历所述多层空间树,每一对象过滤器包括由对应节点指示的兴趣区域中的高度选择性过滤词,使得所述过滤词指向不超过最大数量的记录,所述最大数量是预先设置的。
3.根据权利要求2所述的计算机实现方法,其中,遍历所述多层空间树,所述对象过滤器被压缩使得所述高度选择性过滤词替代多个初始过滤词被存储于所述对象过滤器中,所述高度选择性过滤词指向包括由所述多个初始过滤词指向的记录的组合数量的记录,假定所述组合数量不大于所述最大数量。
4.根据权利要求1所述的计算机实现方法,其中,遍历所述多层空间树,每一子过滤器包括兴趣区域中的选择性较低的过滤词,使得所述过滤词指向不超过最大数量的子节点,所述最大数量是预先设置的。
5.根据权利要求1所述的计算机实现方法,其中,在与相应混合过滤器相关联的每一节点处遍历所述多层空间树包括:
通过与该节点相关联的所述对象过滤器查找查询关键词前缀;及
若在所述对象过滤器中未找到所述查询关键词前缀,通过与节点相关联的所述子过滤器查找所述查询关键词前缀。
6.根据权利要求1所述的计算机实现方法,还包括:
使用通过标记数据集构建的词典索引树,对包括在每一节点的相应混合过滤器中的每一过滤词进行编码,使得所述过滤词由在所述词典索引树上的所述过滤词的开始节点和结束节点所定义的对应区间表示;及
使用所述词典索引树对所述查询关键词前缀进行编码,使得所述查询关键词由所述词典索引树上的所述查询关键词前缀的开始节点和在结束节点所定义的对应区间表示。
7.根据权利要求6所述的计算机实现方法,其中,在与相应混合过滤器相关联的每一节点处遍历所述多层空间树包括:
通过比较在所述对象过滤器中的所述查询关键词前缀的区间与过滤词的区间,来通过与该节点相关联的所述对象过滤器搜索所述查询关键词前缀;及
若在所述对象过滤器中未找到所述查询关键词前缀,通过比较在所述子过滤器中的所述查询关键词前缀的区间与过滤词的区间,来通过与节点相关联的所述子过滤器搜索所述查询关键词前缀。
8.根据权利要求7所述的计算机实现方法,其中,搜索所述查询关键词前缀,每一区间均是数值区间,及通过所述混合过滤器搜索所述查询关键词前缀包括执行二分搜索。
9.根据权利要求1所述的计算机实现方法,其中,遍历多层空间树,结束条件包括成功识别记录,及该方法还包括:
验证所识别的记录是否具有所述查询关键词前缀。
10.根据权利要求1所述的计算机实现方法,在此,多个记录的数据集包括多个关键词,及其中,遍历与所述数据集相对应的多层空间树,包含在多个记录中的每个关键词由一个关键词ID表示。
11.根据权利要求10所述的计算机实现方法,在此,在所述数据集中的每一个记录由存储包含在记录中的关键词的关键词ID的前向列表表示,其中,遍历所述多层空间树以验证一个前缀是否实际上被一条记录的任何关键词所包含,仅执行一次二分搜索。
12.根据权利要求10所述的计算机实现方法,在此,关键词的每一关键词ID是被分配给对应关键词的唯一整数,所述方法还包括:
通过标记数据集构建词典索引树;及
对所述词典索引树的每一节点进行编码,使得所述每一节点由对应于所述节点的最短关键词ID和最长关键词ID所定义的相应区间表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于加利福尼亚大学董事会;李晨;姬生乐,未经加利福尼亚大学董事会;李晨;姬生乐许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180060371.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置