[发明专利]检索装置、终端和检索方法有效
申请号: | 201210501917.0 | 申请日: | 2012-11-29 |
公开(公告)号: | CN103853742B | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 童征宇;殷宇翔 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京友联知识产权代理事务所(普通合伙)11343 | 代理人: | 尚志峰,汪海屏 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索 装置 终端 方法 | ||
1.一种检索装置,其特征在于,包括:
获取单元,用于在接收到输入的检索项之后,获取包含所述检索项的文档;
筛选单元,用于统计每一所述文档的预判权重值,根据所述预判权重值从包含所述检索项的文档中筛选出预设数量的初选文档;
检索结果确定单元,用于读取所述检索项在每一所述初选文档中的位置数据,根据所述位置数据计算位置相关度,将所述位置相关度满足预设条件的初选文档作为检索结果。
2.根据权利要求1所述的检索装置,其特征在于,所述筛选单元包括:
属性确定子单元,用于获取所述包含所述检索项的文档中每一文档的属性;
预判权重值确定子单元,用于对所述属性进行计算,得到所述预判权重值。
3.根据权利要求2所述的检索装置,其特征在于,所述预判权重值确定子单元用于基于所述检索项在相应文档中的出现频率和/或所述检索项在所有文档中的逆向文件频率和/或所述相应文档的权重,确定所述相应文档的预判权重值。
4.根据权利要求3所述的检索装置,其特征在于,所述预判权重值确定子单元用于按照预判函数计算出所述相应文档的预判权重值P,其中,n是所述检索项的数量,TFi是第i个所述检索项在所述相应文档中的出现频率,IDFi是第i个所述检索项在所述所有文档中的逆向文件频率,W是文档权重。
5.根据权利要求3所述的检索装置,其特征在于,所述预判权重值确定子单元用于按照预判函数计算出所述相应文档的预判权重值P,其中,n是所述检索项的数量,TFi是第i个所述检索项在所述相应文档中的出现频率,W是文档权重。
6.根据权利要求1至5中任一项所述的检索装置,其特征在于,所述检索装置还包括:设置单元,设置应统计所述预判权重值的文档数量;
所述筛选单元还用于从已统计过所述预判权重值的文档中筛选出所述初选文档,根据所述预判权重值的大小对所述已统计过所述预判权重值的文档进行排序,从排序结果中按照预设比例选取出所述初选文档。
7.根据权利要求6所述的检索装置,其特征在于,所述检索结果确定单元还用于按照文档的标识序号对所述初选文档进行排序,并采用数据指针方式读取所述位置数据。
8.一种终端,其特征在于,包括如权利要求1至7中任一项所述的检索装置。
9.一种检索方法,其特征在于,包括:
在接收到输入的检索项之后,获取包含所述检索项的文档;
统计每一所述文档的预判权重值,根据所述预判权重值从包含所述检索项的文档中筛选出预设数量的初选文档;
读取所述检索项在每一所述初选文档中的位置数据,根据所述位置数据计算位置相关度,将所述位置相关度满足预设条件的初选文档作为检索结果。
10.根据权利要求9所述的检索方法,其特征在于,所述预判权重值的统计过程包括:
确定所述包含所述检索项的文档中每一文档的属性;
对所述属性进行计算,得到所述预判权重值。
11.根据权利要求10所述的检索方法,其特征在于,基于所述检索项在相应文档中的出现频率和/或所述检索项在所有文档中的逆向文件频率和/或所述相应文档的权重进行计算,确定所述相应文档的预判权重值。
12.根据权利要求11所述的检索方法,其特征在于,按照预判函数计算出所述相应文档的预判权重值P,其中,n是所述检索项的数量,TFi是第i个所述检索项在所述相应文档中的出现频率,IDFi是第i个所述检索项在所述所有文档中的逆向文件频率,W是文档权重。
13.根据权利要求11所述的检索方法,其特征在于,按照预判函数计算出所述相应文档的预判权重值P,其中,n是所述检索项的数量,TFi是第i个所述检索项在所述相应文档中的出现频率,W是文档权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司,未经北大方正集团有限公司;北京方正阿帕比技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210501917.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:角度分辨的雷达传感器
- 下一篇:具有防过满装置的折叠片材分配器