[发明专利]一种分布式实时全文检索方法及系统在审
申请号: | 201610143061.2 | 申请日: | 2016-03-14 |
公开(公告)号: | CN105740472A | 公开(公告)日: | 2016-07-06 |
发明(设计)人: | 周志阳;孙毓忠;宋莹 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F12/123 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 实时 全文 检索 方法 系统 | ||
1.一种分布式实时全文检索方法,其特征在于,包括:
步骤1,索引分发服务器向索引节点服务器发送源数据并请求建立索引,由所述索引节点服务器为所述源数据建立对应的索引数据,将所述索引数据存入本地缓存并备份至分布式文件系统;
步骤2,搜索分发服务器根据用户的查询语句,分发查询指令到各搜索节点服务器,所述搜索节点服务器在所述本地缓存及所述分布式文件系统中查询与所述查询语句对应的查询数据并将查询结果返回给所述搜索分发服务器,同时修改所述查询数据的热度值;
其中,当所述查询数据存在于所述本地缓存且其热度值低于规定值时,将所述查询数据从所述本地缓存中删除,当所述查询数据存在于所述分布式文件系统且其热度值高于规定值时,将所述查询数据添加到所述本地缓存中。
2.根据权利要求1所述的分布式实时全文检索方法,其特征在于,还包括:
步骤3,当所述查询数据既不存在于所述本地缓存也不存在于所述分布式文件系统中时,通知所述索引分发服务器需要建立索引,并跳到所述步骤1。
3.根据权利要求1所述的分布式实时全文检索方法,其特征在于,
所述步骤1还包括:
步骤11,所述索引节点服务器判断接收到的所述源数据所对应的索引数据是否已存在,若存在,则通知所述索引节点服务器,若不存在,则在本地缓存中为所述源数据建立对应的索引数据,建立完毕后备份到分布式文件系统上,然后向分发服务器汇报索引建立完毕;
步骤12,所述索引节点服务器与所述搜索节点服务器通讯,检查所建立的索引数据的使用频率,利用LRU算法管理所述本地缓存中的索引数据和所述分布式文件系统上备份的索引数据。
4.根据权利要求1或2所述的分布式实时全文检索方法,其特征在于,
所述步骤2还包括:
步骤21,所述搜索节点服务器收到所述查询指令后,先查询所述本地缓存中是否存在所述查询数据,若存在,则将查询结果返回所述给搜索分发服务器,同时修改所述查询数据的热度值,若不存在,则执行步骤22;
步骤22,所述搜索节点服务器查询所述分布式文件系统中是否存在所述查询数据,若存在,则将查询结果返回所述给搜索分发服务器,并异步非阻塞式所述本地缓存中的相应的索引数据,修改其热度值,若不存在,则执行所述步骤3。
5.根据权利要求1~3中任一项所述的分布式实时全文检索方法,其特征在于,
所述分布式搜索服务器规约各索引节点服务器和各搜索节点服务器的搜索结果。
6.一种分布式实时全文检索系统,其特征在于,包括:
一索引分发服务器,用于发送源数据并请求建立索引,
多个索引节点服务器,用于接收所述索引分发服务器发送的源数据和请求,为所述源数据建立对应的索引数据,将所述索引数据存入本地缓存并备份至分布式文件系统;
一搜索分发服务器,用于根据用户的查询语句,分发查询指令;
多个搜索节点服务器,用于接收所述搜索分发服务器发送的所述查询指令,并在所述本地缓存及所述分布式文件系统中查询与所述查询语句对应的查询数据并将查询结果返回给所述搜索分发服务器,同时修改所述查询数据的热度值;
其中,当所述查询数据存在于所述本地缓存且其热度值低于规定值时,将所述查询数据从所述本地缓存中删除,当所述查询数据存在于所述分布式文件系统且其热度值高于规定值时,将所述查询数据添加到所述本地缓存中。
7.根据权利要求6所述的分布式实时全文检索系统,其特征在于,
当所述查询数据既不存在于所述本地缓存也不存在于所述分布式文件系统中时,所述搜索节点服务器还用于,通知所述索引分发服务器需要建立索引。
8.根据权利要求6所述的分布式实时全文检索系统,其特征在于,
所述索引节点服务器还用于,
判断接收到的所述源数据所对应的索引数据是否已存在,若存在,则通知所述索引节点服务器,若不存在,则在本地缓存中为所述源数据建立对应的索引数据,建立完毕后备份到分布式文件系统上,然后向分发服务器汇报索引建立完毕;
与所述搜索节点服务器通讯,检查所建立的索引数据的使用频率,利用LRU算法管理所述本地缓存中的索引数据和所述分布式文件系统上备份的索引数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610143061.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:差速器中的导轨
- 下一篇:一种让网页醒目易读的方法