[发明专利]一种云环境中的文本索引在线更新方法有效
| 申请号: | 201010554536.X | 申请日: | 2010-11-19 | 
| 公开(公告)号: | CN102004778A | 公开(公告)日: | 2011-04-06 | 
| 发明(设计)人: | 王建民;丁贵广;张君 | 申请(专利权)人: | 清华大学 | 
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 | 
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 罗文群 | 
| 地址: | 100084*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 环境 中的 文本 索引 在线 更新 方法 | ||
1.一种云环境中的文本索引在线更新方法,其特征在于该方法包括以下步骤:
(1)在用户向文本检索系统添加、删除或更新文件后,将该文件的识别信息发送至索引模块;索引模块根据文本检索系统中定义的索引切分规则,对接收的识别信息进行判断,确定该文件所属的索引片,并为该文件创建一个与该索引片相对应的增量数据;索引模块将该增量数据缓存,并对相同索引片的多次添加、删除或更新产生的增量数据合并;当用户结束添加、删除或更新操作后,索引模块将所有的索引片增量数据上传到共享文件系统中;索引模块向文本检索系统中的集群主节点发出索引片更新命令,该命令中包括:每个被更新索引片的名称、增量类型、增量的存储路径;
(2)文本检索系统中的索引锁管理器为每个索引片建立一个锁申请队列;文本检索系统中的集群主节点接收上述索引片更新命令后,向文本检索系统中的索引锁管理器申请被更新索引片的锁;索引锁管理器根据被更新索引片的名称将本更新操作加入到与被更新索引片相对应的锁申请队列中,并依次将锁赋予申请队列中的更新操作;当更新操作获得被更新索引片的锁后,文本检索系统中的集群主节点根据存储的索引部署状态信息,确定集群中持有被更新索引片的所有子节点;文本检索系统中的集群主节点向持有被更新索引片的所有子节点询问当前的负载情况,并根据各子节点负载的大小进行排序,将其中一半负载较低的节点作为首批更新的节点,剩余节点作为次批更新的节点;
(3)文本检索系统中的集群主节点在索引片检索服务分布状态中,将首批节点提供的基于被更新索引片的检索服务标记为中止,并向首批节点发出索引片更新命令,该更新命令中包括:被更新索引片的名称、增量类型、增量的存储路径;
(4)首批节点接收到上述索引片更新命令后,停止本节点提供的基于被更新索引片的检索服务,并根据上述被更新索引片的增量的存储路径,从上述共享文件系统上读取相应的增量数据,根据增量类型,将增量数据合并到本节点持有的被更新索引片中;更新完成后,首批节点启用被更新索引片在本节点的检索服务,并将更新完成的信息发送至主节点;
(5)文本检索系统中的集群主节点接收首批节点发送的更新完成信息后,根据用户设定的索引服务切换条件,当设定数量的子节点的更新操作完成后,在索引片检索服务分布状态中,将首批节点提供的基于被更新索引片的检索服务标记为中止,并将次批节点提供的基于被更新索引片的检索服务标记为启用,并向次批节点发出索引片更新命令,该更新命令中包括:被更新索引片的名称、增量类型、增量的存储路径;
(6)次批节点接收到上述索引片更新命令后,停止本节点提供的基于被更新索引片的检索服务,并根据上述被更新索引片的增量的存储路径,从上述共享文件系统上读取相应的增量数据,根据增量类型,将增量数据合并到本节点持有的被更新索引片中;更新完成后,次批节点启用被更新索引片在本节点的检索服务,并将更新完成的信息发送至主节点;
(7)文本检索系统中的集群主节点接收次批节点发送的更新完成信息后,在索引片检索服务分布状态中,将所有已完成更新操作的子节点提供的基于被更新索引片的检索服务标记为启用;当所有子节点都完成更新操作后,集群主节点向索引锁管理器释放锁,完成此次更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010554536.X/1.html,转载请声明来源钻瓜专利网。





