[发明专利]存储高效、更新优化的事务型全文索引视图维护的方法和系统有效
申请号: | 201380050962.1 | 申请日: | 2013-09-20 |
公开(公告)号: | CN104854582B | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | E·C·比歇;P·普列沙奇科夫;S·权;S·黄 | 申请(专利权)人: | EMC公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 张金金;姜甜 |
地址: | 美国麻*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存储 高效 更新 优化 事务 全文 索引 视图 维护 方法 系统 | ||
1.一种维护数据库中所存储的元素的索引的计算机实现的方法,在基于查询的、全文搜索环境中使用,该方法包括:
采用所述数据库的原始索引将删除的元素列入黑名单,其中所述黑名单被表示为指示所述数据库中每个元素的黑名单状态的黑名单位图,所述黑名单位图包括具有位序列的数据结构,每个位被分配布尔值,其中第一布尔值表示元素在所述黑名单中存在,第二布尔值表示元素在所述黑名单中不存在;
在采用原始索引将删除的元素列入黑名单之后,将所述原始索引划分为多个较小的索引;
在所述多个较小索引中的至少一个以及所述原始索引上执行查询。
2.如权利要求1所述的方法,其中所述元素包括搜索引擎可搜索的文档。
3.如权利要求1所述的方法,其中所述黑名单位图使用与所述数据库的原始索引中的每个元素关联的数字文档标识符。
4.如权利要求3所述的方法,其中每个数字文档标识符定义用于所述黑名单位图的映射。
5.如权利要求2所述的方法,其中所述数据结构进一步包括根据多个日志序号所组织的事务。
6.如权利要求5所述的方法,其中所述日志序号按照升序被分配并被实现为日志记录的逻辑地址,其中所述日志记录被创建以跟踪由事务所做出的变化。
7.一种用于维护数据库中所存储的元素的索引的系统,在基于查询的、全文搜索环境中使用,该系统包括:
基于处理器的数据库管理系统,在计算机上被执行并被配置为:
采用所述数据库的原始索引将删除的元素列入黑名单,其中所述黑名单被表示为指示所述数据库中每个元素的黑名单状态的黑名单位图,所述黑名单位图包括具有位序列的数据结构,每个位被分配布尔值,其中第一布尔值表示元素在所述黑名单中存在,第二布尔值表示元素在所述黑名单中不存在;
在采用原始索引将删除的元素列入黑名单之后,将所述原始索引划分为多个较小的索引;
在所述多个较小索引中的至少一个以及所述原始索引上执行查询。
8.如权利要求7所述的系统,其中所述元素包括搜索引擎可搜索的文档。
9.如权利要求7所述的系统,其中所述黑名单位图使用与所述数据库的原始索引中的每个元素关联的数字文档标识符。
10.如权利要求9所述的系统,其中每个数字文档标识符定义用于所述黑名单位图的映射。
11.如权利要求8所述的系统,其中所述数据结构进一步包括根据多个日志序号所组织的事务。
12.如权利要求11所述的系统,其中所述日志序号按照升序被分配并被实现为日志记录的逻辑地址,其中所述日志记录被创建以跟踪由事务所做出的变化。
13.一种包含有计算机可读程序代码的非瞬态计算机可读介质,所述计算机可读程序代码适合被一个或多个处理器执行以实现方法,该方法包括:
采用数据库的原始索引将删除的元素列入黑名单,其中所述黑名单被表示为指示所述数据库中每个元素的黑名单状态的黑名单位图,所述黑名单位图包括具有位序列的数据结构,每个位被分配布尔值,其中第一布尔值表示元素在所述黑名单中存在,第二布尔值表示元素在所述黑名单中不存在;
在采用原始索引将删除的元素列入黑名单之后,将所述原始索引划分为多个较小的索引;
在所述多个较小索引中的至少一个以及所述原始索引上执行查询。
14.如权利要求13所述的非瞬态计算机可读介质,其中所述元素包括搜索引擎可搜索的文档。
15.如权利要求14所述的非瞬态计算机可读介质,其中所述黑名单位图使用与所述数据库的原始索引中的每个元素关联的数字文档标识符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于EMC公司,未经EMC公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380050962.1/1.html,转载请声明来源钻瓜专利网。