[发明专利]一种基于拉链信息的索引存储管理方法有效
申请号: | 201310070282.8 | 申请日: | 2013-03-06 |
公开(公告)号: | CN103116652A | 公开(公告)日: | 2013-05-22 |
发明(设计)人: | 陈琳;汤汨宝;夏冬;王奎 | 申请(专利权)人: | 同方知网(北京)技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 刘黎明 |
地址: | 100084 北京市海淀区清华园清华*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 拉链 信息 索引 存储 管理 方法 | ||
技术领域
本发明涉及数据库、信息检索领域,尤其涉及一种基于拉链信息的索引存储管理方法。
背景技术
Web的出现极大地推动了数据库系统的研究,同时,一般信息检索领域的各种技术也在Web信息检索中获得新生,对信息检索、数据库系统以及Web本身的研究正在以多种方式进行融合。如何快速地从存储的大量数据中找满足用户需求的信息已经成为数据库和信息检索领域研究的新热点。
在数据库系统中,通常使用索引来协助快速查询,提高数据库表数据访问速度。一般来说,数据库存储的基本单位是页,存储信息的物理文件分配的磁盘空间可以从逻辑上划分成页,磁盘I/O操作在页级执行。当为一张空表创建索引时,数据库系统将分配一个索引页,该索引页在插入数据前一直是空的。此页此时既是根结点,也是叶结点。当往表中插入一行数据,数据库系统即向此根结点中插入一行索引记录。当根结点满时,数据库系统大抵按以下步骤进行分裂:
1、创建两个儿子结点。
2、将原根节结中的数据近似地拆成两半,分别写入新的两个儿子结点。
3、根结点中加上指向两个儿子结点的指针。
通常状况下,由于索引记录仅包含索引字段值(以及4-9字节的指针),索引实体比真实的数据行要小许多,因此,索引页相较数据页来说要密集许多。一个索引页可以存储数量更多的索引记录,这意味着在索引中查找时,在I/O上占很大的优势。
目前,数据库索引的数据结构主要是基于B-树及其变种。B树是一种性能很高的外存多路查找树,具有平衡,层数较少等优点,适用于系统对大块数据的读写优化。在插入数据时,B树会对节点进行检测,通过及时调整,使之达到平衡。一般来说,基于B树的索引的物理文件组织包括B树文件和数据文件,索引的逻辑类型包括以下两类:
1、聚集索引,表数据按照索引的顺序来存储。对于聚集索引,叶子结点即是数据页,不再有另外单独的数据文件。相对于非聚集索引来说,它插入数据的速度较慢,时间主要花费在“物理存储的排序”上,但查询数据时速度较快,因为数据都存储在同一棵B树里。
2、非聚集索引,表数据存储顺序与索引顺序无关。对于非聚集索引,叶结点是由索引页组成,包含索引字段值及指向数据块的逻辑指针。
然而,目前的索引存储方案也存在着一些缺陷,主要是更新索引时,由于插入的数据对应的键在B树中可能已存在,这时如果直接更新物理数据文件,需要先找到该键对应的数据块在文件中的位置,然后在文件内部追加写入数据。但是,目前写入文件操作只支持在文件尾部追加写入,因此该操作需要重新排放文件内已有的数据页,将新加入的数据写入恰当的位置,导致文件碎片较多,降低了数据更新和查询的性能。而过多的文件碎片会使系统在读文件的时候来回寻找,引起系统性能下降,严重的话还可能导致存储文件的丢失。
发明内容
为解决上述中存在的问题与缺陷,本发明提供了一种基于拉链信息的索引存储管理方法。所述技术方案如下:
一种基于拉链信息的索引存储管理方法,所述索引的物理文件组织包括:B树索引文件、拉链文件和数据文件;所述方法包括:
A根据键值对将数据写入数据文件;
B根据写入的数据信息构造拉链信息块;
C判断插入的数据键值对在B树中是否存在,并相应地更新B树文件和拉链信息文件。
本发明提供的技术方案的有益效果是:
在物理文件设计上添加了拉链文件,在索引存储的逻辑处理中,基于拉链信息项进行数据操作,为数据的高效插入、更新和查询提供了支持,提高了数据处理性能。
附图说明
图1是基于拉链信息的索引存储管理方法流程图;
图2是基于拉链信息的索引的存储架构图;
图3是基于拉链信息的索引存储管理方法的实现流程图;
图4是基于拉链信息的索引存储管理方法的查询流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述:
参见图1,为基于拉链信息的索引存储管理方法流程,所述索引的物理文件组织包括:B树索引文件、拉链文件和数据文件;所述方法包括以下步骤:
步骤10根据键值对将数据写入数据文件;
根据新的键值对,将数据写入数据文件,同时记录当前写入数据在数据文件中的偏移量offset、数据长度datasize及数据的个数num。
步骤20根据写入的数据信息构造拉链信息块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同方知网(北京)技术有限公司,未经同方知网(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310070282.8/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置