[发明专利]一种键值数据库内布隆过滤器的配置方法有效

专利信息
申请号: 201711042747.3 申请日: 2017-11-17
公开(公告)号: CN107729535B 公开(公告)日: 2020-01-03
发明(设计)人: 李永坤;张月明;张伟韬;吕敏;许胤龙 申请(专利权)人: 中国科学技术大学
主分类号: G06F16/172 分类号: G06F16/172;G06F16/2455
代理公司: 34101 安徽省合肥新安专利代理有限责任公司 代理人: 汪祥虬
地址: 230026 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 键值 数据 库内 过滤器 配置 方法
【说明书】:

发明公开了一种键值数据库内布隆过滤器配置方法,特征是包括布隆过滤器相关参数设置步骤,生成适应性布隆过滤器步骤,多级缓存队列初始化步骤,多级缓存队列参数调整策略设置步骤,查询策略调整步骤;本发明能够根据工作负载的特征,动态调整布隆过滤器的配置情况;本发明与传统方法相比,在进行查询操作时,对于访问频率较高的文件元数据来说,进行查询判断时,多个布隆过滤器同时进行判断,从而减少了布隆过滤器误报带来的硬盘输入/输出操作;对于访问频率较低的元数据来说,其对应的布隆过滤器个数较少,相应的内存资源占用相对于传统技术也就越低;降低了内存开销,提高了读性能,系统整体的吞吐量得到提升。

技术领域

本发明属于计算机数据存储技术领域,具体涉及采用日志合并树的键值数据库内布隆过滤器的配置方法。

背景技术

在数据存储系统中,读性能是一个重要指标,键值存储系统往往采用基于日志合并树(Log-Structured-Merge-tree)的系统结构。在现代存储领域中,由于数据量急剧增加,键值存储系统通常采用布隆过滤器(bloomfilter)来避免读操作引发过多的硬盘输入/输出(I/O)操作,以提高读性能。美国计算机协会出版的《1970年ACMCACM国际期刊》(CommunicationsoftheACM 1970年7月第13卷,问题7,第422-426页)所介绍的布隆过滤器(Space/timetrade-offs in hash codingwith allowable errors)是现代键值存储系统(如LevelDB,RocksDB)最常用的技术。现有的方法是每个文件只对应一个固定误报率的布隆过滤器,内存资源消耗固定,无法动态调整,当数据量较大时,需要进行读取的操作较多,为了避免布隆过滤器发生过多的误报操作,必须使用空间占用较大的布隆过滤器,因此内存开销较大,否则会因为布隆过滤器的误报率较高导致很差的读性能。另外,美国计算机协会出版的《2001年Usenix技术年会论文集》(GeneralTrack:UsenixTechnicalConference2001年第91-104页)所介绍的多级缓存队列(Multi-Queue)对冷热数据区分度良好,使得服务器端缓存表现出较好的性能;但由于其原本应用于网络服务器中,缓存数据的具体替换算法不能直接应用到键值存储系统中。

发明内容

本发明的目的是提出一种键值存储系统内布隆过滤器的配置方法,以克服现有技术的上述缺陷,在内存资源受限的情况下,对键值存储系统内布隆过滤器的配置进行动态调整,最大程度地减少由布隆过滤器误报引发的磁盘I/O(输入/输出)操作,合理利用内存资源,提高读性能。

本发明键值存储系统内布隆过滤器的配置方法,其特征在于包括以下步骤:

第一步:设置布隆过滤器相关参数

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711042747.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top