[发明专利]用于评估数据库的分区方案的方法和装置有效
申请号: | 201210102386.8 | 申请日: | 2012-03-30 |
公开(公告)号: | CN103365923B | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 曹逾;陈继东;郭小燕 | 申请(专利权)人: | 伊姆西公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;李峥宇 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 评估 数据库 分区 方案 方法 装置 | ||
本发明的各实施方式涉及用于评估数据库的分区方案的方法和装置。具体地,提供了一种用于评估数据库的分区方案的方法,包括:加载描述数据库的数据文件以及定义针对数据库执行的操作的工作负载;解译数据库的分区方案以形成分区信息;基于分区信息,对数据库执行工作负载中定义的至少一部分操作以获得统计日志;以及基于统计日志,根据评估标准来评估分区方案。在另一实施方式中,提供了一种用于评估数据库的分区方案的装置。
技术领域
本发明的各实施方式涉及数据库系统,更具体地,涉及用于评估数据库的分区方案的方法、装置和相关计算机程序产品。
背景技术
计算机技术的发展为人们的工作和生活提供了诸多便利,越来越多的数据采用数字化方式在数据库中存储和管理。在提供方便的同时,长期以来如何以更有效的方式存储和管理这些数据一直是数据库领域的研究重点。
为了改进数据库应用的性能,在需要管理的数据规模越来越大并且数据库应用越来越复杂的情况下,为了提高数据库系统的扩展性、可用性和可管理性、并提高数据库应用的性能,目前已经针对事务型(transactional)应用和分析型(analytical)应用开发了数据库分区(database partitioning)技术。多数主要的数据库提供商(诸如,和等)已经提出了支持数据库分区的解决方案。并且目前已经提出了多种数据库分区算法,例如,round-robin算法、基于范围的算法以及哈希算法等,这些算法已经广泛应用于数据库的各种分区方案。另外,已经提出了针对特殊需求而定制的更加灵活的数据库分区方案,例如Dynamo系统的一致性哈希方案,针对社交网络的OneHop方案等。
面临各种可供选择的数据库分区方案,数据库管理员(DBA)难以辨别应当选择何种分区方案。在选择数据库分区方案时,数据库管理员通常需要考虑多项因素,例如分区键的选择、数据分区算法、数据放置策略、数据库的重分区、实现复杂性,等等。面临大量备选分区方案,数据库管理员如何选择适当的分区方案以实现性能优良的数据库,这成为一项亟待解决的问题。
尽管目前某些数据库的提供商开发了用于评估数据库分区方案的辅助工具,然而这些工具普遍存在诸多缺陷。例如,现有辅助工具通常仅向用户推荐单一的分区方案,然而并不描述使用该分区方案的优势或者效果;在比较各个分区方案的性能时,现有辅助工具通常基于计划开销估计来进行预测,难以保障准确性;并且现有辅助工具仅仅考虑数量有限的数据库分区方案,用户并不能利用辅助工具来评估自定义的分区方案;另外现有工具普遍是针对特定的数据库管理系统开发的,不具备兼容性。
发明内容
因而,期望提供一种能够对数据库分区方案进行评估、并能够清晰地比较不同数据库分区方案在不同方面性能优劣的方法,以便降低选择分区方案时的大量人力和物力投入;并且,还期望提供一种可以跨越不同数据库管理系统使用的兼容的评估工具。为此,本发明的各个实施方式提供了一种于评估数据库的分区方案的方法、装置和计算机程序产品。
在本发明的一个实施方式中,提供了一种用于评估数据库的分区方案的方法。该方法包括:加载描述数据库的数据文件以及定义针对数据库执行的操作的工作负载;解译数据库的分区方案以形成分区信息;基于分区信息,对数据库执行工作负载中定义的至少一部分操作以获得统计日志;以及基于统计日志,根据评估标准来评估分区方案。
在本发明的一个实施方式中,分区信息至少包括:分区键、查找表以及系统配置。
在本发明的一个实施方式中,在加载描述数据库的数据文件以及定义针对数据库执行的操作的工作负载之前还包括:针对数据文件和/或工作负载进行压缩。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西公司,未经伊姆西公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210102386.8/2.html,转载请声明来源钻瓜专利网。