[发明专利]用于评估数据库的分区方案的方法和装置有效
申请号: | 201210102386.8 | 申请日: | 2012-03-30 |
公开(公告)号: | CN103365923B | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 曹逾;陈继东;郭小燕 | 申请(专利权)人: | 伊姆西公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;李峥宇 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 评估 数据库 分区 方案 方法 装置 | ||
1.一种用于评估数据库的分区方案的方法,包括:
加载描述数据库的数据文件以及定义要针对所述数据库执行的操作的工作负载;
解译所述数据库的分区方案以形成分区信息;
基于所述分区信息,对所述数据库执行定义操作的所述工作负载中的至少一部分以获得统计日志,包括:
基于所述数据库和所述分区信息,构建按照所述分区方案进行分区后的所述数据库的伪表,所述伪表存储描述按照所述数据库分区方案进行划分后的数据库的信息并提供在所述工作负载中的所述操作的估计的开销,所述伪表至少包括有关数据放置的信息、有关所述分区方案中的分区键的信息、以及所述数据库中主键;以及
在不真正执行所述工作负载中的操作的情况下基于所述伪表获得估计的所述开销,以及基于估计的所述开销以获得所述统计日志;以及
基于所述统计日志,按照评估标准来评估所述数据库分区方案。
2.根据权利要求1所述的方法,其中所述分区信息包括以下至少任一项:分区键、查找表以及系统配置。
3.根据权利要求1所述的方法,还包括:在加载所述数据文件以及定义操作的所述工作负载之前,针对所述数据文件和/或定义操作的所述工作负载进行压缩。
4.根据权利要求1所述的方法,其中基于所述分区信息、对所述数据库执行所述工作负载中定义的至少一部分操作以获得统计日志还包括,通过实际执行来获得所述统计日志。
5.根据权利要求4所述的方法,其中所述实际执行包括:
将所述数据库部署至分区节点;
将定义操作的所述工作负载中的操作路由至相应的分区节点并执行所述操作;以及
在执行期间记录所述统计日志。
6.根据权利要求1所述的方法,其中所述评估标准包括以下至少一项:数据分布、工作负载分布、分布式事务的数量以及重分区数据迁移、执行时间、响应时间、单位时间内执行的工作负载。
7.根据权利要求1所述的方法,其中所述数据库分区方案包括预定义的分区方案以及自定义的分区方案。
8.根据权利要求1所述的方法,其中描述所述数据库的所述数据文件是数据库实例和/或纯文本文件。
9.根据权利要求1所述的方法,还包括:调整所述数据库分区方案的设置以获得新的分区方案。
10.一种用于评估数据库的分区方案的装置,包括:
加载装置,配置用于加载描述数据库的数据文件以及定义要针对所述数据库执行的操作的工作负载;
解译装置,配置用于解译所述数据库的分区方案以形成分区信息;
执行装置,配置用于基于所述分区信息,对所述数据库执行定义操作的所述工作负载中的至少一部分以获得统计日志,包括:
构建装置,配置用于基于所述数据库和所述分区信息,构建按照所述数据库分区方案进行分区后的所述数据库的伪表,所述伪表存储描述按照所述数据库分区方案进行划分后的数据库的信息并提供在所述工作负载中的所述操作的估计的开销,所述伪表至少包括有关数据放置的信息、有关所述分区方案中的分区键的信息、以及所述数据库中主键;以及
获得装置,配置用于在不真正执行所述工作负载中的操作的情况下基于所述伪表获得估计的所述开销,以及基于估计的所述开销以获得所述统计日志;以及
评估装置,配置用于基于所述统计日志,按照评估标准来评估所述数据库分区方案。
11.根据权利要求10所述的装置,其中所述分区信息包括以下至少任一项:分区键、查找表以及系统配置。
12.根据权利要求10所述的装置,还包括:压缩装置,配置用于在加载所述数据文件以及定义操作的所述工作负载之前针对所述数据文件和/或所述工作负载进行压缩。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西公司,未经伊姆西公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210102386.8/1.html,转载请声明来源钻瓜专利网。