[发明专利]一种面向非等值连接负载的数据生成方法及生成系统有效
| 申请号: | 202010053458.9 | 申请日: | 2020-01-17 |
| 公开(公告)号: | CN111240988B | 公开(公告)日: | 2021-07-27 |
| 发明(设计)人: | 张蓉;李宇明 | 申请(专利权)人: | 华东师范大学 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36 |
| 代理公司: | 上海德禾翰通律师事务所 31319 | 代理人: | 陈艳娟 |
| 地址: | 200241 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 等值 连接 负载 数据 生成 方法 系统 | ||
1.一种面向非等值连接负载的数据生成方法,其特征在于,包括以下步骤:
步骤一:查询实例化,根据给定的数据库结构,以及每个属性的数据特征,首先生成每个属性的随机生成函数;如果某个属性没有指定数据特征,则采用相应数据类型默认的数据特征;
步骤二:基于相应属性的生成函数,实例化所有基数约束中涉及的符号参数,实例化后的参数保证了各个查询的中间结果集大小在概率期望上与约束的基数一致;查询实例化模块有两部分的输出,一个是填充了具体参数的实例化查询,供后续测试所用;一个是数据表中所有属性的生成函数,作为数据生成模块的输入;
步骤三:数据生成,根据给定的属性生成函数,分布式控制器会依据机器配置信息,将数据生成任务均匀划分到所有的数据生成器上,以便最大化地利用硬件资源进行完全并行的数据生成;生成的数据首先以文本的形式存储在各个节点上,然后再批量导入到待测试的数据库中。
2.如权利要求1所述的面向非等值连接负载的数据生成方法,其特征在于,针对各个数据类型的生成函数的具体生成机制如下:
属性生成函数包含:随机索引生成和索引数值转化。
3.如权利要求2所述的面向非等值连接负载的数据生成方法,其特征在于,所述随机索引生成:根据该属性的指定基数,生成一个随机索引值,若该属性的指定基数为M,那么生成的随机基数为1至M之间的随机整数;索引数值转化器会依据输入的随机索引值,生成一个具体的数值作为输出。
4.如权利要求2所述的面向非等值连接负载的数据生成方法,其特征在于,所述索引数值转化针对不同的数据类型转化器会采用不同的转化函数;针对数值型数据类型,采用简单的线性函数作为转化函数;而针对字符型数据类型,先生成满足字符串长度要求的种子字符串,种子字符串的个数小于该属性的指定基数,然后转化器根据输入的索引值通过取余运算确定一个种子字符串的位置,再通过连接索引值和选择的种子字符串作为输出。
5.一种面向非等值连接负载的数据生成系统,其特征在于,包括以下模块:
查询实例化模块:根据给定的数据库结构,以及每个属性的数据特征,首先生成每个属性的随机生成函数;如果某个属性没有指定数据特征,采用相应数据类型默认的数据特征;
生成函数模块:实例化所有基数约束中涉及的符号参数,实例化后的参数保证了各个查询的中间结果集大小在概率期望上与约束的基数一致;查询实例化模块有两部分的输出,一个是填充了具体参数的实例化查询,供后续测试所用;一个是数据表中所有属性的生成函数,作为数据生成模块的输入;
数据生成模块:根据给定的属性生成函数,分布式控制器会依据机器配置信息,将数据生成任务均匀划分到所有的数据生成器上,以便最大化地利用硬件资源进行完全并行的数据生成;生成的数据首先以文本的形式存储在各个节点上,然后再批量导入到待测试的数据库中。
6.如权利要求5所述的面向非等值连接负载的数据生成系统,其特征在于,所述属性生成函数主要包含两个模块,一个是随机索引生成器,一个是索引数值转化器:
所述随机索引生成器会根据该属性的指定基数,生成一个随机索引值,若该属性的指定基数为M,那么生成的随机基数为1至M之间的随机整数;索引数值转化器会依据输入的随机索引值,生成一个具体的数值作为输出;
所述索引数值转化器针对不同的数据类型转化器会采用不同的转化函数;针对数值型数据类型,采用简单的线性函数作为转化函数;而针对字符型数据类型,先生成满足字符串长度要求的种子字符串,种子字符串的个数小于该属性的指定基数;然后转化器根据输入的索引值通过取余运算确定一个种子字符串的位置,再通过连接索引值和选择的种子字符串作为输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010053458.9/1.html,转载请声明来源钻瓜专利网。





