[发明专利]一种数据表关联分析方法无效
| 申请号: | 201210259718.3 | 申请日: | 2012-07-20 |
| 公开(公告)号: | CN102799570A | 公开(公告)日: | 2012-11-28 |
| 发明(设计)人: | 罗笑南;曾金龙;韩冠亚;林格 | 申请(专利权)人: | 中山大学 |
| 主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 510006 广东省广州市番禺*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据表 关联 分析 方法 | ||
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据表关联分析方法。
背景技术
一个系统平台因为安全或者升级改造,都可能涉及到数据的迁移。在数据迁移之前,往往需要考虑哪些表格是需要迁移的,这主要是因为数据之间的依赖关系导致的,这时候就需要用到数据表之间关联性分析的方法。在过去,主要还是借助人工的方式来进行数据表的选取,这样的缺点就是人为指定的表格不仅容易出错,而且可能导致指定不全,导致所迁移的数据不能够使用,或者可以不迁移的数据而又重复迁移,浪费资源。
现行的对数据表之间的关联性分析主要还是依靠经验,人工的或者借助数据库外键关联的方式简单的选取依赖表格。现有技术的缺点是:指定所依赖的表格容易指定错误,或者制定不全,导致所迁移的数据不能正常使用;或者采用外键关联的方式,往往会导致数据关联面太大导致需要迁移的数据又过多,严重的造成数据的浪费。
发明内容
本发明的目的是为了克服现有技术的缺陷,提供一种数据表关联分析方法,通过该方法能够简化数据分析过程,节约资源。在分析表之间的外键关联的基础之上,采用深度控制和历史访问数据分析出数据表之间的关联性,得出最优的迁移方案。所迁移的数据是必要的而又最少的。
一种数据表关联分析方法,该方法包括:首先通过输入迁移表格,根据其外键关联找表和深度控制构建关系图,其次通过访问历史数据记录精简关系图,最后和目标关系图进行比对得出最后的迁移图。
优选地,通过外键关联找表和深度控制构建关系图的具体步骤如下:
Step11:输入表格A和深度控制变量n;
Step12:将表格A生成图的第一个顶点,记为V,转Step13;
Step13:将顶点V加入到队列中,转Step14;
Step14:判断深度n是否大于0,如果是则转Step15,否则程序结束;
Step15:深度n减一,取出队列中的第一个元素,并记为V,转Step16;
Step16:将V依赖的表都生成图的节点,并加入到队列中,转Step14。
优选地,将表格变成有向图,当读取到一个表格的时候,把表格当成一个节点。
优选地,表节点的生成步骤为:
Step21:获取表结构,生成一个根节点代表这个表,即一个顶点;
Step22:判断是否还有没有处理的列信息,如果有则转Step23,否则转结束程序;
Step23:读取下一列信息,根据列的关键字、类型,采用元数据描述;转Step24;
Step24:将列的元数据作为子节点挂载到这个表的节点上,转Step22。
优选地,通过访问历史数据记录精简关系图的流程为:
Step31:输入中心表格为A,输入关系图中的其他表格的访问数据;转Step32;
Step32:根据时间关联性对表格进行排序,看用户访问表格A时候同时会访问其他的哪些表格,时间的相近性越大,则表明这两个表之间的关联性越高,应该给予考虑;
Step33:将拓扑关联和时间关联性加权,拓扑关联指的是在关系图中的关系,如果两个顶点直接相连,则是强拓扑关联的,否则就是弱拓扑关联的;将二者进行加权,平衡二者的因素;转Step34;
Step34:精简那些权值低并且不是联通点的节点,所谓的联通点就是删除该点会导致图的连通分量会增加,所以不能删除;转Step35;
Step35:精简结束输出精简后的关系图。
优选地,与目标的关系图进行比对匹配的流程为:
Step41:输入目标图T和源图S,它们分别代表了目标数据库和源数据库中以要迁移表格为中心的一个关系图;转Step42;
Step42:选定图T和图S中的初始节点作为t0,s0,也就是要迁移的表格和需要迁移到的表格;转Step43;
Step43:比对t0,s0的属性相似性,并生成属性转换规则,就是根据两个顶点的属性值,及用元数据表示的列类型等信息,进行比对,生成相应的转换规则;转Step44;
Step44:判断是否还有顶点未处理,如果是转Step45,否则结束程序;
Step45:以图的广度优先的方式遍历T,同时用S和它进行匹配;转Step46;
Step46:判断目标图T中没有源图S中的该节点,若是转Step47,否则转Step48;
Step47:制定需要在目标数据库上需要新建相应表格的规则;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210259718.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抽油烟机无烟过滤装置
- 下一篇:一种头戴式LED灯





