[发明专利]一种从非关系型数据库到关系型数据库的数据迁移方法有效
| 申请号: | 201310443352.X | 申请日: | 2013-09-25 |
| 公开(公告)号: | CN103530327A | 公开(公告)日: | 2014-01-22 |
| 发明(设计)人: | 李秀;闫天翔;高福信;余谨 | 申请(专利权)人: | 清华大学深圳研究生院 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 江耀纯 |
| 地址: | 518055 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 关系 数据库 数据 迁移 方法 | ||
技术领域
本发明涉及一种从非关系型数据库到关系型数据库的数据迁移方法。
背景技术
目前的应用中普遍存在需要处理来自于多个数据库的异构数据问题,现有技术主要解决在几种常用的关系型数据库,如Oracle,MySQL,Microsoft SQL Server之间进行数据的迁移。随着非关系型数据库的出现和发展,越来越多的应用中同时使用了关系型数据库和非关系型数据库,需要解决非关系型数据库和关系型数据库之间数据迁移的难题。
MongoDB与关系型数据库之间数据迁移相比于关系型数据库之间数据迁移,需要解决的难题主要有以下几点:
1.MongoDB数据库设计常采用反范式设计,不同于关系型数据库的范式化设计,允许字段的冗余,牺牲空间来换取时间。
2.MonogDB数据库中的表格具有无模式的特点,表格并没有统一的模式,例如两条记录可以包含不同的属性列等。
3.MongoDB中有特殊的数组和嵌入文档两种数据类型,在关系型数据库中并没有数据类型与此对应。
现有技术一般都是在主流的几种关系型数据库之间迁移数据。解决数据迁移时数据库设计模式的提取、数据库设计模式的转换和数据异构的冲突的问题。因为关系型数据库都是按照范式化准则设计,在数据库设计模式上具有很高的相似性,而非关系型数据库的设计理念不同于关系型数据库,常采用反范式的方法设计,且每种非关系型数据库都具有自身的特点,已有的方法并不能解决非关系型数据库与关系型数据库之间数据迁移的问题。
例如,河海大学硕士贾长云在其硕士论文《基于XML的异构数据库数据交换的研究与实现——校园网信息管理平台中的数据交换》中提出来的方法,是以XML文件作为中间载体,解决了Oracle数据库与SQL Server2000数据库之间的数据交换。其算法流程包括以下几个部分:提取源数据库设计模式,进行源数据库与目标数据库之间的数据模式映射,导出数据,按照目标数据库数据模式导入数据,对数据异构冲突进行处理几个步骤。
上述现有技术不能解决从非关系型数据库到关系型数据库的数据迁移问题。
发明内容
本发明的目的就是为了解决从非关系型数据库到关系型数据库的数据迁移问题,提出一种从非关系型数据库到关系型数据库的数据迁移方法。
为此,本发明的方法包括如下步骤:A、连接需要进行数据迁移的非关系型数据库,获取数据库中的表格信息;B、根据用户的输入,选择需要进行数据迁移的表和数据库模式定义方法,其中可选择的数据库模式定义方法包括用户自定义、并集兼容、交集兼容、首条数据四种方法;C、将信息从非关系型数据库中导出到定义的xml文件中;D、将非关系型数据库的数据库设计模式转变成对应的关系型数据库的设计模式;E、连接对应的关系型数据库,根据xml文件中的 数据库设计模式,建立对应的数据表;F、按照index元素中的索引信息,建立对应的索引;G、返回数据迁移结果。
优选地,本发明还包括如下特征:
其中步骤B中,用户自定义是指:用户自己定义数据库的每一个字段,包括字段名称、数据类型、字段别名、非空约束、主键约束;程序将用户定义的数据库模式存储到xml文件的meta元素中,供下一步处理;并集兼容是指:程序分析数据库中的所有数据,提取字段信息,对行记录中存在不同字段的情况,取并集处理,包含所有的数据列;程序将提取的数据库设计模式存储到xml文件的meta元素中,供下一步处理;交集兼容是指:程序分析数据库中的所有数据,提取字段信息,对行记录中存在不同字段的情况,取交集处理,包含所有记录共有数据列;程序将提取的数据库设计模式存储到xml文件的meta元素中,供下一步处理;首条数据是指:程序分析数据库中的第一条数据,提取字段信息;程序将提取的数据库设计模式存储到xml文件的meta元素中,供下一步处理。
其中步骤C中,表名信息存储在xml文件的根元素的name属性中,数据库的设计模式信息存储在meta元素中,数据信息存储在data元素中,索引信息存储在index元素中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳研究生院,未经清华大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310443352.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





