[发明专利]数据库文件数据索引的处理方法和装置有效
申请号: | 201410700349.6 | 申请日: | 2014-11-28 |
公开(公告)号: | CN104391945B | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | 郑少明;邱锋兴 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市博锐专利事务所44275 | 代理人: | 张明 |
地址: | 361008 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库文件 数据 索引 处理 方法 装置 | ||
技术领域
本发明涉及数据库技术领域,具体而言,特别涉及数据库文件数据索引的处理方法和装置。
背景技术
mssql是微软的SQLServer数据库服务器,它是一个数据库平台,提供数据库从服务器到终端的完整的解决方案,其中数据库服务器部分,是一个数据库管理系统,用于建立使用和维护数据库。从微软自行研发的Sqlserver7.0开始,版本经历Sqlserver2000、Sqlserver2005、Sqlserver2008、一直到现在的Sql Server 2014。几个初始版本应用于中小企业信息数据库管理、门户网站系统的开发,随着版本的升级和功能的扩展,它的应用范围有所扩展,已经触及到大型、跨国企业的数据库管理。特别是以微软的.net框架编程语言为开发语言研发的产品首选mssql作为数据服务器,所以在windows的操作系统上,其应用着占据很大的份额,与mysql、oracle一起被视为现在主流应用的三种数据库。
mssql server对应的数据库在物理上是以两个文件存放的,一个后缀名为mdf,是数据文件,用于记录数据库拥有哪些其他文件且被用来存储数据,另一个后缀名为ldf,为事务日志文件。通常情况下,我们备份和迁移mssql server数据库数据采用下面两种方式:
方式一:拷贝源机器数据库对应的mdf和ldf文件,在目标机器通过Server Management Studio (可视化的数据库管理工具,简称SSMS)以附加方式恢复数据库;
方式二:在源机器上通过SSMS自带的备份工具,选择要备份的数据库,备份成任意后缀的文件(通常为.bak),在目标机器上通过SSMS以还原数据库的方式恢复数据库。备份方式可以选择完整备份或差异备份。
当我们从不同的业务平台收集到多个以mssql作为数据存储的数据文件时,我们需要从这些不同的存储文件中检索我们需要的数据。对于少量文件,在处理维护上我们可以这样:一般采取上述两种方式,针对不同的备份方式,手动采取相应的方式进行附加或还原数据库,然后在已经恢复的数据库上,遍历查询该数据库所有表来检索所需要的特定数据。当有大量的数据文件需要处理,采用这种手工方法来检索需要的数据将是一个很大的工作量。因此,在还原好的数据库上手工检索数据库所有表来检索所需要的特定数据,显然是一个很繁琐耗时的过程。
此外,mssql的数据文件通常是mdf作为文件名后缀,备份方式备份出的文件是以bak作为后缀。实践证明,任意更改这两种文件后缀名(或无后缀名)都可以正常恢复数据库。而且mdf和bak不是mssql数据文件特有的文件类型,例如,Mirror Disc File(光盘镜像文件的一种)也是以mdf作为后缀名的,以bak作为后缀的文件类型有更多种。可能由于历史原因,我们收集到的文件很有可能后缀名已经被更改或者说收集到的文件本身就不是mssql的数据文件,所以在恢复数据库的时候,不能简单的通过识别文件名后缀来判断能不能恢复数据库。
同时,备份数据库时可以选择是完整备份或差异备份,且多次备份可以附在同一个bak文件(即一个bak文件可能有多个备份集信息),如何有效的根据备份集的信息还原一个有效的数据库,需要有一个相应的处理方式。
针对现有技术中手工检索数据库所有表来检索所需要的特定数据时繁琐耗时的问题,目前尚未提出有效的解决方法。
发明内容
本发明的主要目的在于提供一种数据库文件数据索引的处理方法和装置,以解决现有技术中手工检索数据库所有表来检索所需要的特定数据时繁琐耗时的问题。
依据本发明的一个方面,提供了一种数据库文件数据索引的处理方法。
根据本发明的数据库文件数据索引的处理方法包括:获取mssql数据文件;根据获取到的mssql数据文件进行数据库恢复,得到已恢复的数据库;对数据库通过数据库连接中间件建立数据库连接;获取数据库的各个数据表;将数据表中的每一行数据分别转换为一条全文document记录;将数据表对应的全文document记录生成一个document集合;以及将document集合通过全文索引接口提交到全文索引服务器进行数据索引。
进一步地,第一数据行为数据表中的任意一行数据,则将第一数据行转换为一条全文document记录包括:根据第一数据行中的数据得到第一数据行对应的特征字符串,其中,数据表的文件物理路径为第一路径;以及根据第一数据行对应的特征字符串、数据表的表名和第一路径生成一条全文document记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410700349.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置