[发明专利]一种通用的数据抽取转换方法无效

专利信息
申请号: 201210349607.1 申请日: 2012-09-20
公开(公告)号: CN102902750A 公开(公告)日: 2013-01-30
发明(设计)人: 周秀强;崔永生;吕亚伟;曹苗苗 申请(专利权)人: 浪潮齐鲁软件产业有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 250014 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 通用 数据 抽取 转换 方法
【说明书】:

技术领域

本系统涉及一种计算机应用技术领域,具体的说是一种通用的数据抽取转换方法。 

背景技术

目前我国各个领域的基础数据都已经完善,各业务系统积累了大量数据,蕴藏了丰富的信息资源,数据利用方面的需求日益增多。数据挖掘、决策支持日益兴起,如何从海量数据中挖掘出有价值的数据,如何有效应对业务需求的变化带来的数据处理规则变化,是软件公司和客户急于解决的问题。目前实现数据抽取转换的方式有很多,如:直接写脚本处理数据、ETL软件产品,但无论是写脚本还是ETL产品,都无法避免需要专业技术人员进行数据加载与维护,对业务需求的变更不能及时响应,并且对技术人员要求非常高,不但要懂技术同时需要对业务很熟。因此,需要一套比较科学的方法及方法帮助软件公司及客户适应快速变化的需求,快速的完成数据抽取处理,实现业务人员(客户)自行加载业务、自行维护需求,提高技术对业务变化的响应能力。传统数据抽取处理方法几乎都是面向技术人员使用,业务人员提出需求,技术人员理解需求后做相应的数据抽取处理。技术人员需要既懂业务有懂技术,对技术人员要求比较高,且对于需求的变动不能及时做出反映。 

通用的数据抽取处理方法实现了与行业(业务)的无关性,其重点转向了对业务需求变化的管理,其系统功能的关注重点也随之转向了提供支持业务变化的服务,通过这些方法提供的功能,加载和实现各类业务的处理和加工。实现业务人员(客户)自行加载业务、自行维护需求,提高技术对业务变化的响应能力。 

发明内容

本发明的目的是提供一种通用的适合非技术人员使用的数据抽取转换方法。 

根据目前数据应用领域的应用规模及应用内容分析,随着信息技术不断的发展,将来的数据应用会不断的增加,因此技术架构必须重点考虑整个系统的跨平台性、安全性、可靠性、灵活性、稳定性及易管理性,同时技术架构应该有非常好的可扩展能力,并符合整个项目的建设原则和技术要求。 

本发明是按以下方式实现的,通过分析各类数据抽取处理加载及调度方法,总结出数据抽取处理的公共特征,采用数据结构、抽取规则、抽取计划分别进行定义管理的方式,进行源表数据字典定义、目标表结构设置、抽取规则设置、抽取计划设置,其中, 

数据字典定义:定义源数据所在的数据库信息、表信息、字段信息、表及字段的业务含义各元数据信息;

目标表结构设置:用来定义数据抽取处理后的结果表,包括:基本信息、索引信息、表及字段的业务含义各元数据信息;

抽取规则设置:使用拖拽方式实现抽取规则,其中需要用到的源表信息、目标表信息、规则信息均用业务语言描述,抽取规则设置内容包括:查询组件、修改组件、删除组件、扩展组件、血缘分析;引导抽取规则设置包括以下内容:

1)新建规则信息,设置内容包括:抽取类型、规则名称、规则描述、规则备注;

2)参数维护,维护整个规则的参数,定义的参数,在所有组件中都能使用,参数内容包括:参数名称、显示名称、参数描述、参数值类型、参数长度、备注;

3)抽取规则组件定义,根据业务需求逻辑规则,选择并定义多个抽取组件,组件信息包括:组件类型、组件名称、组件描述、是否已校验、是否使用、备注;

4)规则校验,定义完成抽取规则组件后,验证规则的正确性,优化提示;

抽取计划设置:抽取计划分为手动和自动抽取计划,自动抽取可自定义抽取频率,满足通常用到的各种抽取计划;

以上抽取转换过程都是通过二维关系表方式来存储,采用本地元数据管理方式,将业务加载过程中的字典、结构、规则、计划内容沉淀为元数据,每一步的元数据为下一步提供信息支撑,具体步骤如下:

1)准备数据库环境

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮齐鲁软件产业有限公司,未经浪潮齐鲁软件产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210349607.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top