[发明专利]发布到数据仓库在审
申请号: | 201980048334.7 | 申请日: | 2019-07-19 |
公开(公告)号: | CN112654977A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | A·布洛姆;D·米勒;马歇尔·A·伊斯曼 | 申请(专利权)人: | 起元技术有限责任公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发布 数据仓库 | ||
1.一种用于自动生成可执行应用程序的方法,该可执行应用程序用于将数据进行转换并加载到结构化数据集中,该结构化数据集用于存储来自一个或多个联网数据源的数据,该方法包括:
接收指定参数的值的至少一个元数据文件以及指定用于转换数据馈送的逻辑规则的规则集映射,其中,将从联网数据源接收每个数据馈送,并将结果加载到结构化数据集中;
验证这些参数的值和用于转换这些数据馈送的这些逻辑规则对于每个数据馈送是一致的;
根据这些参数的经验证值和用于将每个数据馈送转换为经转换的记录以便加载到该结构化数据集中的经验证逻辑规则来生成数据规则,这些数据规则指定一个或多个标准;以及
生成用于运行时环境的可执行数据处理应用程序,该可执行数据处理应用程序能配置为:
从一个或多个数据源接收包括数据馈送的源数据;并且
根据所生成的数据规则,将该源数据转换为满足该结构化数据集的该一个或多个标准的经转换数据。
2.如权利要求1所述的方法,其中,该可执行数据处理应用程序包括数据流图、数据流子图或多个数据流图。
3.如权利要求1或2所述的方法,其中,该结构化数据集包括数据库。
4.如前述权利要求中任一项所述的方法,其中,该源数据包括数据记录,并且其中,该元数据文件中的参数指定该数据记录的、表示该源数据的该数据记录的键值的字段。
5.在从属于权利要求4时如权利要求1至3中任一项所述的方法,其中,该元数据文件中的参数指定表示该源数据的键值的字段与该结构化数据集的表示该结构化数据集的另一键值的另一字段之间的映射。
6.在从属于权利要求4时如权利要求1至3中任一项所述的方法,其中,该元数据文件中的参数指定该键值的格式,并且其中,该可执行数据处理应用程序被配置为将该键值转换为具有由该参数指定的格式。
7.如前述权利要求中任一项所述的方法,进一步包括:
从数据存储中检索参数的默认值;以及
基于该参数的默认值定义这些数据规则。
8.如前述权利要求中任一项所述的方法,其中,逻辑规则为该结构化数据集的字段指定格式,该字段包括数据历史值。
9.在从属于权利要求8时如前述权利要求中任一项所述的方法,其中,该数据历史值包括指示包括该数据历史值的该结构化数据集的更新时间的时间戳。
10.如前述权利要求中任一项所述的方法,其中,接收该元数据文件包括:解析该元数据文件的标题行,以确定哪些参数具有该元数据文件中的指定值。
11.如前述权利要求中任一项所述的方法,其中,将该源数据转换为满足该结构化数据集的如由这些数据规则定义的该一个或多个标准的结构化数据包括:
确定该源数据的至少两个不同部分指定相同的键值;以及
为该源数据的这两个不同部分中的至少一个部分指定新的键值,该新的键值不同于这些相同的键值并且基于该结构化数据集的键序列。
12.如前述权利要求中任一项所述的方法,包括检索该至少一个元数据文件未指定的一个或多个附加参数的一个或多个默认值,其中,对这些数据规则的定义是基于该一个或多个附加参数的这些默认值进行的。
13.如前述权利要求中任一项所述的方法,其中,该元数据文件包括一个或多个语义规则,该一个或多个语义规则指定用于解释该经转换的记录的值的标签。
14.如前述权利要求中任一项所述的方法,其中,该元数据文件中的这些参数包括数据质量参数,该数据质量参数指定用于包括在该经转换的记录中的可接受数据值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于起元技术有限责任公司,未经起元技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980048334.7/1.html,转载请声明来源钻瓜专利网。