[发明专利]基于风机数据的多源数据整合方法及装置有效
申请号: | 201711418200.9 | 申请日: | 2017-12-25 |
公开(公告)号: | CN110019228B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 徐斌;霍钧 | 申请(专利权)人: | 北京金风科创风电设备有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/25 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 曾世骁;王兆赓 |
地址: | 100176 北京市大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 风机 数据 整合 方法 装置 | ||
1.一种基于风机数据的多源数据整合方法,其特征在于,所述方法包括:
通过分析风机业务数据以及各个数据源的风机数据来设计风机数据事实表的表结构;
将各个数据源的风机数据分别抽取到设计的风机数据事实表中并将抽取的风机数据中的数据标识转化为统一的数据标识;
针对转化后的各个数据源的数据进行数据清洗;
将清洗后的各个数据源的数据进行数据融合,生成风机数据实时表,其中,生成风机数据实时表的步骤包括基于清洗后的各个数据源的数据生成新的风机数据事实表,并且通过将新的风机数据事实表按照数据采集时间的倒序进行排序生成风机数据实时表,
其中,数据清洗的步骤包括:
针对各个数据源在数据传输中出现的重复数据、残缺数据和/或错位数据将不同数据类型的风机数据进行类型校验,将数据类型不匹配的风机数据过滤掉,
针对各个机组变量的校验规则、命名规范和数值范围对经数据类型校验后的风机数据进行数据有效性校验,将被确定为无效的数据过滤掉,
确定风机数据中相关联的配置信息是否存在冲突,当配置信息存在冲突时,将当前同次抽取的全部数据过滤掉,其中,配置信息是用于判断风机数据事实表中的数据是否匹配的信息,
针对各个机组变量之间相关联的变量值进行冲突校验,当相关联的变量值存在冲突时,将当前同次抽取的全部数据过滤掉。
2.如权利要求1所述的多源数据整合方法,其特征在于,设计风机数据事实表的表结构的步骤包括:
针对各个数据源的基础数据使用统一的数据变量名称来生成机组基础信息维度表;
通过确定业务系统需求的变量信息来生成变量信息维度表;
通过分析各个数据源的变量信息来生成各个数据源之间的变量转化关系表。
3.如权利要求1所述的多源数据整合方法,其特征在于,设计风机数据事实表的表结构的步骤包括:根据各个数据源的机组编码、机组变量名称,结合数据采集时间、数据返回时间来设计风机数据事实表的表结构。
4.如权利要求2所述的多源数据整合方法,其特征在于,抽取数据的步骤包括:从各个数据源将风机数据全部抽取到目标数据库临时表中,根据变量信息维度表中定义的变量名称将与风机业务系统相关的数据抽取到设计的风机数据事实表中。
5.如权利要求2所述的多源数据整合方法,其特征在于,数据转化的步骤包括:参照生成的变量转化关系表将各个数据源的机组编码、风电场编码为统一的机组编码、风电场编码。
6.如权利要求2所述的多源数据整合方法,其特征在于,数据清洗的步骤包括:参照生成的变量信息维度表,针对各个数据源在数据传输中出现的重复数据、残缺数据和/或错位数据将不同数据类型的风机数据进行类型校验,将数据类型不匹配的风机数据过滤掉。
7.如权利要求6所述的多源数据整合方法,其特征在于,数据清洗的步骤还包括:参照变量信息维度表和机组基础信息维度表,针对各个机组变量的校验规则、命名规范和数值范围对经数据类型校验后的风机数据进行数据有效性校验,将被确定为无效的数据过滤掉。
8.如权利要求7所述的多源数据整合方法,其特征在于,数据清洗的步骤还包括:参照变量信息维度表和机组基础信息维度表,确定风机数据中相关联的配置信息是否存在冲突,当配置信息存在冲突时,将当前同次抽取的全部数据过滤掉。
9.如权利要求7所述的多源数据整合方法,其特征在于,数据清洗的步骤还包括:参照变量信息维度表,针对各个机组变量之间相关联的变量值进行冲突校验,当相关联的变量值存在冲突时,将当前同次抽取的全部数据过滤掉。
10.如权利要求1所述的多源数据整合方法,其特征在于,生成新的风机数据事实表的步骤包括:将清洗后的各个数据源的风机数据按照机组编码、变量名称、数据采集时间的顺序进行排序,将变量值重复的数据过滤掉以生成新的风机数据事实表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金风科创风电设备有限公司,未经北京金风科创风电设备有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711418200.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据存储终端系统及其使用方法
- 下一篇:数据库配置系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置