[发明专利]一种基于工业用电大数据的数据清洗的集成方法在审
申请号: | 202010400381.8 | 申请日: | 2020-05-13 |
公开(公告)号: | CN111582593A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 洪蒙纳;满奕;胡雨沙;李继庚 | 申请(专利权)人: | 山东博依特智能科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F16/215;G06F16/27;G06K9/62;G06Q50/06 |
代理公司: | 成都方圆聿联专利代理事务所(普通合伙) 51241 | 代理人: | 苟铭 |
地址: | 255039 山东省淄博市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 工业 用电 数据 清洗 集成 方法 | ||
1.一种基于工业用电大数据的数据清洗的集成方法,其特征在于,包括下述步骤:
S1、采集工厂需要进行数据清洗的数据序列;
S2、对采集的数据序列进行周期性检验,将周期性检验后的数据细分为:周期性序列、非周期性平稳序列和非周期性非平稳序列;
S3、建立异常值剔除模型库,并将不同类别数据序列分别输入到对应的剔除模型中,剔除异常值;
S4、建立数据填补模型库,将剔除异常值的数据序列根据不同数据类别输入到对应的数据填补模型中;
S5、建立滤波模型库,将填补后的数据序列分别输入到对应的滤波模型中;
S6、将S5处理后的数据序列分别存入实时数据库和分布式数据库中。
2.根据权利要求1所述的基于工业用电大数据的数据清洗的集成方法,其特征在于,所述S2包括以下子步骤:
S21、利用小波分析法对部分序列进行拆分,分析拆分后的序列是否具有周期性,若没有,则分入非周期性这一类别中;若有,则分入周期性这一类别;
所述小波分析法的计算公式为:
其中,a为尺度,控制小波函数的伸缩;τ为平移量;f(t)为目标信号;ψ(t)为基本频率特性;
S22、对不是周期性序列进行统计学分析,分析一年的数据,且判断是否95%的数据都存在于一个固定范围内,若是,则将这类数据归类到非周期性平稳序列中;若否,则归类到非周期性序列、非平稳序列中。
3.根据权利要求1所述的基于工业用电大数据的数据清洗的集成方法,其特征在于,所述S3包括以下子步骤:
S31、利用主成分分析法对平稳生产的数据序列进行异常值标记和剔除,所述主成分分析法的计算公式为:
其中,a1i,a2i,……,api(i=1,……,m)为X的协方差阵Σ的特征值所对应的特征向量,是原始变量经过标准化处理的值;
变量标准化处理的公式为:
其中,为标准化后的数据,Zmin为一段时间内的Zx的最小值,Zmax为一段时间内的Zx的最大值;
S32、采用箱线图的方法对非周期性非平稳序列进行异常值剔除和标记;
S33、对非周期性平稳序列进行排异,当超过或者低于某个设定数值时,进行异常值剔除;
S34、根据数据序列的周期性对具有周期性数据序列进行异常值剔除。
4.根据权利要求1所述的基于工业用电大数据的数据清洗的集成方法,其特征在于,所述S4包括以下步骤:
S41、判断所需填补的数据序列是否为非周期性非平稳序列,若是,则判断其相邻空缺值的长度,若大于1,则输入空缺值之前的一段连续的数据序列到BP神经网络进行模型训练;
S42、对空缺值进行预测,用预测值对数据序列对应的空缺进行填补;
所述BP神经网络的核心计算公式为:
yjk=f(w1j×oj+…+wij×oj+…+wmj×oj+bj)
其中,f表示隐藏层的激活函数。j表示隐藏层的节点个数,oj表示隐藏层的第j个神经元的输出值,wij表示输入层的第i个神经元与隐藏层的第j个神经元的连接权值;
S43、若长度等于1,则采用最近邻插值法进行数据填补;
S44、利用数据序列周期性规则对具有周期性序列进行数据填补。
5.根据权利要求1所述的基于工业用电大数据的数据清洗的集成方法,其特征在于,所述S5包括以下子步骤:
S51、对具有周期性序列和平稳序列进行滑动平均滤波,所述滑动平均滤波算法的计算公式为:
其中,f(t)为时间为t时的滤波结果,y(i)为时间为i时刻的采样数据,n为滤波长度;
S52、对不平稳非周期序列进行卡尔曼滤波,所述卡尔曼滤波整个过程的公式为:
X(k|k-1)=A×X(k-1|k-1)+B×U(k)
P(k|k-1)=A×P(k-1|k-1)×A′+Q
X(k|k)=X(k|k-1)+Kg(k)*(Z(k)-H×X(k|k-1))
Kg(k)=P(k|k-1)×H′/(H×P(k|k-1)×H′
P(k|k)=(I-Kg(k)×H)×P(k|k-1)
其中,X(k|k-1)是利用上一状态预测的结果,X(k-1|k-1)是上一状态最优的结果;U(k)为现在状态的控制量,如果没有控制量,它的值为0;P表示协方差;A表示状态转移矩阵;Q是系统过程的协方差;Z(k)是观测值的平均数;Kg为卡尔曼增益。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东博依特智能科技有限公司,未经山东博依特智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010400381.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:模组连接器
- 下一篇:一种危险化学品液体非接触式转移装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置