[发明专利]一种基于工业用电大数据的数据清洗的集成方法在审

专利信息
申请号: 202010400381.8 申请日: 2020-05-13
公开(公告)号: CN111582593A 公开(公告)日: 2020-08-25
发明(设计)人: 洪蒙纳;满奕;胡雨沙;李继庚 申请(专利权)人: 山东博依特智能科技有限公司
主分类号: G06Q10/04 分类号: G06Q10/04;G06F16/215;G06F16/27;G06K9/62;G06Q50/06
代理公司: 成都方圆聿联专利代理事务所(普通合伙) 51241 代理人: 苟铭
地址: 255039 山东省淄博市高新*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 工业 用电 数据 清洗 集成 方法
【权利要求书】:

1.一种基于工业用电大数据的数据清洗的集成方法,其特征在于,包括下述步骤:

S1、采集工厂需要进行数据清洗的数据序列;

S2、对采集的数据序列进行周期性检验,将周期性检验后的数据细分为:周期性序列、非周期性平稳序列和非周期性非平稳序列;

S3、建立异常值剔除模型库,并将不同类别数据序列分别输入到对应的剔除模型中,剔除异常值;

S4、建立数据填补模型库,将剔除异常值的数据序列根据不同数据类别输入到对应的数据填补模型中;

S5、建立滤波模型库,将填补后的数据序列分别输入到对应的滤波模型中;

S6、将S5处理后的数据序列分别存入实时数据库和分布式数据库中。

2.根据权利要求1所述的基于工业用电大数据的数据清洗的集成方法,其特征在于,所述S2包括以下子步骤:

S21、利用小波分析法对部分序列进行拆分,分析拆分后的序列是否具有周期性,若没有,则分入非周期性这一类别中;若有,则分入周期性这一类别;

所述小波分析法的计算公式为:

其中,a为尺度,控制小波函数的伸缩;τ为平移量;f(t)为目标信号;ψ(t)为基本频率特性;

S22、对不是周期性序列进行统计学分析,分析一年的数据,且判断是否95%的数据都存在于一个固定范围内,若是,则将这类数据归类到非周期性平稳序列中;若否,则归类到非周期性序列、非平稳序列中。

3.根据权利要求1所述的基于工业用电大数据的数据清洗的集成方法,其特征在于,所述S3包括以下子步骤:

S31、利用主成分分析法对平稳生产的数据序列进行异常值标记和剔除,所述主成分分析法的计算公式为:

其中,a1i,a2i,……,api(i=1,……,m)为X的协方差阵Σ的特征值所对应的特征向量,是原始变量经过标准化处理的值;

变量标准化处理的公式为:

其中,为标准化后的数据,Zmin为一段时间内的Zx的最小值,Zmax为一段时间内的Zx的最大值;

S32、采用箱线图的方法对非周期性非平稳序列进行异常值剔除和标记;

S33、对非周期性平稳序列进行排异,当超过或者低于某个设定数值时,进行异常值剔除;

S34、根据数据序列的周期性对具有周期性数据序列进行异常值剔除。

4.根据权利要求1所述的基于工业用电大数据的数据清洗的集成方法,其特征在于,所述S4包括以下步骤:

S41、判断所需填补的数据序列是否为非周期性非平稳序列,若是,则判断其相邻空缺值的长度,若大于1,则输入空缺值之前的一段连续的数据序列到BP神经网络进行模型训练;

S42、对空缺值进行预测,用预测值对数据序列对应的空缺进行填补;

所述BP神经网络的核心计算公式为:

yjk=f(w1j×oj+…+wij×oj+…+wmj×oj+bj)

其中,f表示隐藏层的激活函数。j表示隐藏层的节点个数,oj表示隐藏层的第j个神经元的输出值,wij表示输入层的第i个神经元与隐藏层的第j个神经元的连接权值;

S43、若长度等于1,则采用最近邻插值法进行数据填补;

S44、利用数据序列周期性规则对具有周期性序列进行数据填补。

5.根据权利要求1所述的基于工业用电大数据的数据清洗的集成方法,其特征在于,所述S5包括以下子步骤:

S51、对具有周期性序列和平稳序列进行滑动平均滤波,所述滑动平均滤波算法的计算公式为:

其中,f(t)为时间为t时的滤波结果,y(i)为时间为i时刻的采样数据,n为滤波长度;

S52、对不平稳非周期序列进行卡尔曼滤波,所述卡尔曼滤波整个过程的公式为:

X(k|k-1)=A×X(k-1|k-1)+B×U(k)

P(k|k-1)=A×P(k-1|k-1)×A′+Q

X(k|k)=X(k|k-1)+Kg(k)*(Z(k)-H×X(k|k-1))

Kg(k)=P(k|k-1)×H′/(H×P(k|k-1)×H′

P(k|k)=(I-Kg(k)×H)×P(k|k-1)

其中,X(k|k-1)是利用上一状态预测的结果,X(k-1|k-1)是上一状态最优的结果;U(k)为现在状态的控制量,如果没有控制量,它的值为0;P表示协方差;A表示状态转移矩阵;Q是系统过程的协方差;Z(k)是观测值的平均数;Kg为卡尔曼增益。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东博依特智能科技有限公司,未经山东博依特智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010400381.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top