[发明专利]一种基于Kmeans和T-LSTM的负荷数据补全方法有效
申请号: | 202010128406.3 | 申请日: | 2020-02-28 |
公开(公告)号: | CN111461400B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 冯珺;陈蕾;童力;黄红兵;黄海潮;陈彤;黄俊;余慧华;韩翊;陈建铭 | 申请(专利权)人: | 国网浙江省电力有限公司;浙江华云信息科技有限公司;国网浙江省电力有限公司信息通信分公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06;G06F18/23213;G06F18/15;G06F17/18;G06N3/0442;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 浙江翔隆专利事务所(普通合伙) 33206 | 代理人: | 王晓燕 |
地址: | 310007 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 kmeans lstm 负荷 数据 方法 | ||
本发明公开了一种基于Kmeans和T‑LSTM的负荷数据补全方法,涉及一种数据补全方法。目前数据补全方法,数据偏差大,往往达不到预期效果。本发明包括以下步骤:构建数据模型;K种负荷区间的数据分别训练得到对应的K种数据模型;定时取待补全数据的当天负荷数据;计算当天负荷数据的平均值;根据平均值获取对应的数据模型;将待补全负荷数据输入对应的数据模型中,计算得到补全的完整负荷数据。本技术方案能够很好的把相似特征的负荷数据归为一类,排出不同特征数据的干扰;更能准确的反映缺失数据的真实负荷值。通过本方法实现准确补全数据,其具有误差小、收敛速度快的优点。
技术领域
本发明涉及一种数据补全方法,尤其涉及一种基于Kmeans和T-LSTM的负荷数据补全方法。
背景技术
在当前时代背景下,信息产业技术的迅猛发展和多元化的数据获取途径使得各行业机构的数据量激增,例如国网的电力负荷数据拥有极大的数据存量,并且目前仍然以非常迅猛的速度在激增。经验表明这些数据中往往蕴藏着诸多可用的内容,如果能对数据隐含的内容进行更加有效且完备的分析,提取出潜在的数据价值,并进行上层应用是非常有意义的事情。
但是目前数据挖掘领域内的绝大多数理论创新、发展和技术具体实现都是基于理想的、完备的数据集,然而现实终端采集上来的负荷数据因为终端损坏、无通讯等种种原因导致数据都有缺失、不完整,不完整的负荷数据会使得数据挖掘的结果扭曲、无效甚至得出错误的结论。所以对缺失数据的补全处理是数据挖掘过程中尤为重要、不可忽略的环节。
目前数据补全方法有线性补全、差值法补全等,线性补全算法的思想是用缺失点的前一时刻数据和后一时刻数据之和平均得到缺失数据值,这种方法简单但是相比真实值的偏差很大,往往达不到我们的预期效果。而且很多补全算法未对历史负荷数据分类,模型受到负荷数据突变的影响,也会导致误差过大。另外,基于时间序列的LSTM(Long ShortTerm Memory)网络是对连续和时间间隔有规律的情况下补全的效果比较好,但是实际情况是缺失数据都是随机的,所以LSTM网络数据补全也不能够满足要求。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于Kmeans和T-LSTM的负荷数据补全方法,以达到对数据准确补全的目的。为此,本发明采取以下技术方案。
一种基于Kmeans和T-LSTM的负荷数据补全方法,包括以下步骤:
1)构建数据模型;
101)分批获取负荷数据;
102)随机挖出负荷数据中的连续点作为待补全负荷数据;
103)对负荷数据进行Kmeans聚类;
104)通过Kmeans聚类获得最佳的K种分类方式,根据K种分类方式,将总样本分成k个类别,每一类别对应不同的负荷区间,得到K种分类的负荷区间;
105)计算负荷平均值,并对负荷数据进行归一化处理;
106)根据负荷平均值确定所处的负荷区间,将经归一化处理的负荷数据输入至对应负荷区间的T-LSTM神经网络中进行训练,从而获得对应负荷区间的数据模型;K种负荷区间的数据分别训练得到对应的K种数据模型;
2)定时取待补全数据的当天负荷数据;
3)计算当天负荷数据的平均值;
4)根据平均值获取对应的数据模型;
5)将待补全负荷数据输入对应的数据模型中,计算得到补全的完整负荷数据。
作为优选技术手段:构建数据模型时:
在步骤101)中,获取的负荷数据包括某单位的某日和某日前1天以及第七天负荷数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司;浙江华云信息科技有限公司;国网浙江省电力有限公司信息通信分公司,未经国网浙江省电力有限公司;浙江华云信息科技有限公司;国网浙江省电力有限公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010128406.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理