[发明专利]一种基于聚类算法的能源数据处理方法、装置及终端设备有效
申请号: | 202310037388.1 | 申请日: | 2023-01-09 |
公开(公告)号: | CN116028838B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 彭勃;左婧;龚贤夫;李耀东;李作红;郑嘉鹏;邱健 | 申请(专利权)人: | 广东电网有限责任公司 |
主分类号: | G06F18/23213 | 分类号: | G06F18/23213;G06F18/214;G06Q10/04;G06Q50/06;G06F16/27 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 李妙芬 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 算法 能源 数据处理 方法 装置 终端设备 | ||
1.一种基于聚类算法的能源数据处理方法,其特征在于,包括:
获取历史能源需求数据;
通过预设的聚类算法,对所述历史能源需求数据进行聚类中心的计算,并基于所述聚类中心将所述历史能源需求数据划分为若干个训练集;其中,每个训练集与每个聚类中心的种类一一对应;
对所述若干个训练集进行预处理,并将预处理后的所述若干个训练集输入到预设的时序预测模型中进行训练,获得若干个能源数据预测模型;其中,所述将预处理后的所述若干个训练集输入到预设的时序预测模型中进行训练,获得若干个能源数据预测模型,具体为:构建与训练集个数对应的若干个时序预测模型;每个训练集分别与每个时序预测模型相对应;将每个训练集分别输入至每个时序预测模型中,通过Xavier算法将每个时序预测模型的参数进行初始化操作,并通过Adam梯度算法、平均绝对误差损失函数对每个输入训练集的时序预测模型进行训练,并验证集进行验证,当所有时序预测模型收敛时,获得若干个能源数据预测模型;
在获取到待预测能源需求数据时,确认与待预测能源需求数据对应的能源聚类中心,并将所述待预测能源需求数据代入到与所述能源聚类中心对应的能源数据预测模型中,获得与待预测能源需求数据对应的能源需求预测量;其中,所述确认与待预测能源需求数据对应的能源聚类中心,并将所述待预测能源需求数据代入到与所述能源聚类中心对应的能源数据预测模型中,获得与待预测能源需求数据对应的能源需求预测量,具体为:计算所述待预测能源需求数据与目标聚类中心的平均距离;选取平均距离小于或等于第二门槛值的若干个目标聚类中心作为能源聚类中心,将所述待预测能源需求数据分别代入到若干个所述能源聚类中心对应的能源数据预测模型中,获得若干预测结果;对所述待预测能源需求数据与若干能源聚类中心的平均距离进行归一化处理,并将归一化处理后若干能源聚类中心的平均距离与若干预测结果代入加权计算公式中,计算获得与待预测能源需求数据对应的能源需求预测量;
所述历史能源需求数据,包括:历史气象数据、时间数据、电力能源数据、电网调度数据、社会经济数据和碳排放数据。
2.根据权利要求1所述的基于聚类算法的能源数据处理方法,其特征在于,所述通过预设的聚类算法,对所述历史能源需求数据进行聚类中心的计算,具体为:
在所述历史能源需求数据中,随机选取预设数量个数据点作为若干个初始聚类中心;
将所述若干个初始聚类中心设为若干个待定聚类中心,依次执行欧氏距离计算操作、聚类中心更新操作和聚类中心比较操作,直至更新前的待定聚类中心和更新后的待定聚类中心的欧式距离小于第一门槛值后停止,并将更新后的待定聚类中心作为目标聚类中心;
其中,所述欧氏距离计算操作,具体为:计算每个数据点与所有待定聚类中心的欧氏距离,并选择欧氏距离最小的待定聚类中心作为每个数据点的类别,获得历史能源需求数据对应的聚类数据;所述聚类中心更新操作,具体为:根据欧氏距离计算操作获得的聚类数据,计算每个类别对应的若干数据点的均值,并将均值更新为下一次欧氏距离计算操作所需的待定聚类中心;所述聚类中心比较操作,具体为:对更新前的待定聚类中心和更新后的待定聚类中心进行欧式距离的计算,并根据计算获得的欧氏距离与第一门槛值进行比较,若计算结果大于第一门槛值,则根据更新后的待定聚类中心重新执行欧氏距离计算操作、聚类中心更新操作和聚类中心比较操作。
3.根据权利要求2所述的基于聚类算法的能源数据处理方法,其特征在于,所述基于所述聚类中心将所述历史能源需求数据划分为若干个训练集,具体为:
计算历史能源需求数据中每个数据点与目标聚类中心的欧氏距离,并选取欧式距离最小的目标聚类中心作为每个数据点的类别标号,将历史能源需求数据所有数据点按照类别标号分类为若干个训练集;其中,所述训练集的个数与所述目标聚类中心的个数一致,且一一对应。
4.根据权利要求3所述的基于聚类算法的能源数据处理方法,其特征在于,所述对所述若干个训练集进行预处理,具体为:在每个训练集中,按照时间顺序将每个训练集中的数据点进行排序,并通过插值法按照预设的时间颗粒度对每个训练集进行数据补充操作;其中所述数据补充操作具体为:对按照预设的时间颗粒度对每个训练集中的数据点对应的时间进行缺失识别;若数据点的时间缺失,则通过插值法进行数据补充,并完成预处理;若数据点的时间未缺失,则直接完成预处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司,未经广东电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310037388.1/1.html,转载请声明来源钻瓜专利网。