[发明专利]一种基于改进随机森林算法的电压缺失数据辨识方法在审

申请号：	202110397003.3	申请日：	2021-04-13
公开（公告）号：	CN113468796A	公开（公告）日：	2021-10-01
发明（设计）人：	李绍坚;韦明超;罗淑芳;莫江婷;甘静;夏斌;王益成;周觅路;韦社敏;鲁林军;陈柏昌;黄伟;陶海峰	申请（专利权）人：	广西电网有限责任公司南宁供电局
主分类号：	G06F30/27	分类号：	G06F30/27;G06K9/62;G06Q10/04;G06Q50/06;G06F111/08
代理公司：	广州市专注鱼专利代理有限公司 44456	代理人：	柴燕
地址：	530029 广西***	国省代码：	广西;45
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于改进随机森林算法电压缺失数据辨识方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于改进随机森林算法的电压缺失数据辨识方法，其中方法步骤包括：获取电网历史数据，选择缺失数据所有对应的关联属性，进行不同的属性划分；通过属性综合加权计算得到学习样本集合；对学习样本进行重复抽样，得到若干个相似样本集合；将所述相似样本集合作为输入，训练随机森林回归模型；提高随机森林回归预测精度；将所有决策树的最终预测均值作为填补结果，评估填补结果，填补结果在容忍范围则填补完成。通过本发明提高对缺失数据的辨识精度，从而提高了电网缺失值的填补精度。

技术领域

本发明电力系统数据融合中常出现的电压值缺失问题的技术领域，尤其涉及一种基于改进随机森林算法的电压缺失数据辨识方法。

背景技术

随着电网的高速发展，各类系统对数据的需求越来越依赖，然而在数据采集和传输的过程中，常因通道量测和人为等因素，不可避免导致部分数据的丢失或异常。缺失或异常的数据对系统的运行以及进一步的数据分析都会造成影响，导致输出结果的异常。

尽管目前的研究对缺失数据的填补都取得了较好的效果，但是却较少对缺失值属性的关联属性进行研究和分析，缺失值的关联属性对填补结果有较大影响，基于属性综合加权的改进随机森林算法，对缺失数据进行辨识，提高缺失数据的辨识精度，提高电网缺失值的填补精度。

发明内容

为了克服现有技术的不足，本发明提供了一种基于改进随机森林算法的电压缺失数据辨识方法，实现对缺失数据进行了辨识，提高缺失数据的辨识精度，提高电网缺失值的填补精度。

为了实现上述发明目的，本发明提供了一种基于改进随机森林算法的电压缺失数据辨识方法，包括以下步骤：

S1：获取电网历史数据，选择缺失数据所有对应的关联属性，进行不同的属性划分；

S2：通过属性综合加权计算得到学习样本集合；

S3：对学习样本进行重复抽样，得到若干个相似样本集合；

S4：将所述相似样本集合作为输入，训练随机森林回归模型；