[发明专利]一种基于改进随机森林算法的电压缺失数据辨识方法在审
申请号: | 202110397003.3 | 申请日: | 2021-04-13 |
公开(公告)号: | CN113468796A | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 李绍坚;韦明超;罗淑芳;莫江婷;甘静;夏斌;王益成;周觅路;韦社敏;鲁林军;陈柏昌;黄伟;陶海峰 | 申请(专利权)人: | 广西电网有限责任公司南宁供电局 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06K9/62;G06Q10/04;G06Q50/06;G06F111/08 |
代理公司: | 广州市专注鱼专利代理有限公司 44456 | 代理人: | 柴燕 |
地址: | 530029 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 随机 森林 算法 电压 缺失 数据 辨识 方法 | ||
1.一种基于改进随机森林算法的电压缺失数据辨识方法,其特征在于,所述方法步骤包括:
S1:获取电网历史数据,选择缺失数据所有对应的关联属性,进行不同的属性划分;
S2:通过属性综合加权计算得到学习样本集合;
S3:对学习样本进行重复抽样,得到若干个相似样本集合;
S4:将所述相似样本集合作为输入,训练随机森林回归模型;
S5:通过减少决策树间的关联性和提高决策树的精度,提高随机森林回归预测精度;
S6:将所有决策树的最终预测均值作为填补结果,评估填补结果,填补结果在容忍范围则填补完成。
2.根据权利要求1所述的基于改进随机森林算法的电压缺失数据辨识方法,其特征在于,所述属性综合加权计算包括以下步骤:
S21:对所述关联属性进行各属性间的互相关系数计算,互相关系数大于给定阀值的属性存入互相关集合HG;
S22:将所述互相关集合HG进行属性误差期望计算,属性误差期望大于强相关阀值,存入强相关属性集合QX;
S23:所述强相关属性集合QX中的各属性采用熵权法确立其属性间的权重,得到权重向量,据强相关系数得到的属性综合加权值SX按照从大到小排序,设置选择阀值,选择大于选择阀值的样本作为学习样本集合。
3.根据权利要求2所述的基于改进随机森林算法的电压缺失数据辨识方法,其特征在于,所述关联属性的各属性间的互相关系数计算公式如下,
当皮尔逊系系数用于总体时,如式(1)所示:
其中,X,Y为两个不同属性的随机变量,σX,σY分别是X,Y的标准差,cov(X,Y)为协方差,如式(2)所示:
其中,n表示样本的数量;
当皮尔逊系系数用于样本时,如式(3)所示:
其中,xi,yi为变量X,Y对应i的观测点值,分别为对应X,Y的样本均值;
通过皮尔逊系数计算各属性间的互相关系数,选择互相关系数大于给定阀值的属性存入互相关集合HG。
4.根据权利要求2所述的基于改进随机森林算法的电压缺失数据辨识方法,其特征在于,所述互相关集合HG的属性误差期望计算公式如下,
其中,Cov(Xk,Yk)为Xk,Yk的协方差;Var[Xk]为Xk的方差;Var[Yk]为Yk的方差;
若EXPError(Xk,Yk)>β(β为强相关阀值),则为强相关属性,存入到强相关属性集合QX中。
5.根据权利要求2所述的基于改进随机森林算法的电压缺失数据辨识方法,其特征在于,所述强相关属性集合QX中的各属性采用熵权法确立其属性间的权重,得到权重向量如下:
W=[w1,w2,...,wm] (5)
其中,m:强关联属性的个数;
据强相关系数得到的属性综合加权值SX:
SX=W1S1+W2S1+...+WmSm (6)
根据各历史断面数据的属性综合加权结果按照从大到小排序,设置选择阈值,选择阀值较大的样本作为学习样本集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西电网有限责任公司南宁供电局,未经广西电网有限责任公司南宁供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110397003.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种鼻梁条自动上料装置
- 下一篇:监测钻机在钻探过程中地层变化的装置及方法