[发明专利]一种基于正则化贪心森林算法非侵入式负荷辨识方法在审
申请号: | 202110679832.0 | 申请日: | 2021-06-18 |
公开(公告)号: | CN113408203A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 刘江永;刘宁;刘西蒙;范朝冬;陈才学;易灵芝 | 申请(专利权)人: | 湘潭大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06K9/62;G06F113/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 411105 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 正则 贪心 森林 算法 侵入 负荷 辨识 方法 | ||
1.一种基于正则化贪心森林算法非侵入式负荷辨识方法,其特征在于:采用正则化贪心森林算法在处理数据不平衡时以及在识别的具有相似特征轨迹时,具有较强的泛化能力,且算法运算复杂度较低,提高了算法的识别精度,具体包括以下步骤:
Step1使用某一区域的居民用电数据,对数据进行预处理;
Step2选择V-I轨迹作为负荷特征,轨迹特征的提取方法是通过映射将原始V-l轨迹转化为二维V-I轨迹,分析该特征轨迹图与样本数据的标签的相关性,使用与样本数据标签有相关性的负荷特征是为了提高负荷辨识的准确性;
Step3使用基于正则化贪心森林算法的非侵入式负荷辨识方法进行负荷辨识,并得到辨识的结果。
2.如权利要求1所述对获取的数据进行预处理,并获取该范围内各用户用电设备的相关信息,其特征在于:
采用某一区域的居民用电数据,对该数据进行预处理,因为样本出现数据不平衡时,少数类样本特征训练不充分,会导致算法的辨识准确率出现精度偏移;因此采用SVMSMOTE算法对少数类样本进行扩充,以此生成新的数据样本;其合成的策略是使用支持向量机分类器产生支持向量,然后再生成新的少数类样本,最后使用SMOTE过采样算法合成样本。
3.如权利要求2所述选择V-I轨迹作为负荷特征,并分析该特征轨迹图与样本数据的标签的相关性,其特征在于:
在用电设备稳定运行时一个周期内,高频电压u和i电流的波形数据,横坐标为u,纵坐标为i,绘制原始V-I轨迹;
将V-I二维平面分割为2N×2N的网格,每个网格的长度(即电压标准值)和高度(即电流标准值)计算如下:
初始化一个维度为2N×2N的二维矩阵β,其内的元素都赋值为1,即网格内的颜色初始化为白色,对原始V-I轨迹中的数据点(uj,ij)(j=1,2,…,J),它在矩阵β中占据位置的索引为(xj,yj),如果0<xj<2N+1且0<yj<2N+1,则矩阵β的元素B(xj,yj)设置为0,表示设备的V-I轨迹经过此单元格,标记为黑色:
4.如权利要求3所述的使用正则化贪心森林算法进行负荷辨识,其特征在于:
在一棵决策树中,样本从根节点到子节点(不论是叶子节点还是非叶子节点)的这样一条路径就形成了一条分类规则,所以对于决策树的一个子节点v来说,可以如下公式描述从根节点到这个子节点v的这个规则:
函数I(x)表示当括号中为真时结果为1,否则为0;如果bv(x)=1说明x经过决策树节点的判断,能够到达v这个节点,反之则无法到达;一个样本从根节点到子节点的过程中,在每个非叶子节点处都进行某个特征维度的值的二元测试(不是大于阈值就是小于阈值),在经过的全部非叶子节点处的测试中,有j个测试满足的是小于当前非叶子节点出的阈值的条件,有k个满足的是大于当前非叶子节点出的阈值条件;于是在决策树里面每一个节点v(叶子节点和非叶子节点)都可以用bv(x)来表示;因此,单棵决策树中,每个有着v1、v2两个子节点的节点v,都可以表示为子节点的组合:
bv(x)=bv1(x)+bv2(x). (4)
因此决策森林模型可以类比成叶结点的组合模型,而不是决策树模型的组合:
当v不是叶子节点的时,av=0;av表示节点的权重参数;F表示决策森林;有了决策森林模型的叶子组合模型的表示,正则化贪心森林算法可以直接利用森林的结构直接学习贪心森林,而不是每次迭代的时候只是生成单棵决策树加入决策森林。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湘潭大学,未经湘潭大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110679832.0/1.html,转载请声明来源钻瓜专利网。