[发明专利]一种基于决策树群的多维电能表现场状态检验方法在审
| 申请号: | 201710244397.2 | 申请日: | 2017-04-14 |
| 公开(公告)号: | CN108733966A | 公开(公告)日: | 2018-11-02 |
| 发明(设计)人: | 何蓓;邹波;肖冀;周峰;程瑛颖;骆凯波 | 申请(专利权)人: | 国网重庆市电力公司;国网重庆市电力公司电力科学研究院;国家电网公司 |
| 主分类号: | G06F19/00 | 分类号: | G06F19/00 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张勇 |
| 地址: | 400015 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 决策树 电能表 用电信息采集系统 现场状态 异常诊断 剪枝 多维 最优决策树 采集数据 方式获取 剪枝算法 模型运算 判定结果 数据处理 一级分枝 异常检测 异常运行 测试集 准确率 集群 检验 优化 传递 分类 评估 生长 投票 | ||
1.一种基于决策树群的多维电能表现场状态检验方法,其特征是:包括以下步骤:
(1)将用电信息采集系统提供的电能表相关采集数据作为训练集,由训练集别建立决策树,并确定其判定属性类别与特征属性,树以单个节点为根开始;
(2)针对每棵决策树所拥有的特征属性进行初步处理,结合电力领域专家经验,取分割点,将连续特征属性离散化;
(3)根据所述步骤(2)中的分割点,以信息增益率的熵度量作为特征属性的启发信息,计算连续特征属性与离散特征属性的信息增益率;
(4)选择信息增益率最大的特征属性作为样本分类的特征属性,该特征属性成为节点的判定属性,对判定属性的每个已知的值创建一个分支,并据此将训练集进行分类形成下一级分枝;
(5)判断决策树的该节点是否满足停止生长条件,若不满足返回步骤(1),递归自上而下地形成每个归类上的样本决策树分枝,直至所有节点满足停止生长条件,生成完全生长的初级决策树;
(6)对初级决策树基于代价复杂性剪枝算法进行剪枝优化,依次剪去表面误差率增益值最低的分枝,每剪掉一枝生成一棵次级决策数;
(7)使用独立的测试集评估被剪枝优化后的初级决策树的准确率,若仍有较多噪声数据存在,则返回步骤(6),直至获得满足评估需求的一组剪枝优化后的初级决策树,每棵初级决策树生成一组次级决策树组;
(8)采用所有次级决策树对测试集进行样本检测,结合用电信息采集系统检测的需求,每组次级决策树选出一棵最优的决策树,由所有最优决策树组成决策树群异常诊断模型,判定结果以投票的方式获取优胜;
(9)将决策树群异常诊断模型运算规则传递给用电信息采集系统Hadoop大数据处理集群,实现对在运电能表的异常运行状况进行异常检测。
2.如权利要求1所述的一种基于决策树群的多维电能表现场状态检验方法,其特征是:在所述步骤(1)中,取训练集的样本数为N,设定产生n+1棵决策树,由整体训练集作为一个训练样本集,根据训练样本集建立1棵决策树;对训练集随机抽取1/n的样本形成训练样本子集,总共形成n个训练样本子集,根据训练样本子集建立n棵决策树。
3.如权利要求1所述的一种基于决策树群的多维电能表现场状态检验方法,其特征是:在所述步骤(2)中,特征属性包括连续特征属性和离散特征属性,所述分割点选取所述连续特征属性对应的电能表正常与异常之间的中点作为可能的分裂点,将连续特征属性离散化。
4.如权利要求1所述的一种基于决策树群的多维电能表现场状态检验方法,其特征是:在所述步骤(3)中,计算连续特征属性的信息增益率具体包括以下步骤:
(3-1a)计算每个可能的分裂点的信息增益;
(3-2a)对每个连续特征属性分裂点的信息增益进行修正;
(3-3a)比较每个连续特征属性分裂点修正后的信息增益,选取修正后的信息增益最大的分裂点作为该特征属性的最佳分裂点,对于较大数值区间的连续特征属性,采取分段多分裂点计算其信息增益和作为其信息增益;
(3-4a)连续特征属性的信息增益率为最佳分裂点的信息增益与分割信息率之商。
5.如权利要求1所述的一种基于决策树群的多维电能表现场状态检验方法,其特征是:在所述步骤(3)中,计算离散特征属性的信息增益率具体包括以下步骤:
(3-1b)计算离散特征属性的信息增益;
(3-2b)计算离散特征属性的信息增益率:计算离散特征属性的信息增益与分割信息率之商。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网重庆市电力公司;国网重庆市电力公司电力科学研究院;国家电网公司,未经国网重庆市电力公司;国网重庆市电力公司电力科学研究院;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710244397.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





