[发明专利]一种基于决策树群的多维电能表现场状态检验方法在审
| 申请号: | 201710244397.2 | 申请日: | 2017-04-14 |
| 公开(公告)号: | CN108733966A | 公开(公告)日: | 2018-11-02 |
| 发明(设计)人: | 何蓓;邹波;肖冀;周峰;程瑛颖;骆凯波 | 申请(专利权)人: | 国网重庆市电力公司;国网重庆市电力公司电力科学研究院;国家电网公司 |
| 主分类号: | G06F19/00 | 分类号: | G06F19/00 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张勇 |
| 地址: | 400015 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明一种基于决策树群的多维电能表现场状态检验方法,包括以下步骤:将用电信息采集系统提供的电能表相关采集数据建立决策树;针对每棵决策树进行分类形成下一级分枝;生成完全生长的初级决策树;对初级决策树基于代价复杂性剪枝算法进行剪枝优化;使用独立的测试集评估被剪枝优化后的初级决策树的准确率;每组次级决策树选出一棵最优的决策树,由所有最优决策树组成决策树群异常诊断模型,判定结果以投票的方式获取优胜;将决策树群异常诊断模型运算规则传递给用电信息采集系统Hadoop大数据处理集群,实现对在运电能表的异常运行状况进行异常检测。 | ||
| 搜索关键词: | 决策树 电能表 用电信息采集系统 现场状态 异常诊断 剪枝 多维 最优决策树 采集数据 方式获取 剪枝算法 模型运算 判定结果 数据处理 一级分枝 异常检测 异常运行 测试集 准确率 集群 检验 优化 传递 分类 评估 生长 投票 | ||
【主权项】:
1.一种基于决策树群的多维电能表现场状态检验方法,其特征是:包括以下步骤:(1)将用电信息采集系统提供的电能表相关采集数据作为训练集,由训练集别建立决策树,并确定其判定属性类别与特征属性,树以单个节点为根开始;(2)针对每棵决策树所拥有的特征属性进行初步处理,结合电力领域专家经验,取分割点,将连续特征属性离散化;(3)根据所述步骤(2)中的分割点,以信息增益率的熵度量作为特征属性的启发信息,计算连续特征属性与离散特征属性的信息增益率;(4)选择信息增益率最大的特征属性作为样本分类的特征属性,该特征属性成为节点的判定属性,对判定属性的每个已知的值创建一个分支,并据此将训练集进行分类形成下一级分枝;(5)判断决策树的该节点是否满足停止生长条件,若不满足返回步骤(1),递归自上而下地形成每个归类上的样本决策树分枝,直至所有节点满足停止生长条件,生成完全生长的初级决策树;(6)对初级决策树基于代价复杂性剪枝算法进行剪枝优化,依次剪去表面误差率增益值最低的分枝,每剪掉一枝生成一棵次级决策数;(7)使用独立的测试集评估被剪枝优化后的初级决策树的准确率,若仍有较多噪声数据存在,则返回步骤(6),直至获得满足评估需求的一组剪枝优化后的初级决策树,每棵初级决策树生成一组次级决策树组;(8)采用所有次级决策树对测试集进行样本检测,结合用电信息采集系统检测的需求,每组次级决策树选出一棵最优的决策树,由所有最优决策树组成决策树群异常诊断模型,判定结果以投票的方式获取优胜;(9)将决策树群异常诊断模型运算规则传递给用电信息采集系统Hadoop大数据处理集群,实现对在运电能表的异常运行状况进行异常检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网重庆市电力公司;国网重庆市电力公司电力科学研究院;国家电网公司,未经国网重庆市电力公司;国网重庆市电力公司电力科学研究院;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710244397.2/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





