[发明专利]一种基于决策树群的多维电能表现场状态检验方法在审
| 申请号: | 201710244397.2 | 申请日: | 2017-04-14 |
| 公开(公告)号: | CN108733966A | 公开(公告)日: | 2018-11-02 |
| 发明(设计)人: | 何蓓;邹波;肖冀;周峰;程瑛颖;骆凯波 | 申请(专利权)人: | 国网重庆市电力公司;国网重庆市电力公司电力科学研究院;国家电网公司 |
| 主分类号: | G06F19/00 | 分类号: | G06F19/00 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张勇 |
| 地址: | 400015 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 决策树 电能表 用电信息采集系统 现场状态 异常诊断 剪枝 多维 最优决策树 采集数据 方式获取 剪枝算法 模型运算 判定结果 数据处理 一级分枝 异常检测 异常运行 测试集 准确率 集群 检验 优化 传递 分类 评估 生长 投票 | ||
本发明一种基于决策树群的多维电能表现场状态检验方法,包括以下步骤:将用电信息采集系统提供的电能表相关采集数据建立决策树;针对每棵决策树进行分类形成下一级分枝;生成完全生长的初级决策树;对初级决策树基于代价复杂性剪枝算法进行剪枝优化;使用独立的测试集评估被剪枝优化后的初级决策树的准确率;每组次级决策树选出一棵最优的决策树,由所有最优决策树组成决策树群异常诊断模型,判定结果以投票的方式获取优胜;将决策树群异常诊断模型运算规则传递给用电信息采集系统Hadoop大数据处理集群,实现对在运电能表的异常运行状况进行异常检测。
技术领域
本发明属于电能表检验的技术领域,尤其涉及一种基于决策树群的多维电能表现场状态检验方法。
背景技术
目前,电能表检测面临的问题是:我国幅员辽阔且人口密度较大,地势多以丘陵和山地为主,且随着社会的发展以及人口的不断增长,国网电力公司接入的电能表等装置不断增多,电能表的故障诊断涉及到户外作业等等;这些现象均导致国网电力公司的工作量剧增,出现现场检测繁琐且覆盖面积狭小等问题。
现有的诊断系统的不足之处是其往往需要在建设中投入较多的软硬件设备,而不能合理利用现有用电信息采集系统平台所提供软硬件设备及数据进行远程诊断和预警,尤其在国网电力公司用电信息采集系统的现有软硬件设备内包含海量数据信息(如用户分类、通讯方式、用户抄表信息、用户日/月冻结数据、电能表数据等),且用电信息采集系统现有的大数据处理平台的数据并行处理模块可有效实现复杂模型的海量数据处理速度,因此,利用此平台所提供的现有软硬件设备及数据建立合理的异常诊断模型进行信息的深度分析与挖掘,发展电能计量装置的远程故障诊断系统以辅助用电信息采集系统实现电能表等设备的高效校验。
综上所述,现有技术中如何处理现有电能表的诊断系统现场检测繁琐、覆盖面积狭小的问题,以及如何有效利用现有的用电信息采集平台进行电能表运行状况远程、全面、智能、精准检测的检测与维护的问题,尚缺乏有效的解决方案。
发明内容
本发明为了解决上述问题,提供一种基于决策树群的多维电能表现场状态检验方法,实现在现有的国网电力公司用电信息采集系统平台基础上构建多维电能表现场状态检验系统,满足及时对在运电能表的运行状态进行检测预警的业务需求。
为了实现上述目的,本发明采用如下技术方案:
一种基于决策树群的多维电能表现场状态检验方法,包括以下步骤:
(1)将用电信息采集系统提供的电能表相关采集数据作为训练集,由训练集别建立决策树,并确定其判定属性类别与特征属性,树以单个节点为根开始;
(2)针对每棵决策树所拥有的特征属性进行初步处理,结合电力领域专家经验,取分割点,将连续特征属性离散化;
(3)根据所述步骤(2)中的分割点,以信息增益率的熵度量作为特征属性的启发信息,计算连续特征属性与离散特征属性的信息增益率;
(4)选择信息增益率最大的特征属性作为样本分类的特征属性,该特征属性成为节点的判定属性,对判定属性的每个已知的值创建一个分支,并据此将训练集进行分类形成下一级分枝;
(5)判断决策树的该节点是否满足停止生长条件,若不满足返回步骤(1),递归自上而下地形成每个归类上的样本决策树分枝,直至所有节点满足停止生长条件,生成完全生长的初级决策树;
(6)对初级决策树基于代价复杂性剪枝算法进行剪枝优化,依次剪去表面误差率增益值最低的分枝,每剪掉一枝生成一棵次级决策数;
(7)使用独立的测试集评估被剪枝优化后的初级决策树的准确率,若仍有较多噪声数据存在,则返回步骤(6),直至获得满足评估需求的一组剪枝优化后的初级决策树,每棵初级决策树生成一组次级决策树组;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网重庆市电力公司;国网重庆市电力公司电力科学研究院;国家电网公司,未经国网重庆市电力公司;国网重庆市电力公司电力科学研究院;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710244397.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





