[发明专利]一种发电厂故障数据诊断项目中的随机森林分类方法在审
| 申请号: | 202011300566.8 | 申请日: | 2020-11-19 |
| 公开(公告)号: | CN112364929A | 公开(公告)日: | 2021-02-12 |
| 发明(设计)人: | 蒋一波;冯缘 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/06 |
| 代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 发电厂 故障 数据 诊断 项目 中的 随机 森林 分类 方法 | ||
一种发电厂故障数据诊断项目中的随机森林分类方法,包括以下步骤:(1)构建成一级随机森林模型P1;(2)对原始样本集Y进行处理,筛选并去除每项样本中对应类别为漏报、误报的项,余下的样本集作为新的样本集Z,同时对测试集进行相同数据处理操作;(3)将Z作为原始样本集,重复步骤(1)中所有操作,得到二级随机森林模型P2,最终模型由P1、P2组合;(4)利用测试集对二层随机森林模型进行测试,评估模型性能并进行调试;(5)用随机森林分类器对新的数据进行判别与分类,分类结果按树分类器的投票多少而定,并将分类结果储存到数据库中。本发明对于存在大量误报、漏报的故障数据进行分层分类,分类性能好;避免过拟合。
技术领域
本发明涉及一种发电厂故障数据诊断项目中的随机森林分类方法。
背景技术
随着电网的发展和社会的进步,电力系统的规模也随之越来越大,结构越来越复杂,这就使得对电网的运行提出了更高的要求,加强对电网故障的诊断处理显得尤为重要。一般当电网发生故障时,监控设备会及时产生报警信息并上传,例如开关跳闸、自动保护装置动作、欠电压、过电流、设备过负荷等这些信息。特别是当一些结构、规模巨大的电力系统出现故障时,一时间系统会产生大量的报警信息,而这些信息中包括大量的由保护或断路器误动、拒动,信道传输干扰错误,保护动作时间偏差等因素造成的不确定性的知识和数据。
目前国内外提出了许多电力系统故障诊断的技术和方法主要有专家系统、人工神经网络、优化算法技术、petri网络、模糊集理论、粗糙集理论等,以上智能技术在应用于故障诊断时各有不同优点,但同时也暴露出许多的问题,例如专家系统的维护难度高,容错性差;人工神经网络缺乏对自身行为的解释能力,同时需要大量训练样本等。目前已有的发电厂故障数据诊断分类方法存在问题,无法同时保证准确率与效率,而在现实发电厂故障数据诊断系统的使用中,对诊断速度与准确率的要求都较高。
发明内容
为了克服现有技术的不足,本发明提供一种发电厂故障数据诊断项目中的分层随机森林分类方法,在决策树的基础上采用集成学习的思想,并在随机森林算法的基础上采用分层模型。通过一级随机森林对故障数据中大概率存在的误报、漏报,再由二级随机森林对故障进行分类。其中每层通过随机选择样本和随机选择特征进行训练生成随机森林。
本发明解决其技术问题所采用的技术方案是:
一种发电厂故障数据诊断项目中的随机森林分类方法,从发电厂故障数据诊断系统中提取数据,对数据进行预处理,得到原始样本集;所述的方法包括以下步骤:
(1)建立随机森林模型,过程如下:
(1.1)设Y为原始样本集,其中总共有x个样例,则每轮从原始样本集Y中通过Bootstraping(有放回抽样)的方式抽取x个样例,得到一个大小为x的训练集Yi,在原始样本集的抽取过程中,可能有被重复抽取的样例,也可能有一次都没有被抽到的样例,共进行a轮抽取,则每轮抽取的训练集分别为Y1,Y2,…,Ya,理论上被抽取到的样本占原始样本集的2/3,未被包含的数据被称为袋外数据。
(1.2)建立决策树,包括以下步骤:
(1.2.1)设每个样本有N个特征,指定一个数n=|log2N|,满足条件nN,在每个内部节点,从N个特征中随机选取出n个特征组成新的特征集Fi。从特征集Fi中选择一个最优属性对节点进行分裂;
(1.2.2)每个节点都按照步骤(1.2.1)来分裂,直到不能够再分裂为止。利用CART方法使每棵树最大限度地生长,不进行剪枝;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011300566.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





