[发明专利]一种基于迭代KNN和插补优先级的DGA数据缺失值插补方法有效
申请号: | 201811481857.4 | 申请日: | 2018-12-05 |
公开(公告)号: | CN109784362B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 申扬;刘树吉;郭昆亚;乔林;陈硕;刘颖;孙宝华;刘为;曲睿婷;李云鹏;李静;刘云飞 | 申请(专利权)人: | 国网辽宁省电力有限公司信息通信分公司;南京航空航天大学;国家电网有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G01N33/00 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 戴朝荣 |
地址: | 110004*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 knn 优先级 dga 数据 缺失 值插补 方法 | ||
本发明提供了一种基于迭代KNN和插补优先级的DGA数据缺失值插补方法。所述基于迭代KNN和插补优先级的DGA数据缺失值插补方法包括如下步骤:步骤1:通过能够处理缺失值的XGBoost集成分类器对DGA数据集进行训练,得到每个属性作为划分属性的次数、作为划分属性时的平均增益和平均覆盖度;步骤2:将步骤1得到的数据用于计算不同属性对于分类结果的重要性以及相对应的插补优先级,且还计算相同缺失属性的不同样本的插补优先级;步骤3:根据步骤2得到的插补优先级和KNN对缺失值进行迭代的插补,直到达到收敛条件。
技术领域
本发明属于变压器故障诊断技术领域,具体地涉及一种基于迭代KNN和插补优先级的DGA数据缺失值插补方法。
背景技术
近年来,随着全球智能电网的飞速发展,国家电网公司为我国的智能电网建设提出了新的要求,发展高速、高效的智能电网系统变得势在必行。电网的历史数据就是智能电网信息化建设的数据基础。然而在实际中,各个变电站的数据在提取和传输时,会产生海量的杂乱无章的数据,其数量级别是呈指数级增长的,这些数据在传输和使用的过程中,有相当一部分数据因为人为因素或客观因素发生了缺失的现象,对智能电网的信息化建设带来了很大的不便。为了提高电网数据的质量,保障数据的完整性,为智能电网的发展扫清障碍,解决电网数据缺失是很有必要的。
电力变压器是电力系统中的关键设备,在变压器的运行过程中,变压器可能会遇到电气或者热干扰,导致电弧、放电、热故障等问题。这些故障会产生一些关键特殊的气体,例如氢气(H2),乙炔(C2H2),乙烯(C2H4),甲烷(CH4),乙烷(C2H6)和一氧化碳(CO),这些气体溶解在变压器的绝缘油中,并超过一定的阈值。如果对这些问题不进行及时的处理,可能会导致变压器的故障和运作中断,对家庭、企业的供电造成影响,甚至可能是爆炸等更加严重的问题。因此,对变压器的早期故障进行诊断是非常有必要的。在工业实践的充油变压器中,溶解气体分析(DGA)就是一个用于对变压器的早期故障进行诊断的工具,对即将发生的变压器故障发出警告。DGA使用的是关键气体的浓度,气体浓度之间的比值等。然后通过IEC比值,Rogers比值等老旧的方式对变压器的故障进行预测。这些方法的准确率不高且不同的方法常常会给出不同的预测,给人造成困扰。所以,目前出现了很多基于机器学习的方法来对DGA气体进行学习和预测,比如SVM,分类回归树,BPNN等方法。
上面提到的这些方法通过DGA气体的含量和比率来诊断故障,不管是阈值的方法还是机器学习的方法。但是,在一些情况下,传感器测量的数据会存在不完整的数据,这不利于变压器的故障诊断方法,可能会导致未知或者不确定的问题。数据在传输过程中,会产生很多的缺失,产生缺失的原因大致可分为两类,主观原因和客观原因。人为因素所导致的数据采集或传输造成的数据缺失可称为主观原因,如录入数据失误、工作失职或有意伪造数据所造成的数据缺失。设备故障、路线中断等客观原因所造成的数据缺失可称为客观原因,如数据存储失败、变电站机械故障、数据传输路线截断等。这些缺失问题不仅会导致阈值方法的失效,也会降低机器学习算法的性能,随着数据集中缺失值的增加,学习算法的预测精度会同时降低。
发明内容
本发明的目的在于针对现有技术的缺陷或问题,提供一种基于迭代KNN和插补优先级的DGA数据缺失值插补方法。
本发明的技术方案如下:一种基于迭代KNN和插补优先级的DGA数据缺失值插补方法,包括如下步骤:
步骤1:通过能够处理缺失值的XGBoost集成分类器对DGA数据集进行训练,得到每个属性作为划分属性的次数number、作为划分属性时的平均增益gain和平均覆盖度cover;
步骤2:将步骤1得到的数据用于计算不同属性对于分类结果的重要性以及相对应的插补优先级,且还计算相同缺失属性的不同样本的插补优先级;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网辽宁省电力有限公司信息通信分公司;南京航空航天大学;国家电网有限公司,未经国网辽宁省电力有限公司信息通信分公司;南京航空航天大学;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811481857.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:贝类产品分类识别方法及装置
- 下一篇:一种远程监控视频的传输方法及其传输装置