[发明专利]一种用于对输变电可靠性评估大数据进行清洗的方法及系统在审
| 申请号: | 201911417323.X | 申请日: | 2019-12-31 |
| 公开(公告)号: | CN111198979A | 公开(公告)日: | 2020-05-26 |
| 发明(设计)人: | 高波;陈颖;张萌萌;吴磊;葛磊蛟;于之虹;吕颖;鲁广明;史冬宇;侯金秀;王兵;张璐路;魏亚威;贾育培;解梅;戴红阳;蔡顺友 | 申请(专利权)人: | 中国电力科学研究院有限公司;天津大学 |
| 主分类号: | G06F16/906 | 分类号: | G06F16/906;G06Q50/06 |
| 代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 白晓晰 |
| 地址: | 100192 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 变电 可靠性 评估 数据 进行 清洗 方法 系统 | ||
本发明公开了一种用于对输变电可靠性评估大数据进行清洗的方法及系统,其中方法包括:通过层次聚类CURE算法对待测试的样本数据进行聚类,获取正常样本数据的聚类簇;基于正常样本数据的聚类簇选取边界样本数据;根据基于边界样本的异常数据识别算法,对所述待测试样本数据中的异常数据进行识别,识别出异常数据;对识别出的异常数据在所述待测试样本数据中的位置进行标注;根据所述异常数据的标注的位置,对所述异常数据应用指数加权移动平均数法进行修正,获取所述异常数据的修正结果;利用所述修正结果替换所述样本数据中的异常数据。
技术领域
本发明涉及电网企业对输变电可靠性评估技术领域,更具体地,涉及一种用于对输变电可靠性评估大数据进行清洗的方法及系统。
背景技术
随着《中国电力大数据发展白皮书》的发布,带动了电力行业内对输变电可靠性评估大数据研究热潮,准确、可靠是保证输变电可靠性评估大数据分析处理精准性的基本要求,因此对输变电可靠性评估大数据质量提出了更高的要求,输变电可靠性评估大数据清洗可有效保证输变电可靠性评估大数据质量的正确性、完整性、一致性、可靠性。
输变电可靠性评估大数据具有数量大、维度高,数据模式繁多等特征,在输变电可靠性评估大数据的采集过程中,其不可避免的存在异常数据,对输变电可靠性评估大数据清洗有很强的必要性。国内外对输变电可靠性评估大数据清洗研究主要有聚类和关联分析、条件函数依赖、马尔科夫模型、DS证据理论。大部分数据清洗技术都需要依赖数据模型本身构建异常数据识别规则,对检测到的异常数据做删除或均值填充处理,破坏了数据的连续性、完整性、准确性。综合国内外研究,输变电可靠性评估大数据清洗难点表现在以下几点:(1)输变电可靠性评估大数据数据模型繁多,数据种类各异,不宜直接构建输变电可靠性评估大数据异常数据识别规则;(2)正常数据多,异常数据少,不同类型的输变电可靠性评估大数据很难通过设定阈值来进行简单异常识别;(3)异常识别将异常数据剔除,破坏了数据的连续性;(4)对异常数据进行重构时,需要依赖外源数据。
因此,需要一种技术,以实现用于对输变电可靠性评估大数据进行清洗的技术。
发明内容
本发明技术方案提供了一种用于对输变电可靠性评估大数据进行清洗的方法及系统,以解决如何基于输变电可靠性评估大数据进行清洗的问题。
为了解决上述问题,本发明提供了一种用于对输变电可靠性评估大数据进行清洗的方法,所述方法包括:
通过层次聚类CURE算法对待测试的样本数据进行聚类,获取正常样本数据的聚类簇;
基于正常样本数据的聚类簇选取边界样本数据;
根据基于边界样本的异常数据识别算法,对所述待测试样本数据中的异常数据进行识别,识别出异常数据;
对识别出的异常数据在所述待测试样本数据中的位置进行标注;
根据所述异常数据的标注的位置,对所述异常数据应用指数加权移动平均数法进行修正,获取所述异常数据的修正结果;
利用所述修正结果替换所述样本数据中的异常数据。
优选地,通过层次聚类CURE算法在对待测试的样本数据进行聚类时,消除离群点,包括:
将所述待测试的样本数据划分为数据块,对每个划分的数据块进行聚类,得到的数据簇表示为pi(mpi,wi),其中pi表示块中第i个簇,以及第i个簇的中心点,mpi表示每个中心点的权重值,wi是每个簇中数据的个数,每个划分的数据块包括多个代表点;
设多个代表点的集合为P,其中每个代表点的中心点到数据簇外任意一点的偏差距离表示为代表点的离群程度:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电力科学研究院有限公司;天津大学,未经中国电力科学研究院有限公司;天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911417323.X/2.html,转载请声明来源钻瓜专利网。





