[发明专利]一种用于电网运行设备的信息挖掘与数据质量的校验方法有效
| 申请号: | 201610147354.8 | 申请日: | 2016-03-16 |
| 公开(公告)号: | CN105718432B | 公开(公告)日: | 2019-02-01 |
| 发明(设计)人: | 李明 | 申请(专利权)人: | 北京睿新科技有限公司 |
| 主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/24;G06F17/25;G06N20/00;G06F8/30;G06T11/20;G06Q50/06 |
| 代理公司: | 苏州广正知识产权代理有限公司 32234 | 代理人: | 徐萍 |
| 地址: | 100015 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种用于电网运行设备的信息挖掘与数据质量的校验方法,(1)编写文学源文件;(2)执行文学源文件;(3)生成指定格式的报告或演示文档;(4)数据校验;(5)可视化校验。通过上述方式,本发明用于电网运行设备的信息挖掘与数据质量的校验方法通过采用文学化编程、机器学习技术、数据可视化,提高分析效率、节约人力成本、保证分析校验报告的客观性和可追溯性、便于可重复研究、提高异常数据的检验效率、分析方式直观易懂,在用于电网运行设备的信息挖掘与数据质量的校验方法的普及上有着广泛的市场前景。 | ||
| 搜索关键词: | 校验 电网运行设备 信息挖掘 源文件 机器学习技术 数据可视化 分析效率 可追溯性 人力成本 数据校验 异常数据 可视化 可重复 文档 编程 直观 分析 演示 节约 检验 保证 研究 | ||
【主权项】:
1.一种用于电网运行设备的信息挖掘与数据质量的校验方法,其特征在于,包括以下步骤:(1)编写文学源文件:所述文学源文件包括rnw格式和Rmd格式,所述文学源文件均包括文档模板和程序;(2)执行文学源文件:运行工具执行文学源文件自动完成内置的程序,执行数据读取、预处理以及数据分析步骤,并把来自所述文档模板的报告文字和格式描述通过所述程序返回的计算结果转换为一种标记语言,同时把程序生成的可视化图表保存为指定格式的图片文件;(3)生成指定格式的报告或演示文档:运行相应的标记语言转换工具,自动插入图片并生成指定格式的报告或演示文档;(4)数据校验:采用机器学习模型进行电网设备数据质量校验,所述机器学习模型包括局部回归模型和局部异常因子模型,所述局部回归模型采用等范围估计模型来预测设备的合理参数范围,再和实际数据进行对比,所述局部异常因子模型采用等离群指数模型,计算每个数据样本的“离群指数”,离群指数越高的样本有数据质量问题的可能性越大;(5)可视化校验:采用数据可视化方法进行电网设备数据质量校验。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京睿新科技有限公司,未经北京睿新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610147354.8/,转载请声明来源钻瓜专利网。





