[发明专利]一种用于电网运行设备的信息挖掘与数据质量的校验方法有效

专利信息
申请号: 201610147354.8 申请日: 2016-03-16
公开(公告)号: CN105718432B 公开(公告)日: 2019-02-01
发明(设计)人: 李明 申请(专利权)人: 北京睿新科技有限公司
主分类号: G06F17/22 分类号: G06F17/22;G06F17/24;G06F17/25;G06N20/00;G06F8/30;G06T11/20;G06Q50/06
代理公司: 苏州广正知识产权代理有限公司 32234 代理人: 徐萍
地址: 100015 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 校验 电网运行设备 信息挖掘 源文件 机器学习技术 数据可视化 分析效率 可追溯性 人力成本 数据校验 异常数据 可视化 可重复 文档 编程 直观 分析 演示 节约 检验 保证 研究
【权利要求书】:

1.一种用于电网运行设备的信息挖掘与数据质量的校验方法,其特征在于,包括以下步骤:

(1)编写文学源文件:

所述文学源文件包括rnw格式和Rmd格式,所述文学源文件均包括文档模板和程序;

(2)执行文学源文件:

运行工具执行文学源文件自动完成内置的程序,执行数据读取、预处理以及数据分析步骤,并把来自所述文档模板的报告文字和格式描述通过所述程序返回的计算结果转换为一种标记语言,同时把程序生成的可视化图表保存为指定格式的图片文件;

(3)生成指定格式的报告或演示文档:

运行相应的标记语言转换工具,自动插入图片并生成指定格式的报告或演示文档;

(4)数据校验:

采用机器学习模型进行电网设备数据质量校验,所述机器学习模型包括局部回归模型和局部异常因子模型,

所述局部回归模型采用等范围估计模型来预测设备的合理参数范围,再和实际数据进行对比,

所述局部异常因子模型采用等离群指数模型,计算每个数据样本的“离群指数”,离群指数越高的样本有数据质量问题的可能性越大;

(5)可视化校验:

采用数据可视化方法进行电网设备数据质量校验。

2.根据权利要求1所述的用于电网运行设备的信息挖掘与数据质量的校验方法,其特征在于,步骤(1)中的所述rnw格式的文学源文件采用Sweave和pdfLaTeX转换工具自动生成分析报告,其中,Sweave:是R语言的一个扩展包。

3.根据权利要求1所述的用于电网运行设备的信息挖掘与数据质量的校验方法,其特征在于,步骤(1)中的所述Rmd格式的文学源文件采用knitr和Pandoc转换工具自动生成分析报告,其中,knitr:一种动态自动化报告的R语言扩展包。

4.根据权利要求1所述的用于电网运行设备的信息挖掘与数据质量的校验方法,其特征在于,步骤(1)中的所述文档模板包括文档格式和叙述性文字,所述叙述性文字的段落内部包括所述程序生成的数字和文本,以便于根据数据自动生成含有统计结果的文字段落,所述文档模板还包括为程序运行结果预留单独的段落,用于插入程序生成的表格和图表。

5.根据权利要求1所述的用于电网运行设备的信息挖掘与数据质量的校验方法,其特征在于,步骤(1)中的所述程序包括自动化数据的导入程序、清理程序、转换程序和分析程序,结合行业知识经验的设备数据质量校验方法,在分析过程中融入以往经验的数据检验规则,所述程序还调用机器学习及可视化扩展包来进行高级分析,所述文学源文件中的程序输出包括数字、文本、表格和图表。

6.根据权利要求1所述的用于电网运行设备的信息挖掘与数据质量的校验方法,其特征在于,步骤(2)中的所述标记语言为LaTeX或者Markdown。

7.根据权利要求6所述的用于电网运行设备的信息挖掘与数据质量的校验方法,其特征在于,步骤(3)中对于LaTeX格式的标记语言,调用pdfLaTeX转换工具,生成pdf格式文件。

8.根据权利要求6所述的用于电网运行设备的信息挖掘与数据质量的校验方法,其特征在于,步骤(3)中对于Markdown格式的标记语言,调用Pandoc转换工具,生成多种文件格式的报告,包括与Word通用的docx文件、pdf文件以及适用于浏览器的html文件。

9.根据权利要求1所述的用于电网运行设备的信息挖掘与数据质量的校验方法,其特征在于,步骤(2)与步骤(3)采用逐一处理方式或者分批处理方式。

10.根据权利要求1所述的用于电网运行设备的信息挖掘与数据质量的校验方法,其特征在于,步骤(5)中的所述数据可视化方法包括平行坐标系法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京睿新科技有限公司,未经北京睿新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610147354.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top