[发明专利]基于孤立森林算法的用电信息采集数据异常分析方法在审

专利信息
申请号: 201910399385.6 申请日: 2019-05-14
公开(公告)号: CN110189232A 公开(公告)日: 2019-08-30
发明(设计)人: 马辉;韩笑;鲁海鹏 申请(专利权)人: 三峡大学
主分类号: G06Q50/06 分类号: G06Q50/06
代理公司: 宜昌市三峡专利事务所 42103 代理人: 吴思高
地址: 443002 *** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 线损 算法 数据异常 台区 孤立 用电信息采集系统 用电信息采集 数据挖掘 台区用电 线损管理 森林 脏数据 筛选 分析 受试者工作特征 数据分析模型 信息数据采集 表现形式 技术实现 模型评估 模型应用 数据变换 信息数据 异常用户 有效挖掘 查全率 加强台 云存储 区线 去除 应用 噪音 转换 分类 制定 管理
【权利要求书】:

1.基于孤立森林算法的用电信息采集数据异常分析方法,其特征在于包括以下步骤:

步骤一:建立基于用电信息采集系统的台区线损管理指标,制定基于用电信息采集系统的台区线损管理方法;

步骤二:针对线损类台区,采用云存储技术实现多个线损类台区用电信息数据采集、分类、处理;

步骤三:分析总结脏数据的类型,根据其表现形式消除噪音;

步骤四:通过数据变换将经过清理筛选后的数据,转换为利于数据挖掘的形式;

步骤五:应用孤立森林算法建立数据分析模型,并应用受试者工作特征ROC曲线与曲线下面积AUC、及累积查全率曲线与P-R曲线,以查准率为纵轴,查全率为横轴作图,进行模型评估,并将此模型应用到多个线损类台区用电信息数据集上,对经过筛选后的数据进行数据挖掘,筛选用电异常用户。

2.根据权利要求1所述基于孤立森林算法的用电信息采集数据异常分析方法,其特征在于:步骤一中,建立的台区线损管理指标包括覆盖类、户变类、可采类、数据类、线损类五种状态标识及其层级关系;

覆盖类:台区内采集设备安装率未达到100%;

户变类:采集覆盖率已达到100%的台区,但户变关系尚不准确;

可采类:釆集覆盖率己达到100%,但可采率尚未达到95%;

数据类:覆盖率达到100%、可采率达到95%且户变关系正确,但采集的数据与人工抄表数据误差大于均值;

线损类:覆盖率、可采率、准确率均已达到100%且户变关系正确,但线损率异常。

3.根据权利要求1所述基于孤立森林算法的用电信息采集数据异常分析方法,其特征在于:步骤二中,采用云存储的分布式文件存储机制,将用电信息数据分散存储在多台独立的存储服务器上,它包括卷管理、元数据管理、块数据管理服务;

元数据是指文件的名称、属性、数据块位置信息;

块数据是指文件数据被按照一定大小分割而成的多个数据块,分布存储到不同的存储节点服务器上,由一对元数据服务器及其管理的存储服务器节点所提供的存储空间称为一个卷空间;

卷管理服务器负责将多个卷虚拟化整合,对外提供统一的整体访问云实时存储平台空间。

4.根据权利要求1所述基于孤立森林算法的用电信息采集数据异常分析方法,其特征在于:步骤五中,孤立森林算法,是一个二阶段算法:

第一阶段,构建t个iTree组成的孤立森林,其实现步骤如下:

(1)、从训练数据中随机选择ψ个点样本点作为子样本集,放入树的根节点;

(2)、随机指定一个维度,在当前节点数据中随机产生一个切割点P;

(3)、以此切割点生成一个超平面,将当前节点数据空间划分为2个子空间:把指定维度里小于P的数据放在当前节点的左边,把大于等于p的数据放在当前节点的右边;

(4)、在子节点中递归步骤(1)和(2),不断构造新的子节点,直到数据本身不可再分或树的深度达到log2ψ;

第二阶段,用生成的iForest来评估测试数据,对被检测样本计算异常分值;对于任一数据x令其遍历每一棵iTree,得出x在iTree所处的深度及在每棵iTree所处的平均深度h(x),从而计算样本的异常分值;被检测样本x的异常分值定义如下式所示:

其中:h(x)是被检测样本x在iTree中检索到的节点的深度;E(h(x))是对所有t个iTree取均值;c(ψ)是ψ个点构建的二分搜索树的平均路径长度;H(k)=ln(k)+ζ,ζ为欧拉常数;

观察异常分值的定义式,可知:当E(h(x))→0,s→1;当E(h(x))→ψ-1,s→0;当E(h(x))→c(ψ),s→0.5;即s(x)越接近1表示异常数据的可能性高,越接近0表示是正常点的可能性比较高。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三峡大学,未经三峡大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910399385.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top