[发明专利]基于决策树的电费异常数据分析方法、装置、设备及介质在审

专利信息
申请号: 202110860566.1 申请日: 2021-07-28
公开(公告)号: CN113538063A 公开(公告)日: 2021-10-22
发明(设计)人: 陶飞达;周纯;覃浩;康峰;钱正浩;冼文祥;伍广斌;白艳玲;舒畅;苏立伟;皮伟丰;廖云亭 申请(专利权)人: 广东电网有限责任公司;广东电网有限责任公司客户服务中心
主分类号: G06Q30/02 分类号: G06Q30/02;G06Q50/06;G06K9/62
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 陈旭红;钟文瀚
地址: 510000 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 决策树 电费 异常 数据 分析 方法 装置 设备 介质
【说明书】:

发明公开了一种基于决策树的电费异常数据分析方法、装置、设备及介质,方法包括:根据电力客户数据获取原始数据,采用插值法和填充法处理所述原始数据,获取实验数据;遍历所述实验数据确定的分割特征构建多个子集,获取多个所述子集对应的子结点,构造决策树模型;计算多个所述子集的信息增益比,获取对应所述子结点的判断特征;将待分析的第一电力客户数据输入到所述决策树模型;若所述第一电力客户数据不满足所述判断特征,则确定所述第一电力客户数据为异常用户数据,否则,确定所述第一电力客户数据为正常用户数据。本发明结合电力数据和决策树模型进行用户数据分析,降低识别异常数据的难度。

技术领域

本发明涉及电力数据分析的技术领域,尤其涉及一种基于决策树的电费异常数据分析方法、装置、设备及介质。

背景技术

目前的电网公司采用的电费异常检测技术包括,计量自动化系统远程在线监测、人工制定的逻辑判断规则等,也有利用人工智能的方法,如利用神经网络进行电费异常数据分析。在当前的技术中计量自动化系统远程在线监测功能经常误报,存在过多的无用信息,造成大量人力物力资源的浪费,以神经网络为模型的电费异常数据分析易出现过拟合现象,即对训练集过度学习,而且超参数较多不易调整,效果不明显,人工制定的逻辑判断规则,是以人工经验等主观因素主导具有较多不确定性,无法合理分析用电用户数据特征,在后期人工复核上必须耗费大量人力。

发明内容

本发明目的在于,提供一种基于决策树的电费异常数据分析方法、装置、设备及介质,以解决现有技术分析电费异常产生过拟合现象以及成本偏高的问题。

为实现上述目的,本发明提供一种基于决策树的电费异常数据分析方法,包括:

根据实验数据确定的分割特征构建多个子集,获取多个所述子集对应的子结点,根据多个所述子结点构造决策树模型,其中,所述实验数据根据电力客户数据确定;

分别计算所述决策树模型中所述子集的信息增益比,获取所述子集的判断特征;

将待分析的第一电力客户数据输入到所述决策树模型;

若所述第一电力客户数据不满足所述判断特征,则确定所述第一电力客户数据为异常用户数据,否则,确定所述第一电力客户数据为正常用户数据。

优选地,所述实验数据,包括:

对所述电力客户数据进行异常值和缺失值处理,获取处理结果,并对所述处理结果采用数据归一化的方式获取所述实验数据,如下:

其中,xi表示一段时间内的用电量,i表示同等采样时间间隔下的顺序时间序列,xi-1,xi+1表示缺失值前数据和缺失值后的数据,NaN表示数据未定义或不可表示的值,mean(x)表示一天各个时间段总用电量x的平均值,std(x)表示一天各个时间段总用电量x的标准差,Xi表示处理结果,zi表示实验数据。

优选地,所述构造决策树模型,包括:

遍历所述实验数据,将所述实验数据划分为训练集和测试集;

根据所述训练集的所述分割特征确定多个所述子集,计算多个所述子集的最大信息增益比,获取分类结点,构建决策树模型,根据所述测试集逐级测试所述决策树模型,获取优化后的决策树模型。

优选地,所述分别计算所述决策树模型中所述子集的信息增益比,获取所述子集的判断特征,具体包括:

根据所述优化后的决策树模型的度量指标以及信息增益计算信息增益比,选取所述子集的最大信息增益比作为所述判断特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司;广东电网有限责任公司客户服务中心,未经广东电网有限责任公司;广东电网有限责任公司客户服务中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110860566.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top