[发明专利]一种异常用电样本清洗及行为识别方法有效
| 申请号: | 202110434285.X | 申请日: | 2021-04-22 |
| 公开(公告)号: | CN113204542B | 公开(公告)日: | 2023-08-22 |
| 发明(设计)人: | 龚立;王先培;田猛;姚鸿泰;饶佳豪 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F18/214;G06Q50/06 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 许莲英 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 异常 用电 样本 清洗 行为 识别 方法 | ||
本发明提出了一种异常用电样本清洗及行为识别方法。本发明通过用电信息营销系统采集用户日采样数据,构造面向搭载HPLC智能电表的数据样本;在数据样本中根据编号的排序连续性、数据完整性的有效性、相序的次序性进行筛选过滤无效样本得到有效样本;根据有效样本中用电信息的缺值、最值和波动阈值进行筛选区分异常样本和正常样本,形成包括训练样本与验证样本的混合样本;在训练样本中确定混合条件参数,满足不等式约束条件时形成样本集合权值、集合维度权值,在验证样本中根据不等式约束条件验证样本集合权值、集合维度权值并形成分割曲线,通过待测样本中样本集合权值、集合维度权值落点位置实现正常样本、异常样本的区分。
技术领域
本发明属于电力系统用电异常检测领域,尤其是涉及一种异常用电样本清洗及行为识别方法。
背景技术
电力系统的输配电损失主要源于技术损失和非技术损失,技术损失由电力系统中各器件作用的功率损耗组成,非技术损失主要由用户侧异常用电行为造成的损失。研究表明,因用户的异常用电行为在全国范围内造成的损失达数十亿人民币,而在中国电力市场化改革不断深入的环境下,电力企业需自担风险、自负盈亏,用电异常行为管理将直接决定电力企业的利润,因此异常用电行为检测具有十分重要的研究意义。
随着智能电表在电力系统中的普及率不断上升,传统的异常用电行为如暴力破坏电表、私自改装等大量减少,用户逐渐通过网络篡改、物理攻击等方式达到降低电费的目的,这对用户的异常用电行为检测带来了新的挑战:预处理阶段数据样本具有不一致性,存在大量的无效样本,导致正常样本与异常样本的提取较难;行为识别过程中,由于正常样本远远多于异常样本,采用传统的人工智能方法如决策树、支持向量机、神经网络等容易陷入局部最优解的情况,降低用电异常行为识别的准确度。
发明内容
本发明主要是解决现有技术所存在的技术问题:提供一种样本提取的方式,直接面向数据库对样本进行数据清洗,将有效样本和无效样本进行分离,达到提高数据质量的目的。
本发明还有一目的是解决现有技术所存在的技术问题:提供一种行为识别的方法,考虑有效样本中正常样本、异常样本数量的不平衡,将其混合进行识别,符合一定条件时输出并进行标记区分,提高异常样本识别的精度和准确度。
本发明的上述技术问题主要是通过下述技术方案得以解决的:
一种异常用电样本清洗及行为识别方法,其特征在于,包括以下步骤:
步骤1:通过用电信息营销系统采集用户日采样数据,构造面向搭载HPLC智能电表的数据样本;
步骤2:在数据样本中根据编号的排序连续性、数据完整性的有效性、相序的次序性进行筛选过滤无效样本,得到有效样本;
步骤3:根据有效样本中用电信息的缺值、最值和波动阈值进行筛选区分异常样本和正常样本,将正常样本、异常样本混合形成混合样本;
步骤4:在训练样本中结合样本特征参数与异常样本占比标签确定混合条件参数,满足不等式约束条件时形成样本集合权值、集合维度权值,在验证样本中结合样本特征参数与正常样本占比标签、不等式约束条件验证样本集合权值、集合维度权值并形成分割曲线,通过待测样本中样本集合权值、集合维度权值落点位置实现正常样本、异常样本的区分;
作为优选,步骤1所述数据样本为:
DS=[DSl]
DSl={SNl,DIl,EIl,PSl}
SNl={UIDl,MCIDl}
EIl={Il,Ul,Pl}
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110434285.X/2.html,转载请声明来源钻瓜专利网。





