[发明专利]一种异常用电样本清洗及行为识别方法有效
| 申请号: | 202110434285.X | 申请日: | 2021-04-22 |
| 公开(公告)号: | CN113204542B | 公开(公告)日: | 2023-08-22 |
| 发明(设计)人: | 龚立;王先培;田猛;姚鸿泰;饶佳豪 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F18/214;G06Q50/06 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 许莲英 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 异常 用电 样本 清洗 行为 识别 方法 | ||
1.一种异常用电样本清洗及行为识别方法,其特征在于,包括以下步骤:
步骤1:通过用电信息营销系统采集用户日采样数据,构造面向搭载HPLC智能电表的数据样本;
步骤2:在数据样本中根据编号的排序连续性、数据完整性的有效性、相序的次序性进行筛选过滤无效样本,得到有效样本;
步骤3:根据有效样本中用电信息的缺值、最值和波动阈值进行筛选区分异常样本和正常样本,将正常样本、异常样本混合形成混合样本;
步骤4:在训练样本中结合样本特征参数与异常样本占比标签确定混合条件参数,满足不等式约束条件时形成样本集合权值、集合维度权值,在验证样本中结合样本特征参数与正常样本占比标签、不等式约束条件验证样本集合权值、集合维度权值并形成分割曲线,通过待测样本中样本集合权值、集合维度权值落点位置实现正常样本、异常样本的区分;
步骤3所述有效样本VS中用电信息具体为:
EIm,i,j={Im,i,j、Um,i,j、Pm,i,j};
其中,Im,i,j代表第m个用户在i时刻进行j次采样得到的电流,Um,i,j代表第m个用户在i时刻进行j次采样得到的电压,Pm,i,j代表第m个用户在i时刻进行j次采样得到的功率;
其中,i代表用户日采样数据的单位时间个数,j代表单位时间的采样次数;
步骤3所述根据用电信息的缺值进行筛选区分为:第m个用户电流Im,i,j、电压Im,i,j、功率Pm,i,j中在i时刻采样次数与j相同,否则视VSm为异常样本;
步骤3所述根据用电信息最值进行筛选区分为:第m个用户功率Pm,i,j最小值与最大值具有非负性,否则视VSm为异常样本;
步骤3所述根据用电信息波动阈值进行筛选区分为:第m个用户Im,i,j、Um,i,j、Pm,i,j在采样过程中阶段性平稳变化,否则视VSm为异常样本;
从有效样本VS中统计视为VSm的异常样本,形成异常样本DataA,剩余的有效样本作为正常样本DataB;
DataA=[DataAo]
DataB=[DataBp]
o∈[1,O]
p∈[1,P]
OP≤M
其中,DataA代表所有的异常样本集合,o代表异常样本的个数,DataAo代表第o个异常样本,O代表异常样本数量上限,DataB代表所有的正常样本集合,p代表正常样本的个数,DataBp代表第p个正常样本,P代表正常样本数量上限;
步骤3所述将正常样本、异常样本混合为:
引入样本比值ratio缩小进行训练时异常样本DataA与正常样本DataB样本数量差距,并形成混合样本Data;
Data=ratio*Num(DataB)+(1-ratio)*Num(DataA)
其中,Num(DataA)代表异常样本的数量,Num(DataB)代表正常样本的数量,ratio代表样本比值,Data代表混合样本,T1代表训练样本,T2代表验证样本;
步骤4所述的样本划分为:在样本Data通过随机抽样的方式形成训练样本T1,获取其均值b1、特征向量c1和特征值c2,并对特征值c2采用对角矩阵扩充的方式形成特征矩阵c3;
T1=random(Data)
b1=average(T1)
[c1,c2]=characteristic(T1)
c3=[|c2|]
其中,T1代表从样本Data随机选择任意数量样本形成的训练样本,b1代表样本T1的均值,c1、c2是对样本T1进行特征变化后获得的特征参数,c1代表样本T1的特征向量,c2代表样本T1的特征值,c3为扩充后的特征值矩阵;
步骤4所述的样本划分为:在样本Data、T1的基础上确定异常样本占比标签d1、异常样本-剩余样本占比标签d2,通过混合条件、二次范式求解及不等式约束关系确定适用于样本区分的平面分割参数样本集合权值e1、集合维度权值e2;
f=||e1||·e2·x+e3
其中,d1代表样本T1在满足混合条件f与样本Data的异常样本占比标签,d2代表剩余样本在满足混合条件f与样本Data的异常样本-剩余样本占比标签,混合条件f与权值、输入样本相关,x代表数据来源为样本T1时当前输入样本,e1代表样本集合权值,e2代表集合维度权值,e3代表偏置相,当满足约束条件时输出e1、e2;
步骤4所述的样本验证为:随机从有效样本VS中选取样本形成混合样本,即在样本Data中排除样本T1形成样本T2;特别的,样本T1输出权值e1、e2必须满足不等式约束条件,才能从样本Data中进行排除;
T2=random(Data)
其中,T2代表从样本Data随机选择任意数量样本形成的验证样本;
步骤4所述的样本验证为:在样本Data、T2的基础上确定正常样本占比标签d3、正常样本-剩余样本占比标签d4,并通过对约束条件的调整实现样本验证的互补,当样本集合权值e1、集合维度权值e2满足不等式约束条件则认为e1、e2为最终权值;
f;=||e1||·e2·x;+e3
其中,d3代表样本T2在满足混合条件f;与样本Data的正常样本占比标签,d4代表剩余样本在满足混合条件f;与样本Data的正常样本-剩余样本占比标签,混合条件f;与权值、输入样本相关,x;代表数据来源为样本T2时当前输入样本,当满足约束条件时则认为e1、e2为最终权值;
步骤4所述的样本识别为:通过最终权值e1、e2构建分割曲线,获取待测样本的样本集合权值e1*、集合维度权值e2*权值,(e1*,e2*)的落点在曲线左侧则为正常样本,落点在曲线右侧则为异常样本,实现正常样本、异常样本的区分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110434285.X/1.html,转载请声明来源钻瓜专利网。





