[发明专利]一种异常用电样本清洗及行为识别方法有效

申请号：	202110434285.X	申请日：	2021-04-22
公开（公告）号：	CN113204542B	公开（公告）日：	2023-08-22
发明（设计）人：	龚立;王先培;田猛;姚鸿泰;饶佳豪	申请（专利权）人：	武汉大学
主分类号：	G06F16/215	分类号：	G06F16/215;G06F18/214;G06Q50/06
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	许莲英
地址：	430072 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种异常用电样本清洗行为识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种异常用电样本清洗及行为识别方法，其特征在于，包括以下步骤：

步骤1：通过用电信息营销系统采集用户日采样数据，构造面向搭载HPLC智能电表的数据样本；

步骤2：在数据样本中根据编号的排序连续性、数据完整性的有效性、相序的次序性进行筛选过滤无效样本，得到有效样本；

步骤3：根据有效样本中用电信息的缺值、最值和波动阈值进行筛选区分异常样本和正常样本，将正常样本、异常样本混合形成混合样本；

步骤4：在训练样本中结合样本特征参数与异常样本占比标签确定混合条件参数，满足不等式约束条件时形成样本集合权值、集合维度权值，在验证样本中结合样本特征参数与正常样本占比标签、不等式约束条件验证样本集合权值、集合维度权值并形成分割曲线，通过待测样本中样本集合权值、集合维度权值落点位置实现正常样本、异常样本的区分；

步骤3所述有效样本VS中用电信息具体为：

EI_m,i,j＝{I_m,i,j、U_m,i,j、P_m,i,j}；

其中，I_m,i,j代表第m个用户在i时刻进行j次采样得到的电流，U_m,i,j代表第m个用户在i时刻进行j次采样得到的电压，P_m,i,j代表第m个用户在i时刻进行j次采样得到的功率；

其中，i代表用户日采样数据的单位时间个数，j代表单位时间的采样次数；

步骤3所述根据用电信息的缺值进行筛选区分为：第m个用户电流I_m,i,j、电压I_m,i,j、功率P_m,i,j中在i时刻采样次数与j相同，否则视VS_m为异常样本；

步骤3所述根据用电信息最值进行筛选区分为：第m个用户功率P_m,i,j最小值与最大值具有非负性，否则视VS_m为异常样本；

步骤3所述根据用电信息波动阈值进行筛选区分为：第m个用户I_m,i,j、U_m,i,j、P_m,i,j在采样过程中阶段性平稳变化，否则视VS_m为异常样本；

从有效样本VS中统计视为VS_m的异常样本，形成异常样本DataA，剩余的有效样本作为正常样本DataB；

DataA＝[DataA_o]

DataB＝[DataB_p]

o∈[1,O]

p∈[1,P]

OP≤M

其中，DataA代表所有的异常样本集合，o代表异常样本的个数，DataA_o代表第o个异常样本，O代表异常样本数量上限，DataB代表所有的正常样本集合，p代表正常样本的个数，DataB_p代表第p个正常样本，P代表正常样本数量上限；

步骤3所述将正常样本、异常样本混合为：

引入样本比值ratio缩小进行训练时异常样本DataA与正常样本DataB样本数量差距，并形成混合样本Data；

Data＝ratio*Num(DataB)+(1-ratio)*Num(DataA)

其中，Num(DataA)代表异常样本的数量，Num(DataB)代表正常样本的数量，ratio代表样本比值，Data代表混合样本，T₁代表训练样本，T₂代表验证样本；

步骤4所述的样本划分为：在样本Data通过随机抽样的方式形成训练样本T₁，获取其均值b₁、特征向量c₁和特征值c₂，并对特征值c₂采用对角矩阵扩充的方式形成特征矩阵c₃；

T₁＝random(Data)

b₁＝average(T₁)

[c₁,c₂]＝characteristic(T₁)

c₃＝[|c₂|]

其中，T₁代表从样本Data随机选择任意数量样本形成的训练样本，b₁代表样本T₁的均值，c₁、c₂是对样本T₁进行特征变化后获得的特征参数，c₁代表样本T₁的特征向量，c₂代表样本T₁的特征值，c₃为扩充后的特征值矩阵；

步骤4所述的样本划分为：在样本Data、T₁的基础上确定异常样本占比标签d₁、异常样本-剩余样本占比标签d₂，通过混合条件、二次范式求解及不等式约束关系确定适用于样本区分的平面分割参数样本集合权值e₁、集合维度权值e₂；

f＝||e₁||·e₂·x+e₃

其中，d₁代表样本T₁在满足混合条件f与样本Data的异常样本占比标签，d₂代表剩余样本在满足混合条件f与样本Data的异常样本-剩余样本占比标签，混合条件f与权值、输入样本相关，x代表数据来源为样本T₁时当前输入样本，e₁代表样本集合权值，e₂代表集合维度权值，e₃代表偏置相，当满足约束条件时输出e₁、e₂；

步骤4所述的样本验证为：随机从有效样本VS中选取样本形成混合样本，即在样本Data中排除样本T₁形成样本T₂；特别的，样本T₁输出权值e₁、e₂必须满足不等式约束条件，才能从样本Data中进行排除；

T₂＝random(Data)

其中，T₂代表从样本Data随机选择任意数量样本形成的验证样本；

步骤4所述的样本验证为：在样本Data、T₂的基础上确定正常样本占比标签d₃、正常样本-剩余样本占比标签d₄，并通过对约束条件的调整实现样本验证的互补，当样本集合权值e₁、集合维度权值e₂满足不等式约束条件则认为e₁、e₂为最终权值；

f^；＝||e₁||·e₂·x^；+e₃

其中，d₃代表样本T₂在满足混合条件f^；与样本Data的正常样本占比标签，d₄代表剩余样本在满足混合条件f^；与样本Data的正常样本-剩余样本占比标签，混合条件f^；与权值、输入样本相关，x^；代表数据来源为样本T₂时当前输入样本，当满足约束条件时则认为e₁、e₂为最终权值；

步骤4所述的样本识别为：通过最终权值e₁、e₂构建分割曲线，获取待测样本的样本集合权值e₁^*、集合维度权值e₂^*权值，(e₁^*,e₂^*)的落点在曲线左侧则为正常样本，落点在曲线右侧则为异常样本，实现正常样本、异常样本的区分。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉大学，未经武汉大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110434285.X/1.html，转载请声明来源钻瓜专利网。

上一篇：一种污水处理用微生物营养液及其制备方法和应用
下一篇：一种含Q相改性硫铝酸盐水泥及其制备方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种异常用电样本清洗及行为识别方法有效

专利文献下载