[发明专利]一种基于多标签置信度比较的智能电表故障分类方法在审
申请号: | 202210569747.3 | 申请日: | 2022-05-24 |
公开(公告)号: | CN115099306A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 高欣;孟之航;贾欣;薛冰;黄子健;傅世元;黄旭;张光耀 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 置信 比较 智能 电表 故障 分类 方法 | ||
1.一种基于多标签置信度比较的智能电表故障分类方法,其特征在于,包括如下步骤:
(1)对智能电表不同故障类别下的历史数据进行划分,得到多个二类数据集,作为输入数据,具体为:
对智能电表实际故障数据集进行处理,该数据集中的样本共包含9种特征变量,分别是:工作时长、到货批次号、供电单位编号、电能表类别、故障识别月份、安装月份、省份、设备规格、通讯方式、设备标识;其故障类别标签共包含11类,分别是:外观故障、计量故障、存储单元故障、处理单元故障、显示单元故障、控制单元故障、电源单元故障、通讯单元故障、时钟单元故障、其它故障、软件故障;遍历数据集中的每一类样本,将该类别下所有样本作为少数类样本集,其余各故障类别样本作为多数类样本集,将原数据集转化为11个二类数据集;对于其中每个二类数据集,均可将该数据集描述为:
Xi=[Xmin,Xmaj]
其中,Xi为11个转化后的二类数据集中的任意一个,i∈[1,11];Xmin为二类数据集Xi中的少数类样本集,其中各样本类别标签被设定为1;Xmaj为二类数据集Xi中的多数类样本集,其中各样本类别标签被设定为0;Xi的大小为Gi=len(Xi),len(Xi)表示二类数据集Xi中的样本个数;通过上述操作,将原先的不平衡多分类问题转换为了多个不平衡二分类问题进行处理;
(2)遍历各二类数据集中的每个样本,将其作为目标样本并在该样本的近邻样本池中进行多次随机采样,构成多个差异化的目标-近邻样本对,具体为:
基于步骤(1)中得到的11个不平衡二类数据集中的任意一个Xi=[Xmin,Xmaj],构建差异化的目标-近邻样本对数据集:
对于任意一个二类数据集Xi中的任一样本xi,将其作为目标样本,构造多组差异化的目标-近邻样本对,具体为:使用KNN算法寻找目标样本xi在二类数据集Xi中的K个近邻样本,得到xi的近邻样本池;在近邻样本池中随机采样m个样本,m的大小小于K,生成目标-近邻样本对ci=(xi,p(xi));
其中,K是近邻样本池的大小,m是随机采样次数;目标-近邻样本对ci由目标样本xi和对照样本组p(xi)组成,对照样本组p(xi)由在目标样本xi的近邻样本池中采样得到的m个近邻样本xj构成,j∈[1,m];在构造过程中,设置了控制数据集扩充倍数的超参数N,通过预设超参数N,可以对当前目标样本xi找寻N组差异化的对照样本组p(xi),且表示从K个样本中采样m个样本的有序排列数;
对目标样本xi的对照样本组p(xi)中各样本类别标签进行重构,具体为:遍历对照样本组p(xi)中各个近邻样本xj,j∈[1,m],提取其类别标签,与目标样本xi的类别标签进行同或运算;当目标样本xi与当前近邻样本xj类别相同时,称该近邻样本为同类样本,标签设置为1,反之为异类样本,标签设置为0;
通过这种方式,将近邻样本原先的类别标签重构为与目标样本类别对比得到的同类或异类标签;对于任意类别的目标样本,通过预设超参数N,均可得到N个差异化的对照样本组及其中各近邻样本对应的重构标签,因此,遍历Xi中的每个样本,分别将构造的目标-近邻样本对及其中各近邻样本的重构标签存入集合Ai与Li中,即可得到扩充后的目标-近邻样本对数据集Si=(Ai,Li);其中,Ai由构造得到的多个目标-近邻样本对数据组成,每个目标-近邻样本对数据由目标样本xi及其获得的N个差异化的对照样本组p(xi)组成,每个对照样本组由m个近邻样本组成,Ai的大小为N×(Gi×(m+1)),Gi代表当前二类数据集Xi中的样本数目;Li由各个目标-近邻样本对数据中近邻样本的重构标签组成,每个重构标签单独对应对照样本组p(xi)中的一个近邻样本,Li的大小为N×(Gi×(m+1)),i∈[1,11];
(3)基于由大量目标-近邻样本对组成的扩充后的新数据集,构建多标签信任判别网络在目标-近邻样本对内开展目标样本与对照样本组之间的多标签置信度比较,具体为:
基于步骤(2)得到的任意一个目标-近邻样本对数据集Si=(Ai,Li),利用VAE构建对应的多标签信任判别网络modeli并训练,其优化目标为:
其中,RCloss表示多标签信任判别网络的重构误差,Dkl,p为VAE对单独训练样本的KL散度;xori,p为Ai中的单个目标-近邻样本对数据,其将被提供给VAE网络进行训练;xgen,p为VAE网络根据训练数据的特征所生成的新样本,(xgen,p-xori,p)表示VAE对单独训练样本的生成误差;Mloss为定义的多标签匹配损失,labelq为Li中的任一重构标签,preq为模型对该对照样本的标签预测结果,preq∈[0,1];
(4)在测试阶段,对于任一待测样本,任意组合其多个不同的对照样本组得到该测试样本的多个目标-近邻样本对,集成各组预测结果进行反向推理得到在每个二类数据集下的判别结果,通过软投票得到故障类别,具体为:
基于步骤(3)中训练得到的每一个多标签信任判别网络modeli,对于一个待测样本xtest,其预测标签的计算过程如下:
其中,n是超参数,代表了以待测样本xtest为目标样本所获取的差异化对照样本组个数;m是随机采样次数,代表了xtest在所获取的一个对照样本组中所拥有的对照样本的个数;ytest,i是xtest在当前网络modeli下对应的预测分数,ytest,i∈[0,1];labelori是xtest在其n组样本数量为m的对照样本组中任一对照样本的类别标签,pre是当前网络modeli所预测出的目标样本和labelori所对应的对照样本之间的相似度,pre∈[0,1];
重复上述过程,对于得到的每一个二类数据集Xi,均可得到对应的多标签信任判别网络modeli,i是模式判别分类器的下标,i∈[1,11];对于待测样本xtest,其预测标签的计算如下:
取值为i时,表示xtest的预测故障类别为第i类故障。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210569747.3/1.html,转载请声明来源钻瓜专利网。