[发明专利]一种基于kd-kNN的电气指纹识别方法在审
| 申请号: | 202211298347.X | 申请日: | 2022-10-23 |
| 公开(公告)号: | CN115828172A | 公开(公告)日: | 2023-03-21 |
| 发明(设计)人: | 褚全超;张珊珊 | 申请(专利权)人: | 上海梦象智能科技有限公司 |
| 主分类号: | G06F18/2431 | 分类号: | G06F18/2431;G06Q50/06 |
| 代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
| 地址: | 201206 上海市浦东新区临*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 kd knn 电气 指纹识别 方法 | ||
1.一种基于kd-kNN的电气指纹识别方法,其特征在于,采用kd树的KNN算法从负载的电气数据识别出负载类别;包括:获取待识别负载的平均电压、平均电流、平均功率、THD;经过预处理,形成一维向量数据,作为当前采集数据的唯一特征;然后基于构建好的kd-kNN模型,进行特征分类,根据分类结果获得当前负载类别,实现电气指纹的识别;具体步骤如下:
步骤1:采集用于对比测试数据的初始样本数据集,数据包括一系列单一电气负载的平均电压、平均电流、平均功率和THD,每个负载的前述参数组织成一维向量的形式,即[平均电压,平均电流,平均功率,THD];
步骤2:对步骤1采集的电气数据预进行处理,拼接上对应负载的标签值,作为kd-kNN模型的初始样本数据集;包括记录初始样本中包含的负载及状态,将其映射成数字,从0开始递增,并将初始负载的电气数据与负载对应的映射标签拼接,即[平均电压,平均电流,平均功率,THD,标签映射值],构成完整的初始样本数据;
步骤3:将完整的初始样本构建成kd树,形成kd-kNN模型,用于对测试样本的预测;
步骤4:将测试样本输入kd-kNN模型,获得预测结果。
2.根据权利要求1所述的基于kd-kNN的电气指纹识别方法,其特征在于,步骤1中所述采集用于对比测试数据的初始样本数据集,具体设有6类电器作为待采集数据的负载,分别编号D1、D2、…、D6,每个类别均包含五个不同型号的负载,进一步编号Di-1,Di-2,Di-3,Di-4,Di-5,其中,i表示所在类别编号;在采集电气数据时,选定一个负载,在其稳定运行时,借助功率分析仪采集获取平均电压、平均电流、平均功率和THD;重复采集五次,每次间隔至少10分钟;对五次采集得到的结果取平均值,作为当前负载的最终采集数据。
3.根据权利要求2所述的基于kd-kNN的电气指纹识别方法,其特征在于,步骤2中所述对步骤1采集的电气数据进行处理,拼接上对应负载的标签值,作为kd-kNN模型的初始样本数据集;其中,负载名称映射成数字时,处理方式如下:
对于负载D1-1,由于已经获得了作为其原始特征的电气参数,然后根据其所包含的运行状态,映射标签值为0,则最后获得用于构建kd-kNN模型的一组数据,其形式为[平均电压,平均电流,平均功率,THD,0];对于其余负载,以同样的方式进行数据处理,映射标签值依据不同负载状态递增;所有负载数据处理完后,构成kd-kNN模型的初始对比样本数据集,完整初始数据格式为:[平均电压,平均电流,平均功率,THD,映射标签值]。
4.根据权利要求3所述的基于kd-kNN的电气指纹识别方法,其特征在于,步骤3中所述将步骤2得到的样本数据集构建成kd树,具体流程为:
(1)根据初始样本的数据形式,由于表征负载的特征有4个,每个特征为一个维度空间,则kd树的构建在4维数据空间中进行;
(2)首先选取平均电压所在维度,将初始样本按照平均电压值排序,选择平均电压排在中间的样本作为当前子树根节点,平均电压小于根节点的样本归到左子树,平均电压大于根节点的样本归到右子树;
(3)顺序依次选择余下的特征,在对应的维度空间,重复步骤(2);如果选择THD所在维度,则接下来选择平均电压所在维度,如此循环往复,直到树的每个节点只包含一个样本。
5.根据权利要求4所述的基于kd-kNN的电气指纹识别方法,其特征在于,步骤4中所述将测试样本输入kd-kNN模型,获得预测结果;其中,采集电路中待识别负载的电气数据,形成一维特征向量,之后将所得特征向量输入构建好的kd-kNN模型进行分类;具体流程为:
(1)将不含标签的测试数据输入kd-kNN模型,从根节点开始,先选取平均电压所在维度,比较测试数据和当前节点数据在平均电压维度上的大小;如果当前节点的数据更大,则测试数据转移到左孩子节点,反之转到右孩子节点;后续选择下一特征所在维度,重复之前的步骤,直到找到测试样本应该加入的叶子节点的位置;然后从该位置自底向上搜索离测试数据最近邻的k个初始样本,判断方式为测试数据与初始样本的欧氏距离,计算公式如下:
其中,Dist为测试数据和初始样本的欧氏距离,U为平均电压,I为平均电流,P为平均功率;
(2)得到k个最近邻样本后,对k个欧氏距离值采用最大最小归一化,公式如下:
其中,disti为与第i个样本的归一化欧氏距离,Disti为与第i个样本的欧氏距离,Distmax和Distmin分别为k个欧氏距离中的最大值和最小值;
然后判断归一化后的最小欧氏距离是否大于给定阈值0.7;如果大于阈值,则待识别负载作为新类别加入kd树,输出值为原有标签映射值最大值加1;并给该负载数据拼接上新标签值;否则,先剔除归一化欧氏距离大于0.7的初始样本,在剩余初始样本中选择占比最高的样本类别作为最终的预测结果,输出该类别的映射值,作为待识别负载的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海梦象智能科技有限公司,未经上海梦象智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211298347.X/1.html,转载请声明来源钻瓜专利网。





