[发明专利]一种基于ReliefF-DDC特征选择算法有效
申请号: | 202010597594.4 | 申请日: | 2020-06-28 |
公开(公告)号: | CN111898637B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 邵琪;包永强;贾成宇;张旭旭;陆志文 | 申请(专利权)人: | 南京工程学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京源古知识产权代理事务所(普通合伙) 32300 | 代理人: | 郑宜梅 |
地址: | 211167 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 relieff ddc 特征 选择 算法 | ||
1.一种基于ReliefF-DDC特征选择方法,其特征在于,该方法在接户线入口处安装传感器,采集总负荷的电压、电流等电气量数据进行分析,细化系统数据从而辨识家用电器的类别及运行状态,包括以下步骤:
步骤一:获取训练集样本,确定算法中涉及的参数值;具体包括以下步骤:
S11、设待处理的训练集为D,样本Xl={xl1,xl2,…xld},xld是表示训练集D中第l个样本第d维特征;
S12、确定迭代次数m,m≥1;特征权重阈值τ,0≤τ≤1;最近邻样本个数k,k为大于等于1的整数;评价准则阈值δ,0≤δ≤1;
步骤二:将样本中的所有特征权重置0,置F、S为空集;
步骤三:从训练集D中选取样本Xl并更新其包含的所有维度的特征的权重,利用ReliefF计算特征与各类别之间的相关性来确定“重要特征”,排除无关特征;具体包括以下步骤:
S31、在m次迭代过程中,在训练集D中随机选取一样本Xl,样本Xl属于C类,在与Xl同类的样本中寻找k个最近邻样本Hj,j=(1,2…k)与Xl不同类的样本中寻找k个最近邻样本Mj;
S32、当1≤r≤d,更新第r维特征的权重W(r)':
(1)(2)式中,P(C)表示类C在数据集中的先验概率分布,Mj(C)表示第C类第j个最近邻样本;其中diff(r,A,B)表示样本A和样本B在第r维特征值上的区分度;
步骤四:遍历S32中所有r的取值,输出W(r)’中大于阈值τ时所有对应的特征向量f,按降序排列添加至集合F,F={f1,f2…fn},nd;
步骤五:利用DDC算法,根据特征之间与决策变量的相关性分析去除冗余特征;具体包括以下步骤:
S51、当e(S)δ时,若fi满足:
则令F←F-{fj},S←S+{fj};
式中,e(S)为I(C;f)与QC(f,s)共同构成特征子集评价标准,定义如下:
式(5)中,熵H(C)表示随机变量C的不确定性测度,互信息I(C;fj)表示随机变量C、fj之间的共享信息,定义为:
I(C,fj)=H(C)-H(C|fj) (6)
式(4)和式(5)中,f和s分别为两个特征,相关测度QC(f,s)表示为
S52、判断F是否为空集,若F≠φ,跳转至步骤四;若F空集;继续步骤六;
步骤六:得到最佳特征子集S,将所选特征用于非侵入式负荷识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010597594.4/1.html,转载请声明来源钻瓜专利网。