[发明专利]一种基于ReliefF-DDC特征选择算法有效

专利信息
申请号: 202010597594.4 申请日: 2020-06-28
公开(公告)号: CN111898637B 公开(公告)日: 2022-09-02
发明(设计)人: 邵琪;包永强;贾成宇;张旭旭;陆志文 申请(专利权)人: 南京工程学院
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 南京源古知识产权代理事务所(普通合伙) 32300 代理人: 郑宜梅
地址: 211167 江苏省南京*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 relieff ddc 特征 选择 算法
【权利要求书】:

1.一种基于ReliefF-DDC特征选择方法,其特征在于,该方法在接户线入口处安装传感器,采集总负荷的电压、电流等电气量数据进行分析,细化系统数据从而辨识家用电器的类别及运行状态,包括以下步骤:

步骤一:获取训练集样本,确定算法中涉及的参数值;具体包括以下步骤:

S11、设待处理的训练集为D,样本Xl={xl1,xl2,…xld},xld是表示训练集D中第l个样本第d维特征;

S12、确定迭代次数m,m≥1;特征权重阈值τ,0≤τ≤1;最近邻样本个数k,k为大于等于1的整数;评价准则阈值δ,0≤δ≤1;

步骤二:将样本中的所有特征权重置0,置F、S为空集;

步骤三:从训练集D中选取样本Xl并更新其包含的所有维度的特征的权重,利用ReliefF计算特征与各类别之间的相关性来确定“重要特征”,排除无关特征;具体包括以下步骤:

S31、在m次迭代过程中,在训练集D中随机选取一样本Xl,样本Xl属于C类,在与Xl同类的样本中寻找k个最近邻样本Hj,j=(1,2…k)与Xl不同类的样本中寻找k个最近邻样本Mj

S32、当1≤r≤d,更新第r维特征的权重W(r)':

(1)(2)式中,P(C)表示类C在数据集中的先验概率分布,Mj(C)表示第C类第j个最近邻样本;其中diff(r,A,B)表示样本A和样本B在第r维特征值上的区分度;

步骤四:遍历S32中所有r的取值,输出W(r)’中大于阈值τ时所有对应的特征向量f,按降序排列添加至集合F,F={f1,f2…fn},nd;

步骤五:利用DDC算法,根据特征之间与决策变量的相关性分析去除冗余特征;具体包括以下步骤:

S51、当e(S)δ时,若fi满足:

则令F←F-{fj},S←S+{fj};

式中,e(S)为I(C;f)与QC(f,s)共同构成特征子集评价标准,定义如下:

式(5)中,熵H(C)表示随机变量C的不确定性测度,互信息I(C;fj)表示随机变量C、fj之间的共享信息,定义为:

I(C,fj)=H(C)-H(C|fj) (6)

式(4)和式(5)中,f和s分别为两个特征,相关测度QC(f,s)表示为

S52、判断F是否为空集,若F≠φ,跳转至步骤四;若F空集;继续步骤六;

步骤六:得到最佳特征子集S,将所选特征用于非侵入式负荷识别。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010597594.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top