[发明专利]一种基于ReliefF-DDC特征选择算法有效
申请号: | 202010597594.4 | 申请日: | 2020-06-28 |
公开(公告)号: | CN111898637B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 邵琪;包永强;贾成宇;张旭旭;陆志文 | 申请(专利权)人: | 南京工程学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京源古知识产权代理事务所(普通合伙) 32300 | 代理人: | 郑宜梅 |
地址: | 211167 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 relieff ddc 特征 选择 算法 | ||
本发明具体涉及一种基于ReliefF‑DDC特征选择算法,包括S1、获取训练集样本,确定算法各参数值:S2、将所有特征权重置0,置、为空集;S3、从训练集中选取样本并更新其包含的所有维度的特征的权重,利用ReliefF计算特征与各类别之间的相关性来确定“重要特征”,排除无关特征;S4、输出中大于阈值时对应的特征向量,按降序排列添加至集合;S5、利用DDC算法,根据特征之间与决策变量的相关性分析去除冗余特征;S6、得到最佳特征子集,将所选特征用于非侵入式负荷识别。本方法有效降低特征维数,提高负荷识别率并缩短算法运行时间。
技术领域
本发明涉及非侵入式负荷特征选择算法,具体涉及一种基于ReliefF-DDC特征选择算法。
背景技术
非侵入式负荷监测法(Non-intrusive Load Monitoring,NILM)为实现智能电网和用户之间的互动提供了数据支持,该方法在接户线入口处安装传感器,采集总负荷的电压、电流等电气量数据进行分析,细化系统数据从而辨识家用电器的类别及运行状态。相比于侵入式负荷监测法(ILM),NILM具有成本低、用户接受度高、后期维护方便等优势,但是该方法对于负荷分解算法的要求较高。特征提取和负荷识别作为NILM中两大关键技术,为NILM的发展提供了强有力的技术支持。
目前的相关学者大多从事用电负荷的特征选择以及负荷识别方法的研究工作,相关领域的也取得了一系列成果。相比之下,负荷特征选择方面的研究稍显不足。特征选择是在原始的高维特征中遵循某个评价准则为后续任务选择一个最佳特征子集,基于少量具有代表性的特征,不仅可以加速模型的学习过程,而且可以提高模型的泛化能力。特征选择在图像处理、数据挖掘、机器学习等领域应用广泛,在处理包含了大量特征的高维数据时,这些特征不可避免地包含了噪声、不相关特征以及冗余特征。在这种情况下,有必要提取出信息量最丰富、最有价值的信息。
发明内容
1.所要解决的技术问题:
针对上述技术问题,本发明提供一种基于ReliefF-DDC特征选择算法,本算法首先通过计算特征权重并按降序排列,选取权重较大的特征去除无关特征;其次计算各特征与决策变量之间的交互信息,利用决策相关分析删除冗余特征得到最终特征子集;最后利用孪生支持向量机(TWSVM)进行负荷识别,本方法有效降低特征维数,提高负荷识别率并缩短算法运行时间。
2.技术方案:
一种基于ReliefF-DDC特征选择算法,其特征在于,包括以下步骤:
步骤一:获取训练集样本,确定算法中涉及的参数值;具体包括以下步骤:
S11、设待处理的训练集为D,样本样本Xl={xl1,xl2,…xld},xld是表示训练集D中第l个样本第d维特征。
S12、确定迭代次数m,m≥1;特征权重阈值τ,0≤τ≤1;最近邻样本个数k,k为大于等于1的整数;评价准则阈值δ,0≤δ≤1.
步骤二:将样本中的所有特征权重置0,置F、S为空集。
步骤三:从训练集D中选取样本Xl并更新其包含的所有维度的特征的权重,利用ReliefF计算特征与各类别之间的相关性来确定“重要特征”,排除无关特征;具体包括以下步骤:
S31、在m次迭代过程中,在训练集D中随机选取一样本Xl,样本Xl属于C类,在与Xl同类的样本中寻找k个最近邻样本Hj,j=(1,2…k),与Xl不同类的样本中寻找k个最近邻样本Mj。
S32、当1≤r≤d,更新第r维特征的权重W(r)':
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010597594.4/2.html,转载请声明来源钻瓜专利网。