[发明专利]基于最大相关最小冗余和改进花授粉算法的特征选择方法有效
申请号: | 202110415025.8 | 申请日: | 2021-04-17 |
公开(公告)号: | CN113113137B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 罗慧敏;李梦园;阎朝坤;王建林;代雪兵 | 申请(专利权)人: | 河南大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G06N3/00 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 张立强 |
地址: | 475001 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 最大 相关 最小 冗余 改进 授粉 算法 特征 选择 方法 | ||
1.基于最大相关最小冗余和改进花授粉算法的特征选择方法,其特征在于,包括:
步骤1、采用基于最大相关最小冗余算法的特征排序策略和反向学习对种群中的N个个体进行随机初始化;所述步骤1具体包括:
步骤1.1、根据设定的最大相关最小冗余度公式计算数据集中每个属性的最大相关最小冗余值;所述设定的最大相关最小冗余度公式具体为公式(1):
其中,S表示特征子集,c表示类,gi,gj表示集合S中的任意两个特征,I(gi;c)表示特征gi与类c之间的互信息值,I(gi;gj)表示特征gi与特征gj之间的互信息值;
步骤1.2、按照最大相关最小冗余值从大到小的顺序对每个属性进行排序;
步骤1.3、选择最大相关最小冗余值较大的前TopN个属性对种群中的N/2个群体进行随机初始化形成初始解;通过反向学习方法对种群中的其余N/2个群体进行随机初始化形成初始解;针对每个个体将被选中的特征设置为1,未被选中的特征设置为0;
步骤2、采用设定的适应度函数计算所述种群中每个个体的适应度值,将种群中适应度值最大的个体作为全局最优解;所述设定的适应度函数具体为:
其中MCC表示样本分类的马修斯相关系数,TP表示正确诊断为正样本的样本数,TF表示正确诊断为负样本的样本数,FP表示错误诊断为正样本的样本数,FN表示错误诊断为负样本的样本数,Nf表示待计算适应度值的样本对应被选中特征的数目,P是待计算适应度值的样本对应所有特征的数目,α是马修斯相关系数的权重,(1-α)是特征选择的权重;
步骤3、采用改进的花授粉算法更新种群,并更新种群中每个个体的适应度值,更新种群中的全局最优解;
步骤4、以步骤3作为一次迭代,重复进行步骤3,直至当前迭代次数达到设定的迭代次数。
2.根据权利要求1所述的方法,其特征在于,步骤3中,所述采用改进的花授粉算法更新种群,具体包括:
由异花授粉、自花授粉和禁忌搜索三个操作算子更新每个花朵个体的位置;
使用Sigmoid函数作为传递函数,将花朵个体的位置映射到0或1;其中,Sigmoid函数为公式(13)和公式(14):
其中,r是介于0和1之间的均匀随机数,表示在第t次迭代中第i个花朵中第j个特征是否被选中,当表示被选中,否则
3.根据权利要求2所述的方法,其特征在于,所述由异花授粉操作算子更新每个花朵个体的位置,具体包括:
按照公式(6)通过莱维分布控制步长大小,使花粉从一朵花随机改变到另一朵花:
其中,和分别表示第t+1次和第t次迭代时个体i的位置;f表示当前全局最优解的适应度值;γ表示用于控制步长大小的参数,L(λ)表示莱维分布路径。
4.根据权利要求2所述的方法,其特征在于,步骤3中,所述由自花授粉操作算子更新每个花朵个体的位置,具体包括:
根据适应度值从大到小对所有个体进行排序,选择前n个个体,然后从前n个个体中选取两个个体按照公式(11)和公式(12)进行自适应高斯变异:
其中,和表示同一品种植物上来自不同花的花粉,A表示自适应转移因子,C1和C2表示变化因子,t表示当前迭代次数,T代表设定的迭代次数。
5.根据权利要求2所述的方法,其特征在于,所述由禁忌搜索操作算子更新每个花朵个体的位置,具体包括:
采用精英花授粉算法更新当前种群中最优解,然后搜索最优解附近的邻域,采用适应度值较好的解进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110415025.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种发动机配件活塞环成型热处理方法
- 下一篇:一种室外立体垂直绿化种植墙