[发明专利]基于改进的二元磷虾群算法和信息增益算法的有效混合特征选择方法有效
申请号: | 201911041662.2 | 申请日: | 2019-10-30 |
公开(公告)号: | CN110837884B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 张戈;王建林;阎朝坤;侯金翠;罗慧敏 | 申请(专利权)人: | 河南大学 |
主分类号: | G06N3/006 | 分类号: | G06N3/006;G16B25/00 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 张立强 |
地址: | 475001 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 二元 磷虾 算法 信息 增益 有效 混合 特征 选择 方法 | ||
1.一种基于改进的二元磷虾群算法和信息增益算法的基因特征选择方法,其特征在于,包括:
步骤1、采用基于信息增益算法的特征排序策略对种群中的N个个体进行随机初始化,N表示种群中的磷虾个体总数;所述步骤1具体为:
步骤1.1、根据信息增益算法计算数据集中每个特征的信息增益值;所述数据集为结肠肿瘤数据集、中枢神经系统疾病数据集、急性髓性白血病数据集、卵巢瘤数据集、肺癌数据集、混合血统白血病数据集和小圆蓝细胞瘤数据集中的其中一种;所述数据集包括若干个样本和若干个基因特征;一个磷虾个体对应数据集中的一个样本;
步骤1.2、按照信息增益值从大到小的顺序对每个特征的信息增益值进行排序;
步骤1.3、选择信息增益值较大的前TopN个特征对种群中的个体进行随机初始化形成初始解,针对每个个体将被选中的特征值设置为1,未被选中的特征值设置为0;
步骤2、采用设定的适应度函数计算所述种群中每个个体的适应度值,将种群中适应度值最大的个体所表示的解作为种群中的全局最优解;
所述设定的适应度函数具体为:
其中,acc(KNN)表示基于选中的基因特征用KNN分类器对数据集中的样本进行分类得到的分类精确度,numc表示分类正确的样本数,numi表示分类错误的样本数,b表示待计算适应度值的样本对应被选中特征的数目,B是待计算适应度值的样本对应所有特征的数目,α=1是分类精确度的权重,β=0.001是特征选择的权重;
步骤3、使用改进的二元磷虾群算法更新种群,并更新种群中每个个体的适应度值,更新种群中的全局最优解;其中,采用改进的二元磷虾群算法更新种群,具体包括:
步骤3.1:按照式(5)更新每个磷虾个体的位置:
Xi(t+1)=Xi(t)+q*Ni(t)+q*Fi(t)+Di(t) (5)
其中,Xi(t+1)和Xi(t)分别表示第t+1次和第t次迭代时第i个磷虾个体的位置,Ni(t)表示第i个磷虾个体的由邻居磷虾引起的运动操作算子,Fi(t)表示第i个磷虾个体的觅食运动操作算子,Di(t)表示第i个磷虾个体的随机扩散运动操作算子,q表示混沌记忆权值因子;
按照式(6)更新混沌记忆权值因子q:
q(t+1)=4.0×q(t)×(1-q(t)) (6)
其中,q(t+1)和q(t)分别表示第t+1次和第t次迭代时的混沌记忆权重因子;
步骤3.2:重塑第i个磷虾个体的位置,具体为:
按照式(7)更新自适应传递因子p:
使用双曲正切函数作为传递函数,并在传递函数中引入自适应传递因子,得到新的传递函数g:
根据新的传递函数g按照式(9)重塑第i个磷虾个体的位置Xid(t+1):
其中,rand是介于0和1之间的均匀随机数,I是实际迭代次数,Imax是设定的迭代次数,Xid(t+1)表示重塑后的第t+1次迭代时的第i个磷虾个体的位置,m1等于0.95,m2等于1.05;
步骤3.3:计算邻居磷虾引起的运动操作算子,具体为:
确定第i个磷虾个体的邻居磷虾:按照式(10)计算第i个磷虾个体的感应距离,若第i个磷虾个体的感应距离大于其与第j个磷虾个体之间的距离,则确定第j个磷虾个体为第i个磷虾个体的邻居磷虾:
其中,ds,i表示第i个磷虾个体的感应距离,||Xi-Xj||表示第i个磷虾个体与第j个磷虾个体之间的欧式距离;
根据式(11)至式(13)计算得到邻居磷虾引起的运动操作算子Ni(t):
其中,Nmax是诱导速度,ωn是[0,1]范围内的随机数,αilocal表示局部搜索,αitarget表示全局搜索,fbest和fworst表示到目前为止磷虾个体的最佳适应度值和最差适应度值,fi表示第i个磷虾个体的适应度值,fj是其第j个邻居磷虾的适应度值j=1,2,...,NN,NN是邻居磷虾的总数,ε为用于避免奇异性的正数;
步骤4、以步骤3作为一次迭代,重复进行步骤3,直至当前迭代次数达到设定的迭代次数,输出此时的全局最优解,该全局最优解中特征值为“1”的特征即为被选中的基因特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911041662.2/1.html,转载请声明来源钻瓜专利网。