[发明专利]一种基于ReliefF和蚁群的特征基因选择方法在审
申请号: | 202110061383.3 | 申请日: | 2021-01-18 |
公开(公告)号: | CN112786111A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 李峰;向文杰;董林;潘文哲;周军;张学典 | 申请(专利权)人: | 上海理工大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G06N3/00;G06K9/62 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 王颖 |
地址: | 200093 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 relieff 特征 基因 选择 方法 | ||
1.一种基于ReliefF和蚁群的特征基因选择方法,其特征在于,包括以下步骤:
S1:采集DNA数据集,获得初始数据集,基于所述初始数据集,得到训练集模型;
S2:基于ReliefF算法,通过设置权重阈值,依据所述训练集模型,构建候选特征子集模型;
S3:基于所述候选特征子集模型,通过蚁群算法,得到初始基因选择子集模型;
S4:重复S2-S3,基于所述候选特征子集模型的权重特征,通过所述候选特征子集模型,构建候选基因模型,通过蚁群算法,基于初始基因选择子集模型,构建目标基因选择子集模型,用于对所述DNA数据集进行有效特征基因选择。
2.根据权利要求1所述的一种基于ReliefF和蚁群的特征基因选择方法,其特征在于,
所述S2中:设置所述权重阈值用于根据基因特征的重要性对训练集进行权重评估,将权重高于阈值的留下作为特征子集候选,低于阈值的被当作无关基因剔除。
3.根据权利要求1所述的一种基于ReliefF和蚁群的特征基因选择方法,其特征在于,
所述ReliefF方法包括:设置初始化特征权重,基于所述训练集,得到随机样本,然后根据权重函数公式选择候选特征子集。
4.根据权利要求3所述的一种基于ReliefF和蚁群的特征基因选择方法,其特征在于,
所述随机样本包括与所述随机样本同类的第一最近邻样本和与所述随机样本不同类的第二最近邻样本。
5.根据权利要求3所述的一种基于ReliefF和蚁群的特征基因选择方法,其特征在于,
构建所述权重函数公式的具体步骤包括:
S5.1.计算所述特征权重的权重系数;
S5.2.计算所述特征子集的特征差异。
6.根据权利要求5所述的一种基于ReliefF和蚁群的特征基因选择方法,其特征在于,
所述权重函数公式包括:
其中:A0是原始数据集的特征集,W[A0]是更新前的权重系数;A代表过滤后的数据集的特征子集;W[A]代表更新后的权重系数;m是样本数,xi表示样本,对于每个样本xi取两类最近邻;k个同类样本记为Hj,k个异类样本记为Mj(C);diff(A,xi,Hj)定量表示A中每个特征上xi和H之间的差异;k是最近邻居的数目;max(A)表示基因子集A的最大特征值;min(A)表示基因子集A的最小特征值;P(C)是目标样本C与总样本的比率;P(class(xi))是包括xi的同一类别中的样本与总样本的比率;Mj(C)表示与目标样本C不同类别的第j个邻居样本;diff(A,xi,Mj(C))是A中每个特征上xi和Mj(C)之差的定量表示。
7.根据权利要求1所述的一种基于ReliefF和蚁群的特征基因选择方法,其特征在于,所述蚁群算法包括以下步骤:
S7.1.α代表轨道的相对重要性且α≥0;β表示可见度的相对重要性,β≥0;给定初始值C为常数;
S7.2.ηij用元启发式方法进行计算,表示为公式:
其中,dij为i节点和j节点之间的距离;
S7.3.计算路径的信息量、信息增益、剩余路径的信息量和路径长度。
S7.4.第k(k=1,2,...m)个蚂蚁根据每条路径上信息素的数量确定方向,在第t时刻第k个蚂蚁从位置i转移到位置j的概率为:
S7.5.查看是否达到迭代次数,达到则输出特征基因子集,如果没有则继续寻找正确的特征子集。
8.根据权利要求7所述的一种基于ReliefF和蚁群的特征基因选择方法,其特征在于,
所述S7.3的具体计算公式包括:
经过一个周期,每个路径的信息量公式:
τij(t+Δt)=(1-ρ)·τij(t)+Δτij(t)
其中,τij(t)表示每个路径的信息量;ρ是轨道的保持能力,代表轨道衰减度,0≤ρ≤1;表示蚂蚁k在循环中剩余的路径i,j的信息量;Δτij(t)表示一次循环中i,j的信息量的增益:
Q是迭代中来自路径上的信息素量;Lk是一个行驶周期的路径长度,D(R(j),R(j+1))是j、j+1两个点特征值位置之间的欧几里德距离的路径长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理工大学,未经上海理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110061383.3/1.html,转载请声明来源钻瓜专利网。