[发明专利]一种疾病类别医学数据的特征选择方法和装置在审
| 申请号: | 201910547358.9 | 申请日: | 2019-06-24 |
| 公开(公告)号: | CN110322968A | 公开(公告)日: | 2019-10-11 |
| 发明(设计)人: | 皇甫伟;乌尼日其其格;刘娅汐;林晓丽 | 申请(专利权)人: | 北京科技大学 |
| 主分类号: | G16H50/70 | 分类号: | G16H50/70;G06N3/12 |
| 代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
| 地址: | 100083*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 种群 疾病类别 医学数据 适应度 方法和装置 交叉操作 判断结果 特征选择 最优特征子集 变异操作 结果更新 初始化 更新 | ||
1.一种疾病类别医学数据的特征选择方法,其特征在于,包括:
步骤一,初始化种群,作为当前种群;所述当前种群包括预定数量的个体;每个个体包括至少一个特征;
步骤二,以评估指标AUC作为适应度评价函数,计算所述当前种群中的每个个体的适应度;所述AUC是利用基于核概率密度估计的贝叶斯分类器计算得到的;
步骤三,判断所述适应度是否趋于稳定值,生成判断结果;当所述判断结果为否时,执行步骤四;当所述判断结果为是时,跳到步骤七,将所述当前种群中的适应度最高的个体作为疾病类别医学数据的最优特征子集;
步骤四,根据所述个体的适应度大小,使用轮盘赌选择方法,对所述当前种群中的个体进行选择,选出优良的个体,并第一次更新当前种群;
步骤五,从第一次更新的所述当前种群中选出两个个体进行交叉操作,使用交叉操作后的结果第二次更新所述当前种群;
步骤六,对第二次更新的所述当前种群进行变异操作;使用变异操作后的当前种群第三次更新当前种群,然后跳到步骤二。
2.根据权利要求1所述的方法,其特征在于,所述步骤一包括:
计算各特征的单类F-score值;
将特征按照对应的单类F分数F-score值大小,进行降序排序;
使用轮盘赌选择方法从降序的序列中选择个体,生成初始种群。
3.根据权利要求2所述的方法,其特征在于,所述步骤二包括:
对疾病类别的队列数据进行预处理;
按照定比特征、定类特征、定序特征和定距特征的定义,将预处理的所述疾病类别的队列数据分为连续数据和离散数据;
将所述连续数据和所述离散数据分别放入基于核概率密度估计的贝叶斯分类器和朴素贝叶斯分类器中进行分类,生成分类结果;
通过所述分类结果,计算出每个个体对应的AUC值。
4.根据权利要求1所述的方法,其特征在于,所述步骤五包括:
根据个体中的特征的单类F-score值的大小,对选择出的两个个体进行降序排序;
对于适应度值小的个体,使用轮盘赌选择方法确定一个交叉点;
交换选择出的所述两个个体的特征位,重新生成两个新的个体,并更新当前种群。
5.根据权利要求4所述的方法,其特征在于,所述步骤六包括:
使用轮盘赌选择方法,从当前种群中选出进行变异的个体;
按照特征的单类F-score值的大小,对个体进行降序排序;
对于变异个体,使用轮盘赌选择方法选择变异点;
从剩下的特征中选择跟变异点相同数量的基因进行替换。
6.一种疾病类别医学数据的特征选择装置,其特征在于,包括:
初始化单元,初始化种群,作为当前种群;所述当前种群包括预定数量的个体;
计算单元,以评估指标AUC作为适应度评价函数,计算所述当前种群中的每个个体的适应度;所述AUC是利用基于核概率密度估计的贝叶斯分类器计算得到的;
判断单元,判断所述适应度是否趋于稳定值,生成判断结果;当所述判断结果为否时,执行步骤四;当所述判断结果为是时,将所述当前种群中的适应度最高的个体作为疾病类别医学数据的最优特征子集;
第一更新单元,根据所述个体的适应度大小,使用轮盘赌选择方法,对所述当前种群中的个体进行选择,选出优良的个体,并第一次更新当前种群;
第二更新单元,从第一次更新的所述当前种群中选出两个个体进行交叉操作,使用交叉操作后的结果第二次更新所述当前种群;
第三更新单元,对第二次更新的所述当前种群进行变异操作;使用变异操作后的当前种群第三次更新当前种群。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910547358.9/1.html,转载请声明来源钻瓜专利网。





