[发明专利]生物医学数据特征选择方法及装置、计算设备及存储介质在审
申请号: | 202110393715.8 | 申请日: | 2021-04-13 |
公开(公告)号: | CN112908416A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 宗欣露;刘诗芹;叶志伟;王春枝;刘伟 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G06K9/62;G06N3/12 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 杨用玲 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生物医学 数据 特征 选择 方法 装置 计算 设备 存储 介质 | ||
本发明提供了一种生物医学数据特征选择方法,包括:提取生物医学数据集中的特征构成原始特征集合;根据所述原始特征集合,对种群进行初始化得到初始种群,并设置生物医学数据特征选择所需的参数;将初始种群中的个体映射为相应的特征组合,通过适应度函数计算种群中个体的适应度值;利用轮盘赌选择对所述初始种群进行三系种群的划分,分别随机从不育系和保持系中选择个体作为父本和母本进行杂交操作;随机选择恢复系中的个体进行自交操作;当达到最大自交次数时,对恢复系个体进行重置操作,在搜索空间中随机选择一组基因序列替换原始个体,并将自交次数归0;判断是否满足终止条件,输出全局最优的个体。
技术领域
本发明涉及数据挖掘技术领域,尤指一种生物医学数据特征选择方法及装置、计算设备及存储介质。
背景技术
近年来,随着基因组测序技术的快速发展,积累了大量基因微阵列数据,对这些生物医学数据进行挖掘和分析,可以为疾病诊断和防治工作带来有效帮助。然而,由于原始数据中存在大量的噪声和冗余特征,并且过多的特征会带来维数灾难的问题,因此,需要对生物医学数据进行特征选择从而挖掘出对分类最有效的特征。
特征选择是机器学习与数据挖掘中的重要一步,属于数据预处理部分。特征选择是从原始数据集的特征中选择出满足某种评估标准的最优特征组合的过程,其目的是降低特征空间的维数、简化学习模型、缩短学习时间和提高算法的性能,已有大量的研究表明了其有效性。通过从原始特征空间中筛选出有效的特征组合,排除大量无用特征,从而降低处理问题的难度。
为了达到更好的分类精度,许多研究者提出用智能优化算法来解决特征选择问题,即初始化时随机产生特征组合,特征组合的质量通过一定评价标准(适应度值函数)加以度量,通过不断迭代更新特征组合使其向最优解靠拢,直到达到最大迭代次数或寻找到全局最优子集就输出。解的形式为二进制编码,编码的长度等于原始数据中特征的维度,其中每一位用0或1表示该特征是否被选择进入特征组合。
有学者将遗传算法GA和分类器SVM相结合以选择出分类精度较高的最优特征组合;粒子群优化算法PSO由于更新机制简单易用已被成功用于医学数据特征选择和分类,但PSO容易陷入局部最优解。
尽管用于特征选择的智能优化算法已取得很大的进展,但已有的算法或者得到解的优化程度低,或者计算量太大,远未达到满意的程度,因此,仍需要探索其他新的智能优化算法来解决特征选择问题。
发明内容
本发明实施例的目的在于:为了克服现有生物医学数据中特征选择技术的不足,提出了一种基于轮盘赌机制水稻育种算法的生物医学数据特征选择方法,在保证分类精度的同时快速得到全局最优的特征组合。同时降低特征的维度,缩短训练时间,简化模型和提高分类器的精度,
本发明实施例所采用的技术方案如下:
一种基于轮盘赌机制水稻育种算法的生物医学数据特征选择方法,所述方法包括如下步骤:
S1.提取生物医学数据集中的特征构成原始特征集合;
S2.根据所述原始特征集合,对种群进行初始化,并设置生物医学数据特征选择所需的参数;
S3.将初始种群中的个体映射为相应的特征组合,通过适应度函数计算种群中个体的适应度值;
S4.利用轮盘赌选择进行三系种群的划分,其中,适应度值处于第一阈值范围的个体以第一概率选择进入保持系,并以第二概率待选择进入恢复系和不育系;
S5.分别随机从不育系和保持系中选择个体作为父本和母本进行杂交操作,即将父本和母本的基因通过重新组合产生新的基因序列,分别计算第一新个体和参与杂交的不育系个体的适应度值,从中选择适应度值处于第二阈值范围的个体的基因保留至下一代;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110393715.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置