[发明专利]一种基于多目标演化算法的癌症检测方法有效
申请号: | 201810946352.4 | 申请日: | 2018-08-20 |
公开(公告)号: | CN109360656B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 程凡;陈加宾;张兴义 | 申请(专利权)人: | 安徽大学 |
主分类号: | G16H50/70 | 分类号: | G16H50/70 |
代理公司: | 合肥市长远专利代理事务所(普通合伙) 34119 | 代理人: | 傅磊 |
地址: | 230000 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多目标 演化 算法 癌症 检测 方法 | ||
本发明公开了一种基于多目标演化算法的癌症检测方法,包括:通过多目标进化算法筛选初始癌症数据集,得到癌症检测数据模型;通过多目标集成算法提高癌症检测数据模型的准确度,得到癌症检测集成数据模型;通过癌症检测集成数据模型对目标癌症数据集进行癌症检测。如此,大大提升第一前沿面上的解的压缩率,同时提升分类准确度,采用了多目标集成来提升算法性能,大大降低了所选出来的集成模型数目,通过多目标集成,进一步提升算法对癌症样本的分类准确度。
技术领域
本发明涉及演化计算和分类学习技术领域,尤其涉及一种基于多目标演化算法的癌症检测方法。
背景技术
随着社会的发展,生活水平的提高,人们也越来越重视自己的身体健康。但是众多疾病却也一直威胁着人类的健康,影响人们的生活质量,像癌症,虽然医护人员可以从历史诊断的信息中判断出癌症,但是这是需要处理大量的信息和数据集合,那么如何有效并正确检测出癌症并进行相关治疗,成为了一项很重要的技术之一。又因为现实存在大量的医学数据信息,那么如何从中选出出重要的数据信息,来进行癌症检测是非常重要的。因此有必要从大量的医学数据中剔除掉噪音信息和冗余信息,筛选出重要的样本学习模型,来进行有效检测。
传统的基于wrapper和filter分类学习方法的对医学数据的压缩不够明显,依然存在大量的冗余和噪音信息,这使得训练分类的过程依然很耗时,同时分类的精度也待进一步提升。
发明内容
基于背景技术存在的技术问题,本发明提出了一种基于多目标演化算法的癌症检测方法;
本发明提出的一种基于多目标演化算法的癌症检测方法,包括:
S1、通过多目标进化算法筛选初始癌症数据集,得到癌症检测数据模型;
S2、通过多目标集成算法提高癌症检测数据模型的准确度,得到癌症检测集成数据模型;
S3、通过癌症检测集成数据模型对目标癌症数据集进行癌症检测。
优选地,步骤S1,具体包括:
S11、通过十折交叉将初始癌症数据集划分为训练集和测试集,对训练集上的样本通过超立方体拉丁抽样生成初始种群,其中,所述初始种群包含N个个体,所述癌症数据集最后一列为样本标签,初始种群采用二进制编码,初始种群中个体对应位为1表示选取该样本,为0表示不选取该样本;
S12、将训练集属性特征转换成分类器处理的格式,对训练集中数据进行归一化,对训练集中每个个体中数据进行训练得到SVM模型;
S13、通过多目标进化算法对初始种群进行种群进化,在进化到第一预设次数代时,引导种群的个体中局部信息指引进化,在进化到第二预设次数代时,获取第一前沿面上的解,从第一前沿面上的解中剔除掉压缩率低于预设压缩率的解,再对剩下的解中每个解的附近均匀局部扰动产生等量的一组解,对这组解进行非支配排序和拥挤距离计算后,选出N个解,得到癌症检测数据模型。
优选地,步骤S12中,所述对训练集中每个个体中数据进行训练得到SVM模型,具体包括:
采用的是libsvm中高斯核函数对训练集中每个个体中数据进行训练得到SVM模型,其中,C=1,γ=0.01,计算准确度f1和压缩率f2,
T是整个训练集的大小,S是减少的训练集数目,yi是样本真实标签,yi*是样本预测标签,
优选地,步骤S13中,所述引导初始种群的个体中局部信息指引进化,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810946352.4/2.html,转载请声明来源钻瓜专利网。