[发明专利]一种疾病类别医学数据的特征选择方法和装置在审
| 申请号: | 201910547358.9 | 申请日: | 2019-06-24 |
| 公开(公告)号: | CN110322968A | 公开(公告)日: | 2019-10-11 |
| 发明(设计)人: | 皇甫伟;乌尼日其其格;刘娅汐;林晓丽 | 申请(专利权)人: | 北京科技大学 |
| 主分类号: | G16H50/70 | 分类号: | G16H50/70;G06N3/12 |
| 代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
| 地址: | 100083*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 种群 疾病类别 医学数据 适应度 方法和装置 交叉操作 判断结果 特征选择 最优特征子集 变异操作 结果更新 初始化 更新 | ||
本发明的实施例公开一种疾病类别医学数据的特征选择方法和装置,所述方法包括:步骤一,初始化种群,作为当前种群;步骤二,计算所述当前种群中的每个个体的适应度;步骤三,判断所述适应度是否趋于稳定值;当所述判断结果为否时,执行步骤四;当所述判断结果为是时,跳到步骤七,将所述当前种群中的适应度最高的个体作为疾病类别医学数据的最优特征子集;对所述当前种群中的个体进行选择,选出优良的个体,更新当前种群;步骤五,选出两个个体进行交叉操作,使用交叉操作后的结果更新所述当前种群;步骤六,所述当前种群进行变异操作;第三次更新当前种群,然后跳到步骤二。
技术领域
本发明涉及疾病研究方法,尤其涉及一种疾病类别医学数据的特征选择方法和装置。
背景技术
疾病例如乳腺癌已成为女性发病率最高的疾病,特别是40岁以上的女性中。根据世界卫生组织(WHO)下属国际癌症研究组织(IARC)的最新统计数据显示,全球女性乳腺癌新发病例数超过208万,占女性新发病癌症的24.2%。近20年来,女性乳腺癌发病率持续升高,严重威胁了女性的生命健康,对社会、家庭及女性的精神也造成极大的影响。
幸运的是,由于早期的检测,乳腺癌的存活率已稳步上升。根据长期临床经验,只要人们提前预防,定期评估并及时治疗,就可以预防甚至治愈乳腺癌。因此,建立乳腺癌评估模型在早期检测中至关重要。特征选择是评估模型中最重要的过程,可以选择与乳腺癌相关的发病因素。受益于相关因素,女性不仅可以通过改善生活方式来预防乳腺癌,还可以在早期治疗乳腺癌。
遗传算法(GA)已成为解决非确定性多项式(NP)问题的主流,如特征选择问题,旅行商问题和背包问题等。许多研究人员已提出了几种基于遗传算法的特征选择方法,这些方法在寻找使任意目标函数最优的特征子集时表现出良好的性能。现有的基于GA的特征选择方法,根据适应度函数的不同类型,可以被分为两种:基于过滤式的GA和基于分类器的GA。
基于过滤式的GA通常采用特定的公式或评估标准表示适应度函数,这些公式可以用特征之间的相关性、所选特征的数量和关键特征的数量来表示,而评价标准有互信息(MI)和Fisher准则等。
通常,乳腺癌评估整体过程是首先对乳腺癌人群队列数据进行特征选择,然后使用特征子集的分类器来判断一个女性是否有患有乳腺癌。乳腺癌评估的准确性由所选择的特征子集和分类器决定。基于过滤式的GA完全独立于分类器,与分类器的分类性能及其他参数无关。
基于过滤式的GA,即通过分类器的性能获得适应度函数。各种分类器用于乳腺癌评估过程中,例如支持向量机(SVM),人工神经网络(ANN),基于粒子群优化算法的分类器(PS分类器)和旋转森林(RF)等。
基于过滤式的GA在特征选择中是可行的,但由于忽略了分类过程,适应度函数不能完全反映乳腺癌评估的性能。这些算法只关注特征本身的特性,忽略了分类后的系统准确性。而基于分类器的GA考虑了分类过程,确保乳腺癌评估模型的准确性。但是,现有的基于分类器的GA主要用于平衡数据集上,例如,最常见的数据集之一,UCI机器学习库中的威斯康星乳腺癌数据集(WBCD)由458个未患乳腺癌样本和241个患有乳腺癌的样本组成。然而,实际的乳腺癌数据集是极度不平衡的巨大数据集,患有乳腺癌的女性的数量仅占女性总数的0.3%,因此,很难看出这些分类器对于极度不平衡乳腺癌数据的真实有效结果。此外,现有的基于分类器的GA的适应度函数仅考虑分类器的准确性,例如错误分类的概率等,其不能完全反映少数类样本的特性。在医学领域中,通常使用灵敏度、特异性和接收者工作特征曲线(ROC)下的面积(AUC)来判断评估的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910547358.9/2.html,转载请声明来源钻瓜专利网。





