[发明专利]一种基于二分规则特征融合随机森林算法的乳腺癌诊断方法在审

专利信息
申请号: 202011227888.4 申请日: 2020-10-29
公开(公告)号: CN112418280A 公开(公告)日: 2021-02-26
发明(设计)人: 黄玮;肖月月;王劲松 申请(专利权)人: 天津理工大学
主分类号: G06K9/62 分类号: G06K9/62;G16H50/20
代理公司: 暂无信息 代理人: 暂无信息
地址: 300384 *** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 二分 规则 特征 融合 随机 森林 算法 乳腺癌 诊断 方法
【说明书】:

基于二分规则特征融合随机森林算法的乳腺癌诊断方法,该方法包括:首先,进行数据预处理,即对国际标准乳腺癌数据集中的Breast‑cancer‑wisconsin(BCW)、Wisconsin‑dataset‑breast‑cancer(WDBC)和breast‑cancer(BC)和3个数据集进行预处理;然后分别使用信息增益(IG)和递归特征消除(RFE)算法对数据集中的每个特性进行重要性衡量,并将衡量后的特征按照重要性进行降序排序;最后利用提出的二分规则特征融合(BRF)方法把由上述两种算法得到的特征进行融合,得到最优的特征序列,再把3个特征序列输入到随机森林分类模型中进行对比,结果显示本发明所提出方法的分类准确率最高。该方法不仅能更好的衡量每个特征的重要性,还能提高分类的准确率,这使得整体的诊断精度能有显著提升。

技术领域

本发明涉及医学诊断技术领域,具体涉及一种基于二分规则特征融合随机森林算法的乳腺癌诊断方法。

背景技术

乳腺癌诊断是利用计算机技术,通过所给数据集中的属性特征进行处理与训练去判断该患者是良性还是恶性或是会复发还是未复发。用计算机技术去进行乳腺癌诊断具有一些独特优势:可以给医生减轻负担,训练分类结果可与医生的确诊作相互参考,减少误判率,使患者能得到及时的治疗,乳腺癌诊断成为近年来医学诊断领域的热点之一。从国内外研究成果来看,诊断的难点主要集中在特征选择,诊断速度和精度方面。

一、特征选择方面,特征选择方法是一个对特征进行排名得过程,特征选择的好坏对模型的分类或聚类起着重大的作用,常用得有过滤法(Filter)、包裹式(Wrapper)与嵌入式(Embedded)方法。选择不同的特征选择方法将会得到不同的特征序列,很多研究由于没有选择合理的方法导致分类精度不理想。

二、分类模型方面,国内外的研究论文涵盖了用于乳腺癌诊断模型有很多种,包括Random Forest-based Rule Extraction method(RFRE)、Multi-feature Fusion andRandom Forest(MFRF)、Shapely Value Embedded Genetic Algorithm(SVEGA)等。这些分类模型都较为复杂。

三、诊断精度方面,普遍的乳腺癌诊断系统因采用的算法效率低,运行环境大都依赖超级计算机的支持,在大众化的PC机上无法满足实际需要。目前用于临床乳腺癌诊断的系统少之又少,就现有的乳腺癌诊断程序而言,诊断率不是很理想。

发明内容

本发明的目的是为克服上述的技术缺点和不足,提供了一种基于二分规则特征融合随机森林算法的乳腺癌诊断方法。

本发明采用的技术方案如下:

基于二分规则特征融合随机森林算法的乳腺癌诊断方法,包括以下步骤:

第1步、数据预处理。对国际标准乳腺癌数据集中的Breast-cancer-wisconsin(BCW)、Wisconsin-dataset-breast-cancer(WDBC)和breast-cancer(BC)3个数据集进行预处理;

第2步、利用信息增益(IG)算法对预处理后的数据集中的特征进行重要性衡量,并把特征按照重要性进行降序排序;

第3步、利用递归特征消除(RFE)算法对预处理后的数据集中的特性进行重要性衡量,同样把特征按照重要性进行降序排序;

第4步、利用提出的二分规则特征融合(BRF)方法把由第2步和第3步得到的特性序列进行特征融合处理,得到最终的特征序列;

第5步、把得到的最终特征序列数据输入到随机森林(RF)分类模型中进行训练与测试,输出诊断结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津理工大学,未经天津理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011227888.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top