[发明专利]一种基于随机森林的子宫内膜肿瘤分类标记方法在审
申请号: | 202010505813.1 | 申请日: | 2020-06-05 |
公开(公告)号: | CN111860576A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 唐震洲;周铭琰;李方靖;林凤;金楚;许方怡;易新凯;王岩;孔令剑 | 申请(专利权)人: | 温州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 温州名创知识产权代理有限公司 33258 | 代理人: | 陈加利 |
地址: | 325000 浙江省温州市瓯海*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 子宫 内膜 肿瘤 分类 标记 方法 | ||
1.一种基于随机森林的子宫内膜肿瘤分类标记方法,其特征在于,包括以下步骤:
步骤S1、获取子宫内膜恶性肿瘤数据和子宫内膜良性肿瘤数据形成样本数据,并对所获取到的样本数据进行归一化处理,且进一步将归一化处理后的样本数据划分出测试集和多个训练集;
步骤S2、选取决策树类型为CART,并分别对每一个训练集进行决策树训练,得到每一个训练集各自训练出的相应CART决策树模型;
步骤S3、通过特征重要性,对每一个CART决策树模型中所有特征均进行评估,得到每一个CART决策树模型中满足预定条件的特征集;
步骤S4、对每一个CART决策树模型中满足预定条件的特征集均通过基尼指数的比对选出最优特征来进行分支处理,得到每一个CART决策树模型各自经分支处理后的相应决策树,并进一步形成随机森林模型;其中,所选最优特征为子宫内膜恶性肿瘤数据区别于子宫内膜良性肿瘤数据的关键特征指标,并按照基尼指数从小到大的顺序进行排序剪枝;
步骤S5、采用粒子群算法对所述随机森林模型进行优化,得到优化后的随机森林模型,并将所述测试集导入所述优化后的随机森林模型中,得到训练好的随机森林模型;
步骤S6、获取待测子宫内膜肿瘤数据,并将所述待测子宫内膜肿瘤数据导入所述训练好的随机森林模型中,区别出所述待测子宫内膜肿瘤数据为子宫内膜恶性肿瘤数据或子宫内膜良性肿瘤数据。
2.如权利要求1所述的基于随机森林的子宫内膜肿瘤分类标记方法,其特征在于,以所述归一化处理后的样本数据总量的约25%随机组合为一份数据集作为测试集,剩下的75%作为训练数据。从训练数据中有放回随机采样选出n个样本为一份,占数据总量的50%,形成N个不相同的训练集,用来产生N棵CART树。
3.如权利要求1所述的基于随机森林的子宫内膜肿瘤分类标记方法,其特征在于,所述通过特征重要性,对每一个CART决策树模型中所有特征均进行评估,得到每一个CART决策树模型中满足预定条件的特征集的步骤具体包括:
确定当前待评估的CART决策树模型,并在当前待评估的CART决策树模型中,汇总出对应训练集中训练数据的所有特征;
计算出当前待评估的CART决策树模型中每个特征的基尼指数评分,并待按照预设的特征重要性,对当前待评估的CART决策树模型中所有计算出的基尼指数评分进行排列后,得到当前待评估的CART决策树模型中按照特征重要性降序排列的特征集;
依据预设的剔除比例,重复在所述特征集中以特征重要性从小到大的顺序进行特征剔除,直至所述特征集中特征数量达到阈值为止,得到当前待评估的CART决策树模型中特征剔除后的特征集。
4.如权利要求1所述的基于随机森林的子宫内膜肿瘤分类标记方法,其特征在于,所述对每一个CART决策树模型均通过基尼指数的比对选出最优特征来进行分支处理的步骤具体包括:
确定当前待分支处理的CART决策树模型,并在当前待分支处理的CART决策树模型中,汇总出对应训练集中训练数据的所有特征;
计算出当前待分支处理的CART决策树模型中每个特征的基尼指数评分,并在选出最小基尼指数评分的特征为最优特征后,将所选的最优特征及其对应的切分点作为根节点衍生的两个子节点,且进一步将剩余的特征分配到上述两个子节点中,实现分支处理;其中,所述分支处理的过程包括预剪枝处理,具体为若当前待分支处理的CART决策树模型中某一树杈上的样本小于所设定的参数,则相对应的决策树就不再继续生长。
5.如权利要求3或4所述的基于随机森林的子宫内膜肿瘤分类标记方法,其特征在于,特征Xj在某一个CART决策树模型中的基尼指数评分通过公式来实现;其中,
k表示在具有m个节点的CART决策树模型中存在的类别个数;Pmk表示在具有m个节点的CART决策树模型中类别k所占的比例大小;GIm表示节点m的基尼指数;GIl表示特征Xj在节点m分支前的基尼指数;GIr表示特征Xj在节点m分支后的基尼指数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010505813.1/1.html,转载请声明来源钻瓜专利网。