[发明专利]基于stacking算法的妊娠糖尿病预测方法在审
| 申请号: | 202010947618.4 | 申请日: | 2020-09-10 |
| 公开(公告)号: | CN112185555A | 公开(公告)日: | 2021-01-05 |
| 发明(设计)人: | 高玛娜 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/70 |
| 代理公司: | 济南佰智蔚然知识产权代理事务所(普通合伙) 37285 | 代理人: | 王砚雷 |
| 地址: | 100020 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 stacking 算法 妊娠 糖尿病 预测 方法 | ||
1.基于stacking算法的妊娠糖尿病预测方法,其特征在于,所述包括以下步骤:
S1、患病数据收集;
S2、数据处理;
S3、特征分析与特征构造;
S4、构造最优子集;
S5、单集成预测模型构建;
S6、模型融合;
S7、融合模型与单模型预测性能分析与对比。
2.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S1、患病数据收集中,收集便携式计算机,通过便携式计算机登录阿里云医疗数据库,收集阿里云医疗真实数据,记录患病数据备份。
3.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S2、数据处理中,选用合适的数据预处理方法处理缺失值,处理和选择特征来构成特征子集,使构成的特征子集能在算法上表现更好的效果,以及构造有效的特征子集,选出对妊娠糖尿病有影响的特征变量作为模型的输入变量,使计算的复杂度简化并提升模型的预测效果。
4.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S3、特征分析与特征构造中,分别对比步骤S2、数据处理中异常值处理和缺失值处理,对数据进行数据处理及分析。
5.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S4、构造最优子集中,选取S3、特征分析与特征构造中,最优数据构建子集。
6.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S5、单集成预测模型构建中,用集成学习算法构建预测模型来预测妊娠糖尿病,以及根据数据集特点对模型参数进行调优,分别建立XGBoost、随机森林、catboost、逻辑回归四个单集成妊娠糖尿病预测模型,并通过实验调参使单集成模型的预测效果达到最佳。
7.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S6、模型融合中,结合步骤S5、单集成预测模型构建中XGBoost、随机森林、catboost、逻辑回归四者的优点,弥补不足,选择两层stacking集成学习框架进行模型融合,选取XGBoost、随机森林与catboost这三种模型当做模型融合的基模型作为训练,并得出预测结果,将预测结果作为特征,应用到逻辑回归模型中进行训练,训练出最终预测模型。
8.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S7、融合模型与单模型预测性能分析与对比中,将步骤S6、模型融合中的预测结果与步骤S5、单集成预测模型构建中四种单集成预测模型预测结果进行汇总,对AUC值进行比较,验证融合模型的预测表现是否优于其他模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010947618.4/1.html,转载请声明来源钻瓜专利网。





