[发明专利]一种基于机器学习的孤独症谱系障碍早期识别方法在审
申请号: | 202211324088.3 | 申请日: | 2022-10-27 |
公开(公告)号: | CN115565690A | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 韦秋宏;程茜;徐铣明;徐雪丽 | 申请(专利权)人: | 重庆医科大学附属儿童医院 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H50/20;G16H10/60;G06N5/00 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 姬莉 |
地址: | 400014 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 孤独症 谱系 障碍 早期 识别 方法 | ||
1.一种基于机器学习的孤独症谱系障碍早期识别方法,其特征在于,包括以下步骤:
选择发育障碍性儿童的行为评估量表及人口学信息构建数据集,所述数据集中包含发育性语言障碍DLD样本、全面发育迟缓GDD样本和孤独症谱系障碍ASD样本;
对数据集内的样本进行预处理,通过设置权重处理不平衡数据;
基于分类模型XGBoost构建两阶段决策模型TS-DM;
将待测样本输入TS-DM模型,通过TS-DM模型分别对发育性语言障碍DLD和孤独症谱系障碍ASD、全面发育迟缓GDD进行识别;
所述基于分类模型XGBoost构建两阶段决策模型TS-DM的过程包括:
将预处理后的样本输入XGBoost模型,通过XGBoost算法对DLD样本以及合并的GDD样本和ASD样本进行分类,通过SHAP值选取使得XGBoost模型的受试者工作曲线下面积ROC-AUC不再上升的特征,建立XGBoost单树模型,形成第一阶段决策模型;
重复上述步骤,建立单树XGBoost对GDD和ASD进行分类,形成第二阶段决策模型。
2.根据权利要求1所述的基于机器学习的孤独症谱系障碍早期识别方法,其特征在于,所述行为评估量表包括作为训练特征的Gesell发展量表GDS、早期语言发育进程量表ELMS、改良版婴幼儿孤独症筛查量表M-CHAT、孤独症行为量表ABC。
3.根据权利要求2所述的基于机器学习的孤独症谱系障碍早期识别方法,其特征在于,所述通过设置权重处理不平衡数据,其中:
4.根据权利要求3所述的基于机器学习的孤独症谱系障碍早期识别方法,其特征在于,将预处理后的孤独症谱系障碍ASD样本和全面发育迟缓GDD样本合并为一类,发育性语言障碍DLD样本单独作为一类,获得两大类样本;从这两大类样本中随机选取各类20例作为验证集,其余为训练集。
5.根据权利要求4所述的基于机器学习的孤独症谱系障碍早期识别方法,其特征在于,基于所述训练集对两阶段决策模型TS-DM进行训练,包括:
采用网格搜索十折交叉验证的调参方式确定XGoost模型的最佳参数,需要优化的参数包括树估计器的数量n_estimators,单个树的最大深度max_depth,随机采样比例subsample;随机采样的列数的比例colsample_bytree,以及学习率learning_rate,其余未提及的参数均使用默认参数;
通过XGBoost算法对DLD样本以及合并的GDD样本和ASD样本进行分类,根据SHAP值对XGBoost模型中所有特征进行排序,按照重要顺序将特征依次纳入重置参数n_estimators=1,subsample=1,colsample_bytree=1的XGBoost单树模型中进行训练,直到模型的受试者工作曲线下面积ROC-AUC不再上升,选择此时纳入训练的特征作为TS-DM的特征,训练第一阶段决策模型;
重复上述过程,对孤独症谱系障碍ASD和全面发育迟缓GDD样本进行分类,训练第二阶段决策模型。
6.根据权利要求5所述的基于机器学习的孤独症谱系障碍早期识别方法,其特征在于,通过准确率ACC和召回率R对分类模型XGBoost和两阶段决策模型TS-DM进行评估;
其中TP、FP、TN和FN分别表示真阳性率、假阳性率、真阴性率和假阴性率,分类使用默认阈值0.5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆医科大学附属儿童医院,未经重庆医科大学附属儿童医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211324088.3/1.html,转载请声明来源钻瓜专利网。