[发明专利]一种基于神经网络算法的川崎病风险评估模型的构建方法及构建系统有效
申请号: | 201811076751.6 | 申请日: | 2018-09-14 |
公开(公告)号: | CN109243604B | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 丁国徽;黄敏;张泓;王淑;蒋蓓;贾佳;李光;徐重飞;周珍 | 申请(专利权)人: | 道之精准医学科技(上海)有限公司 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/30 |
代理公司: | 苏州三英知识产权代理有限公司 32412 | 代理人: | 朱如松 |
地址: | 201600 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 算法 川崎病 风险 评估 模型 构建 方法 系统 | ||
1.一种基于神经网络算法的川崎病风险评估模型的构建方法,其特征在于包括:
从样本数据集中提取可用于建模评估模型的有效样本;
从所述有效样本的特征集中筛选出符合现场医疗辅助诊断应用的10项特征;
将所述有效样本的不完整数据集随机分割为训练集和验证集;
使用神经网络的方法拟合训练集进行模型构建,采用十折交叉验证法,记录最优模型参数;同时,根据ROC曲线使用验证集计算模型分类阈值t,从而构建得到川崎病风险评估模型;
其中,从所述有效样本的特征集中筛选出符合现场医疗辅助诊断应用的10项特征,具体包括:
步骤11.对训练集D,使用神经网络默认参数建立模型;
步骤12.将其中一个特征变量Vi的数值加上或减少10%并进行替换,得到新数据集D1,D2;
步骤13.将D1,D2作为仿真数据集,利用步骤11中的模型进行仿真预测,记录其正确率的差值MIVi=D1-D2;
步骤14.重复步骤12~13,得到每一个变量的MIV值并进行排序;
步骤15.根据步骤14所得结果,并结合在实际应用于现场医疗辅助诊断中,取得各项特征值所用时间较短者,进行综合比较得到;
采用十折交叉验证法,记录最优模型参数,具体包括:
步骤21.将训练集数据平均分为十部分;
步骤22.取其中九折数据,使用神经网络的方法进行拟合,得到模型:
步骤23.利用步骤22所得模型,对剩余一折的数据集进行预测,并计算其预测误差;
步骤24.改变参数,重复步骤22~23;
步骤25.比较预测误差,记录使得预测误差最小的模型所对应的参数,作为最优模型参数;
根据ROC曲线使用验证集计算模型分类阈值t,具体包括:
步骤31.利用最优参数模型,在训练集上建立最优模型;
步骤32.使用验证集观测值,在模型上进行预测,得到分类得分;
步骤33.在[0,1]范围内,选取不同数值作为分类阀阈值,对步骤32所得分类得分进行划分;
步骤34.计算不同分类阀域下,预测的敏感度、特异度和正确率,并绘制ROC曲线图;
步骤35.根据ROC曲线图选取使得同时满足预测的敏感度、特异度和正确率较优的分类阀域。
2.根据权利要求1所述的基于神经网络算法的川崎病风险评估模型的构建方法,其特征在于:所述10项特征分别为性别、年龄、C-反应蛋白浓度、纤维蛋白原浓度、白蛋白浓度、球蛋白浓度、补体C3浓度、免疫球蛋白G浓度、前白蛋白浓度和白球比例。
3.根据权利要求1所述的基于神经网络算法的川崎病风险评估模型的构建方法,其特征在于:训练集与验证集的分割比例为1:1~10:1。
4.根据权利要求1所述的基于神经网络算法的川崎病风险评估模型的构建方法,其特征在于包括:根据ROC曲线使用验证集计算模型分类阈值t,KDx评分高于分类阈值t预测为川崎病高风险,低于分类阈值t预测为川崎病低风险。
5.根据权利要求1-4中任一项所述的基于神经网络算法的川崎病风险评估模型的构建方法,其特征在于还包括:以完整的数据集作为测试集,对构建得到的川崎病风险评估模型进行预测。
6.根据权利要求1所述的基于神经网络算法的川崎病风险评估模型的构建方法,其特征在于包括:
根据川崎病诊断标准将样本数据集分为川崎病和普通发热疾病两组,对不能明确诊断结果的样本进行删除处理;
对重复数据进行删除处理;
对数据量不足80%的指标进行删除处理;
对残缺、错误数据进行中位数填充;
对整体数据离差标准化,从而获得可用于构建评估模型的有效样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于道之精准医学科技(上海)有限公司,未经道之精准医学科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811076751.6/1.html,转载请声明来源钻瓜专利网。