[发明专利]一种基于深度神经网络的I型糖尿病风险评估系统在审
申请号: | 202110654175.4 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113393896A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 马玉昆;贾寒;黎松;孙琼琳;温颜华;韩仕伟;李伟华 | 申请(专利权)人: | 成都果壳医学科技有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/30;G16B20/50;G16B5/00;G06N3/08;G06N3/04 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 赵悦 |
地址: | 610200 四川省成都市成都高新*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 神经网络 糖尿病 风险 评估 系统 | ||
1.一种基于深度神经网络的I型糖尿病风险评估系统,其特征在于,包括:数据输入模块、位点获取模块、位点筛选模块、模型训练模块和模型检验模块;
所述数据输入模块,用于输入或采集样本数据;
所述位点获取模块,用于获取所述样本数据的全基因组位点的基因型信息;
所述位点筛选模块,用于对所述基因型信息进行GWAS统计,对GWAS统计结果进行质量控制,并根据质量控制后的分析结果对所述位点进行筛选;
所述模型训练模块,用于根据筛选后的位点对神经网络模型进行训练,以获得最优模型;
所述模型检验模块,用于对所述最优模型进行检验。
2.如权利要求1所述的基于深度神经网络的I型糖尿病风险评估系统,其特征在于,所述数据输入模块的样本数据包括患有糖尿病的样本数据和对照样本数据,将所述样本数据分为训练集和检验集,所述训练集和检验集中均包括患有糖尿病的样本数据和对照样本数据,且所述训练集和检验集不存在样本数据重叠。
3.如权利要求1所述的基于深度神经网络的I型糖尿病风险评估系统,其特征在于,所述位点获取模块中采用芯片检测技术获取全基因组位点的基因型信息,所述芯片检测技术中通过多个芯片进行基因型信息检测。
4.如权利要求2所述的基于深度神经网络的I型糖尿病风险评估系统,其特征在于,所述位点筛选模块中GWAS统计结果至少包括以下内容:染色体号、物理位置、突变位点ID、参考等位、效应等位、效应等位基因频率、对疾病的效应值、效应值标准差、与疾病关联的显著性P值、样本量大小和种族信息。
5.如权利要求4所述的基于深度神经网络的I型糖尿病风险评估系统,其特征在于,所述位点筛选模块中筛选位点的方法包括判断所述训练集和检验集中样品缺失位点的周围非缺失位点的单倍型的基因型,然后根据所述单倍型的基因型对所述样品缺失位点进行填充,对所述训练集和检验集中填充后的样品的基因型数据分别进行质量控制。
6.如权利要求5所述的基于深度神经网络的I型糖尿病风险评估系统,其特征在于,所述质量控制包括去除重复的位点,去除不明确位点,保留最小等位频率MAF大于0.01且填充INFO值大于0.5的位点;所述不明确位点是指参考碱基和变异碱基同时为嘌呤或者嘧啶。
7.如权利要求2所述的基于深度神经网络的I型糖尿病风险评估系统,其特征在于,所述模型训练模块包括数据转换子模块、模型建立子模块、面积计算子模块和模型输出子模块;
所述数据转换子模块,用于对所述基因型信息进行数据转换和标准化,并对表型性状进行重新编码;
所述模型建立子模块,用于以对疾病具有效能的突变位点作物自变量,以疾病性表型性状作为因变量构建多因素逻辑回归模型;
所述面积计算子模块,用于获得所述多因素逻辑回归模型的ROC曲线,并计算ROC曲线下面积;
所述输出模块,用于输出所述ROC曲线下面积最大时对应的多因素逻辑回归模型。
8.如权利要求7所述的基于深度神经网络的I型糖尿病风险评估系统,其特征在于,所述模型建立子模块中按照不同的P值筛选出候选的突变位点,并将其作为深度神经网络模型的输入层。
9.如权利要求7所述的基于深度神经网络的I型糖尿病风险评估系统,其特征在于,所述ROC曲线下面积通过五倍交叉检验获得,所述五倍交叉检验将所述训练集中的患有糖尿病的样本数据和对照样本数据随机分为若干份,将若干份的数据按照预设比例分为训练子集和检验子集,以训练子集对所述模型进行训练,以所述检验子集中的数据对模型进行检验,将若干份数据输入经过检验的模型,进行再次检验,获得ROC曲线,计算ROC曲线下面积,重复五倍交叉检验预设次数,将每次获得的ROC曲线下面积取平均值,所述平均值为最终的ROC曲线下面积。
10.如权利要求2所述的基于深度神经网络的I型糖尿病风险评估系统,其特征在于,所述模型训练模块将所述训练集中数据输入所述最优模型,以获得输出结果的ROC曲线,若ROC曲线下面积大于阈值则所述最优模型为最终选用的模型,否则重新对模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都果壳医学科技有限公司,未经成都果壳医学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110654175.4/1.html,转载请声明来源钻瓜专利网。