[发明专利]一种基于多组学的复杂性疾病预测及诊断方法在审
申请号: | 201611052903.X | 申请日: | 2016-11-24 |
公开(公告)号: | CN106650241A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 刘京铭;李传友 | 申请(专利权)人: | 首都医科大学附属北京胸科医院 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06F19/12 |
代理公司: | 北京轻创知识产权代理有限公司11212 | 代理人: | 杨立 |
地址: | 104149*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多组学 复杂 性疾病 预测 诊断 方法 | ||
1.一种基于多组学的复杂性疾病预测及诊断方法,其特征在于,包括以下步骤:
步骤1、获取被试者的第一基因组信息;
步骤2、将所述第一基因组信息与已获得的基因组变异位点与复杂性疾病的关联性信息进行匹配,计算所述第一基因组信息对应的复杂性疾病判别评分CDDS值;
步骤3、比较所述CDDS值与预存的CDDS基准值的大小关系,得到比较结果;
步骤4、根据所述比较结果,确定所述被试者患所检测复杂性疾病的概率。
2.根据权利要求1所述的基于多组学的复杂性疾病预测及诊断方法,其特征在于,步骤4包括:
当所述比较结果为所述CDDS值大于所述CDDS基准值时,确定所述被试者患所检测复杂性疾病的概率超过85%;或者,
当所述比较结果为所述CDDS值小于所述CDDS基准值时,确定所述被试者患所检测复杂性疾病的概率低于15%。
3.根据权利要求1所述的基于多组学的复杂性疾病预测及诊断方法,其特征在于,在步骤1之前,还包括:
步骤5、根据获取的健康人群基因组信息和目标疾病人群基因组信息,获得基因组变异位点与复杂性疾病关联性信息。
4.根据权利要求3所述的基于多组学的复杂性疾病预测及诊断方法,其特征在于,步骤5包括:
步骤5.1、获取所述健康人群基因组信息和所述目标疾病人群基因组信息;
步骤5.2、基于多组学构建目标疾病对应的多个模型;
步骤5.3、分别将所述健康人群基因组信息和所述目标疾病人群基因组信息与所述多个模型进行映射,得到健康人群模型集合与目标疾病人群基模型集合;
步骤5.4、对于所述多个模块中的每个模型,分别计算所述健康人群模型集合与所述目标疾病人群基模型集合中属于同一模型的第二基因组信息对应的CDDS值,得到多个所述第二基因组信息分别对应的多个CDDS值;
步骤5.5、将多个所述第二基因组信息和多个所述CDDS值一一对应的存储,形成基因组变异位点与复杂性疾病的关联性信息,所述关联性信息为所述基因组信息与CDDS值的对应关系。
5.根据权利要求4所述的基于多组学的复杂性疾病预测及诊断方法,其特征在于,所述第一基因组信息、所述健康人群基因组信息和所述目标疾病人群基因组信息均通过芯片技术和/或测序技术获取。
6.根据权利要求4所述的基于多组学的复杂性疾病预测及诊断方法,其特征在于,步骤5还包括:
步骤5.6、利用模型预测评价方法,计算多个所述CDDS值对应的多个受试者工作特征ROC曲线,以及与多个所述ROC曲线分别对应的多个AUC;
步骤5.7、将多个所述ROC曲线中的第一ROC曲线所对应的模型确定为最优模型,所述最优模型对应的CDDS值为所述CDDS基准值,其中,所述第一ROC曲线的敏感性和特异性均大于85%,且所述第一ROC曲线对应的AUC大于90%。
7.根据权利要求1-6中任一项所述的基于多组学的复杂性疾病预测及诊断方法,其特征在于,利用朴素贝叶斯算法计算所述CDDS值。
8.根据权利要求7所述的基于多组学的复杂性疾病预测及诊断方法,其特征在于,利用朴素贝叶斯算法计算所述CDDS值,包括:
计算所述被试者患所述复杂性疾病时第一基因变异的概率P1、所述被试者不患所述复杂性疾病时所述第一基因变异的概率P2,以及所述复杂性疾病的发病概率P3和不发病概率P4;
根据所述P1、P2、P3和P4,计算所述CDDS值。
9.根据权利要求8所述的基于多组学的复杂性疾病预测及诊断方法,其特征在于,根据以下公式计算所述CDDS值:
其中,Nυ为所述模块模型所包含的全部基因变异的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都医科大学附属北京胸科医院,未经首都医科大学附属北京胸科医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611052903.X/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用