[发明专利]一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法在审
申请号: | 201911377048.3 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111180012A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 赵天意;臧天仪;胡杨 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 刘景祥 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 经验 贝叶斯 孟德尔 随机化 融合 基因 识别 方法 | ||
本发明是一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法。所述方法采用经验贝叶斯元信息分析全基因组关联分析数据,得到分析结果;基于经验贝叶斯的综合层次元信息分析,修正全基因组中的每个SNP的统计值;基于孟德尔随机化的全基因组关联分析数据分别与eQTL和mQTL数据整合,根据孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果的重叠部分,得到基因识别结果。本发明可以极大地提高AD相关基因的识别速度,充分的利用现有的数据,提升了疾病相关基因识别的速度并节省了研发费用。计算结果可以筛选掉极大部分的基因,为后续的生物实验提供了有价值的研究范围。
技术领域
本发明涉及基因识别技术领域,是一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法。
背景技术
目前,大多数学者采用开发相关试剂、构建生物实验等方法识别阿尔兹海默病(AD)相关的基因。而这些方法耗时极长、费用极高。近年来随着计算机技术的不断发展,测序技术的升级,已经存在大量计算机算法用于识别与疾病相关的基因。目前,使用全基因组关联分析(GWAS)寻找AD的风险基因是一种常用手段。这个世纪初,许多课题组都在识别AD的易感位点,但实际结果并不理想,不同课题组间所共同找到的易感基因只有sorl1。导致研究结果不一致的原因主要是由于实验样本的异质性、复杂的连锁不平衡模式、等位基因频率的差异以及样本量的大小。在过去的10年里,高通量测序技术的出现允许研究人员同时检测基因组上数以百万计的单核苷酸多态性位点(Single Nucleotide Polymorphisms,SNP)。一些大的机构和公司在高通量测序技术上的努力使得人们在近几年发现了许多新的AD的通路和易感基因。第一批将GWAS应用到AD中的研究者首先识别出了clu、picalm、cr1和bin1等4个易感基因位点。后来又有其他研究组通过更大样本量的GWAS分析找到了如cd33和epha1等易感基因位点,这些研究的实验样本都主要来自于欧洲人群。然而,GWAS仍然存在一定的局限性。例如,该策咯基于“常见疾病-常见变异”的假说,遗漏了可能在病因中起更重要作用的罕见变异(次要等位基因频率(minor allele frequency,MAF0.005));所获得的关联SNP也不一定是真正的致病位点,而只是与真正致病位点呈LD关联的“标签”SNP,尤其是一些位于所谓的基因“荒漠区”的信号,对阐明遗传变异的生物学功能造成了很大的困难;GWAS通常根据统计学差异最明显的原则,分析单个位点的边际效应,而忽视了复杂性疾病存在的多基因的交互作用。因此,GWAS仍不能全面揭示复杂性疾病的遗传易感因素,它只是探索复杂性疾病遗传病因机制的一个重要环节,如何对GWAS易感位点进行深入挖掘并找出真正的致病位点,及探索这些非编码序列如何发挥生物学机制成为遗传学研究的又一个挑战。
研究发现,GWAS所发现的遗传易感位点约80%位于基因组的非编码区,提示其中的致病位点可能对基因表达存在调控功能。因此,本发明将表达数量性状位点定位(expression quantitative trait loci,eQTL)和甲基化数量性状基因座数据mQTL(methylation quantitative trait loci,eQTL)数据引入,结合GWAS数据,开发EB-SMR识别AD相关的基因。引入eQTL和mQTL数据是由于这两种数据可以体现SNP对基因表达的影响,而GWAS数据告知了哪些SNP与AD相关,整合这三种数据,便可知哪些SNP改变了基因表达而与AD相关。
发明内容
本发明为有效识别阿尔兹海默病相关的基因,本发明提供了一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,本发明提供了以下技术方案:
一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,包括以下步骤:
步骤1:采用经验贝叶斯元信息分析全基因组关联分析数据,得到分析结果;
步骤2:基于经验贝叶斯的综合层次元信息分析,修正全基因组中的每个SNP的统计值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911377048.3/2.html,转载请声明来源钻瓜专利网。