[发明专利]一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法在审
申请号: | 201911377048.3 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111180012A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 赵天意;臧天仪;胡杨 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 刘景祥 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 经验 贝叶斯 孟德尔 随机化 融合 基因 识别 方法 | ||
1.一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,其特征是:包括以下步骤:
步骤1:采用经验贝叶斯元信息分析全基因组关联分析数据,得到分析结果;
步骤2:基于经验贝叶斯的综合层次元信息分析,修正全基因组中的每个SNP的统计值;
步骤3:基于孟德尔随机化的全基因组关联分析数据分别与eQTL和mQTL数据整合,得到孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果;
步骤4:根据孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果的重叠部分,得到基因识别结果。
2.根据权利要求1所述的一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,其特征是:所述步骤1具体为:
采用经验贝叶斯元信息分析全基因组关联分析数据,全基因组关联分析数据包含SE和Beta值,SE值表示每个SNP的标准误差确定每个Beta值的权重,通过下式表示每个Beta值的权重:
wi=1/SEi2 (1)
其中,wi为每个Beta值的权重,SEi代表每个SNP的标准差,wi代表Beta值的权重.
通过下式表示元信息分析后的Beta值为:
其中,β为元信息分析后的Beta值,βi表示第i次实验的Beta估计值;
根据每个Beta的权重来计算元信息分析后的结果,通过下式表示元信息分析后的结果:
其中,SE为元信息分析后的结果。
3.根据权利要求1所述的一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,其特征是:所述步骤2具体为:
步骤2.1:根据元信息分析后的结果确定总体Z统计量,通过下式确定总体Z统计量:
Z=β/SE (4)
步骤2.2:将多个全基因组关联分析数据集汇总为一个数据集,采用经验贝叶斯整合整个基因组水平的所有Z统计值,令Z统计值服从方差是1的分布,确定有偏Z统计值,通过下式表示有偏Z统计值:
其中,为有偏Z统计值,Zi为真实Z统计量,N为方差分布;
真实Z统计量Zi服从正态分布,通过下式表示的正态分布、边缘分布和后验分布:
其中,式(6)至式(8)分别表示的正态分布、边缘分布和后验分布,B为经验贝叶斯的正态分布参量,σ为正态分布的标准差,θ为正态分布的均值;
通过的平均值估计正态分布的均值θ:
根据反卡方分布的性质:
通过经验贝叶斯估计确定B,因此,B的经验贝叶斯估计通过下式表示
其中,S为SNP序列,χ2为反卡方分布;
将式(15)带入式(8)中,完成了元信息分析,并修正整个基因组中每个SNP的统计值,通过下式表示修正后的真实Z的统计值
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911377048.3/1.html,转载请声明来源钻瓜专利网。