[发明专利]一种基于PAGIS识别基因通路的方法有效
| 申请号: | 201710300778.8 | 申请日: | 2017-05-02 |
| 公开(公告)号: | CN107133492B | 公开(公告)日: | 2020-08-25 |
| 发明(设计)人: | 刘文斌;沈良忠;昝乡镇 | 申请(专利权)人: | 温州大学 |
| 主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B25/10;G16B40/00 |
| 代理公司: | 温州名创知识产权代理有限公司 33258 | 代理人: | 陈加利 |
| 地址: | 325000 浙江省温州市瓯海*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 pagis 识别 基因 通路 方法 | ||
本发明实施例公开了一种基于PAGIS识别基因通路的方法,包括获取样本,并确定样本的信号通路及基因,且进一步获取每一个基因的基因频度及基因出度;根据每一个基因的基因频度及基因出度,统计出最大基因频度、最小基因频度、最大基因出度和最小基因出度,并得到每一个基因的基因频度权重和基因出度权重;根据每一个基因的基因频度权重及基因出度权重,计算出每一个基因的综合权重,并得到每一个信号通路的权重,且进一步将每一个信号通路的权重进行排序,确定最大信号通路权重所对应的信号通路出现变化的概率最大。实施本发明实施例,结合基因的重要性和特异性来识别通路,提高通路的识别精度。
技术领域
本发明涉及系统生物学研究技术领域,尤其涉及一种基于PAGIS识别基因通路的方法。
背景技术
基于微阵列的高通量技术产生了大量的基因表达数据,如何从这些海量基因表达数据中获得洞察性的认识,进而理解生命现象的机制仍然是摆在世界各国科学家面前的一个严峻的挑战。生物通路是一组完成特定功能的基因之间的相互作用关系,主要有信号传导通路和代谢通路。在信号传导通路中,节点代表基因(或基因产物),边代表从一个基因转导到另一个基因的信号。在代谢通路中,节点代表生化化合物,边代表通过酶编码的化合物之间的生物化学反应,酶是为基因编码的。常用的通路数据库有KEGG和Reactome数据库,它们提供了基因之间相互作用的可视化形式。
从系统生物学的角度,基因之间的相互作用及其动力学的变化是导致各种疾病及癌症发生的主要原因,由于通路的拓扑结构特征反应了基因在通路中的位置,重要性以及基因之间的相互作用,因此通路的识别应尽可能考虑到通路中包含基因的各种信息,如基因的上下游位置、调控基因的数量、基因之间的作用关系等等因素。
2005年,PNAS上发表了两篇重要的通路分析方法的论文,一个是Tian等人提出的基于功能的显著通路分析方法,这种方法综合考虑了一个基因集合中基因表达与集合外基因表达差异的显著性(行置换),以及该基因集基因表达与表型相关性的显著性(列置换)。另一个是Subramanian等人提出著名的基因集富集分析方法GSEA方法,其主要思想是根据通路中基因表达情况与给定表型之间的相关性对所有基因进行排序,然后确定给定通路P的Kolmogorov-Smirnov(斯米尔诺夫)统计量在排序列表中靠近极端处程度的得分。该方法中,Kolmogorov-Smirnov统计量的显著性根据样本的列置换确定。2006年,Zahn等人使用Van der Waerden(范得瓦尔登)统计量代替Kolmogorov-Smirnov统计量并用自举抽样代替置换检验方法该方法考虑了通路中两个基因表达水平的相关性以及与其他因素的相关性。同年,EFRON等人用最大-均值统计量替代Kolmogorov-Smirnov统计量来计算通路分数,然后通过行置换方法对该分数进行标准化,最后利用列置换来检验通路分值的显著性,这就是著名的GSA方法。
在上述基因集富集分析方法GSEA和基因集分析方法GSA的基础上,还有学者提出了信号通路影响分析方法SPIA和重叠基因降权方法PADOG。在信号通路影响分析方法SPIA中,只考虑了基因的上下游位置对扰动信号的传播的影响,却忽略了通路中调控大量基因的基因应比仅调控少量基因的基因更为重要,它们的差异对通路的功能具有更大的影响性,而在重叠基因降权方法PADOG中,虽结合了GSA方法的基础上,降低频繁出现在很多通路中的“公共基因”的影响,但是也未考虑到通路中调控大量基因的基因应比仅调控少量基因的基因更为重要,它们的差异对通路的功能具有更大的影响性。
因此,有必要将一个基因在通路中调控下游基因的数量设为基因出度并定义为基因的重要性,将一个基因在通路中出现的次数设为基因频度并定义为基因的特异性,从而结合基因定义的重要性和特异性来提高通路的识别精度。
发明内容
本发明实施例的目的在于提供一种基于PAGIS识别基因通路的方法,结合基因的重要性和特异性来识别通路,提高通路的识别精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710300778.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:美食的生成方法和装置
- 下一篇:一种新的分析生物基因组拷贝数变异的可视化方法





