[发明专利]一种基于OrthoMCL聚类结果的快速分析方法有效
| 申请号: | 201911044264.6 | 申请日: | 2019-10-30 |
| 公开(公告)号: | CN110808085B | 公开(公告)日: | 2023-03-21 |
| 发明(设计)人: | 韩毛振;张雁;曹杰;汪栋;罗学才 | 申请(专利权)人: | 安徽医科大学 |
| 主分类号: | G16B25/00 | 分类号: | G16B25/00;G16B50/00 |
| 代理公司: | 合肥中谷知识产权代理事务所(普通合伙) 34146 | 代理人: | 洪玲 |
| 地址: | 230000 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 orthomcl 结果 快速 分析 方法 | ||
本发明公开了一种基于OrthoMCL聚类结果的快速分析方法,属于比较基因组学和生物信息学领域,该方法以OrthoMCL聚类结果为基础,建立自动对泛基因组分析中各类蛋白的识别,包括所有代表性蛋白质、核心蛋白质、单拷贝核心蛋白质和物种特异性蛋白质。基于这些蛋白质各自的分类,对这些分类的蛋白质在各自物种中存在的个数进行统计,并按照类别将结果进行输出。该方法实现了对各种分类中蛋白质的代表性序列的输出以及各类蛋白在每个物种中的代表性序列的输出。此外,该方法也将蛋白质同源聚类结果按照每一个同源蛋白质对应的序列进行输出,为实现泛基因组分析中更为高级的个性化分析奠定基础。
技术领域
本发明涉及比较基因组学和生物信息学领域,尤其涉及一种基于OrthoMCL聚类结果的快速分析方法。
背景技术
比较基因组学(Comparative Genomics)是从进化的角度分析不同物种的基因组数据,对已知的基因和基因组结构进行比较,从而解析基因的功能以及基因与疾病和表型之间的遗传学机制(C.Setubal et al.,2017,Shilei Zhao et al.,2019)。随着测序技术的快速发展,特别是二代、三代测序技术的发展革新,众多物种的基因组已经测序完成,越来越多的物种都在种水平上有了多个样本的群体基因组数据。如何快速有效地对这些基因组测序数据进行比较分析,是目前比较基因组学研究中方法开发的一个主要研究领域。
目前在泛基因组的分析中一般涉及到以下几个方面的内容:同源蛋白质的聚类分析、对同源蛋白质聚类结果的分析、蛋白质的建树和进化分析、蛋白质的功能注释(包括但不限于碳水化合物功能的注释(CAZyme)、蛋白质功能的注释(COG和GO注释)和代谢途径的注释(KEGG pathway)等)。在已开发的泛基因组分析工具中,已经有PGAP(Yongbing Zhaoet al.,2011)和EDGAR(J.Yu et al.,2017)和panX(Wei Ding et al.,2018)等工具。这些工具实现了泛基因组分析中所需的绝大部分内容,但是输出结果一般是经过高度整合之后的。正是由于缺少对应的中间过程文件,特别是对蛋白质的同源聚类结果及其相应的统计文件和蛋白质序列文件,使得泛基因组分析中所需的个性化分析难以开展。因此,如何快速有效地对泛基因组分析中蛋白质的同源聚类结果进行分析和统计,并对相应的蛋白质进行分类(主要涉及到泛基因组分析中的核心蛋白质、单拷贝核心蛋白质、非必需蛋白质和特异性蛋白质)输出相对应的代表性的蛋白质序列,为后续的分析提供输入文件是实现泛基因组分析中的个性化分析的重要前提。但是目前也没有专门的方法可供使用,开发此类方法是必要的。
在泛基因组分析中,实现物种内所有蛋白质的同源聚类是进行后续分析的基础。目前相应的工具就包括OrthoMCL(https://orthomcl.org/orthomcl/),BLAST和Diamond(Wei Ding et al.,2018)等。其中OrthoMCL在泛基因组分析中是用来寻找直系同源基因和旁系同源基因,其使用具有详细的教程,易上手,是目前泛基因组分析中使用较为广泛的工具。其输出结果所包含的同源聚类结果也较为系统和全面,是实现对泛基因组分析中确定各蛋白质分类的基础文件。
基于以上原因,为了实现对泛基因组分析中更多高级的个性化分析,需要建立对蛋白质聚类结果的快速有效处理。因此针对泛基因组中的蛋白质聚类结果非常有必要运用比较基因组学和生物信息学的使用,提供一种针对OrthoMCL聚类结果,实现对其快速有效的分析方法。
发明内容
为了解决以上问题,本发明提出一种基于OrthoMCL聚类结果的快速分析方法,以解决现有技术没有专门针对泛基因组分析中蛋白质的同源聚类结果进行分析和统计、对相应蛋白质进行快速分类、并输出对应代表性蛋白质序列的方法。
本发明采用以下技术方案来实现:
本发明提供了一种基于OrthoMCL聚类结果的快速分析方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽医科大学,未经安徽医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911044264.6/2.html,转载请声明来源钻瓜专利网。





