[发明专利]一种利用宏基因组数据分析微生物群体功能的方法有效
申请号: | 201810644958.2 | 申请日: | 2018-06-21 |
公开(公告)号: | CN108804875B | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 米双利;邢志凯;郭翀晔;李蒙 | 申请(专利权)人: | 中国科学院北京基因组研究所 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/30;G16B50/00;C12Q1/689;C12Q1/10;C12Q1/06;C12Q1/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王文君;陈征 |
地址: | 100101 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 宏基 数据 分析 微生物 群体 功能 方法 | ||
本发明提供一种利用宏基因组数据分析微生物群体功能的方法,采集已知所有微生物物种、基因和功能信息,将这些信息整合为参考数据库;对待测微生物群体的宏基因组进行测序,控制测序数据质量,计算物种丰度和基因丰度,分析不同样本间微生物的组成差异和基因水平差异;对基因功能注释,将相同功能的基因聚类,得到功能模块,将各个功能模块中所有非冗余基因的相关丰度进行加合计算,得到所有功能模块的丰度值,对待测样本微生物的功能进行差异比较分析或整体评价。本发明方法省去了拼接、组装、预测和测序数据与单一功能数据库分别比对的分析步骤,节省时间,提高测序数据利用率,可用于高通量微生物全基因组测序数据的分析和筛选功能微生物。
技术领域
本发明涉及生物信息学领域,具体地说,涉及一种能够节省分析步骤和时间、提高测序数据利用率的利用宏基因组数据分析微生物群体功能的方法。
背景技术
随着高通量测序技术的不断发展,人们已经能从基因组层面去探讨复杂的生物学功能,这让我们对生物本身以及与疾病相关的研究有了更深层次的理解。越来越多的研究发现,微生物菌群与宿主健康之间存在一种互惠互利的平衡关系。其中,微生物菌群可以帮助宿主发酵未消化的食物,参与能量代谢和营养物质吸收,为宿主提供各种微量元素、必需氨基酸、一些抗菌多肽,分解体内的一些毒素或者有害物质。然而,当菌群失调和紊乱时,会引发各类疾病,包括代谢、免疫和细菌性疾病,如红斑狼疮、2型糖尿病和肥胖等。这类的研究也被运用于养殖业,以及食品行业中,来辅助指导生产。
由于微生物菌群物种繁多、数量庞大,且所有的菌群不能全部被分离并培养,因此传统的细菌培养方法研究菌群总体结构变化面临着很大的挑战。随着测序技术的发展,特别是二代测序技术的应用,研究者能够以样品中全部细菌的16SrDNA为对象或以全部细菌的全基因组为对象进行测序,不仅克服了微生物分离培养的限制,还可以系统性的研究微生物的菌群结构、基因功能、微生物之间的相互协作关系以及微生物与环境之间的关系。其中16SrDNA测序技术主要是研究菌群的物种组成、物种间的进化关系以及群落多样性。但是,这一技术的检测精度不高,所得测序序列只能部分注释到种水平,而多数只能注释到属水平;也不能对肠道菌群的代谢调控、活跃菌种等菌群进行功能性分析。
全基因组鸟枪法测序技术是以样品中全部微生物的总DNA(也称为宏基因组:Metagenome)作为研究对象,进行高通量测序,主要研究微生物的多样性、种群的结构、进化关系、功能活性、相互间的协作关系以及与环境之间的关系。宏基因组测序技术能鉴定微生物到种水平,使功能性菌株更加具体明确,为微生物资源利用提供了条件;同时还可以让我们更深入的进行基因和功能层面的研究。
当前全基因组鸟枪法测序主要分为以下几个步骤,首先提取样品中全部微生物的基因组DNA;其次将检测质量合格的DNA打断为300bp长度的片断,按标准流程构建DNA测序文库;然后将检测质量合格的测序文库进行上机测序;最后,对测序数据进行分析。测序所得数据的分析流程主要包括对测序数据进行质量控制、读长(reads)拼接、开放阅读框(ORF)预测、微生物物种分类和基因功能注释。具体步骤如下:1)通过质量控制软件对测序质量值较低的reads进行清除,同时排除所有宿主物种DNA的reads,继而得到目标研究中所需要的高质量reads。2)将所有高质量reads(长度为101bp)通过片段重叠组装成一个更大的片段,称为contig。3)运用ORF软件预测和筛选具有编码蛋白质潜能的contig片段。4)将所得预测到ORF的contig片段与已有的微生物物种和基因功能数据库(例如NCBI,IMG,KEGG和COG等数据库)进行比对,得出与所有序列相关的物种和功能注释信息,包括物种种属信息、基因基本信息、基因功能以及基因参与的生物作用通路等。最后,将每个样本所得信息汇总并进行统计学比较分析,得到特定环境下,所有微生物之间的相互协作关系以及微生物与环境之间的相互影响关系。
虽然,宏基因组学的研究可以帮助我们对环境、生物体以及微生物菌群之间的相互作用关系进行深入研究,但是目前为止,对于微生物全基因组测序数据的常规分析流程依然存在较大的缺陷,主要体现在三个方面:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院北京基因组研究所,未经中国科学院北京基因组研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810644958.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置