[发明专利]一种利用宏基因组数据分析微生物群体功能的方法有效
申请号: | 201810644958.2 | 申请日: | 2018-06-21 |
公开(公告)号: | CN108804875B | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 米双利;邢志凯;郭翀晔;李蒙 | 申请(专利权)人: | 中国科学院北京基因组研究所 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/30;G16B50/00;C12Q1/689;C12Q1/10;C12Q1/06;C12Q1/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王文君;陈征 |
地址: | 100101 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 宏基 数据 分析 微生物 群体 功能 方法 | ||
1.一种利用宏基因组数据分析微生物群体功能的方法,其特征在于,包括以下步骤:
(1)构建微生物宏基因组参考数据库;所述参考数据库包括微生物物种数据集和微生物基因和功能数据集;
所述微生物物种数据集整合广泛宿主和环境来源的微生物物种信息,并通过以下方法制备得到:
1)下载生物信息数据库中不同来源不同种类的所有微生物的全部基因组序列数据;所述的生物信息数据库为NCBI、IMG、KEGG、COG、EMBL、DDBJ、CAZY、UniProt、PDB或ASDB;
2)下载生物信息库中不同来源不同种类的所有微生物的注释文件,从注释文件中提取相关物种的门、纲、目、科、属、种分类信息;所述的生物信息数据库为NCBI、IMG、KEGG、COG、EMBL、DDBJ、CAZY、UniProt、PDB或ASDB;
3)将步骤1)和2)中来源于不同生物信息库的微生物根据基因组序列相似度和物种分类信息,进行冗余微生物的筛选和去除,生成一个包括所有微生物序列和物种分类信息的微生物物种数据集,并对这一数据集中所有微生物的序列及分类信息进行统一编号;
所述微生物基因和功能数据集整合广泛宿主和环境来源的微生物基因信息和功能的注释信息,并通过以下方法制备得到:
4)下载前述生物信息数据库中,且在所述的微生物物种数据集中有统一编号的微生物的具有编码能力CDS区的基因序列文件;
5)下载生物信息数据库中所有微生物的注释文件并提取其中所有基因名称、基因ID号、基因功能注释信息、编码蛋白名称,根据基因名称和编码蛋白名称,从所有整合了基因功能的生物信息数据中提取所有基因对应的信号通路和作用功能分类的信息;
6)结合上述步骤4)-5)的信息,生成一个包括有统一编号的所有微生物CDS序列、基因信息、蛋白功能、作用信号通路及其功能分类信息的微生物基因和功能数据集;
(2)对待测微生物群体的宏基因组进行测序,对测序数据进行质量控制,获得高质量的全基因组测序数据;
(3)将步骤(2)获得的高质量的全基因组测序数据与步骤(1)的微生物宏基因组参考数据库中的微生物物种数据集进行比对,计算物种丰度,得到测序数据中所有物种的丰度值,分析不同样本间微生物的组成差异或相同样本中微生物的多样性;
(4)将步骤(2)获得的高质量的全基因组测序数据与步骤(1)的微生物宏基因组参考数据库中的微生物基因和功能数据集进行比对,计算基因丰度,得到测序数据中所有基因的丰度值,分析不同样本间基因水平的差异或整体评价待测微生物群体中基因功能水平或评价待测微生物群体中个别微生物基因功能水平;
(5)对所得基因进行基因功能注释,将有相同功能的基因进行聚类,得到多个包含不同基因的功能模块;每个功能模块中,去除具有相同基因丰度和功能的冗余基因;
将各个功能模块中所有非冗余基因的相关丰度进行加和计算,得到所有功能模块的丰度值,对待测样本微生物的功能进行差异比较分析或整体评价。
2.如权利要求1所述的方法,其特征在于,步骤(2)中对测序数据进行质量控制,同时将来源于宿主DNA的reads去除,以便减少样本提取和测序过程中可能产生的误差,从而得到高质量的全基因组测序数据。
3.如权利要求1或2所述的方法,其特征在于,步骤(2)所述待测微生物群体为任意宿主来源任意环境下的微生物群体。
4.权利要求1或2所述的方法的用途,所述用途为以下任一:
1)不同宿主来源和/或环境、特定来源和/或环境下的微生物群体功能分析;
2)不同宿主来源和/或环境、特定来源和/或环境下的特定微生物的功能分析;
3)不同宿主来源和/或环境、特定来源和/或环境下的微生物物种分类分析;
4)获得不同宿主来源和/或环境、特定来源和/或环境下的微生物基因;
5)获得具有特定功能的微生物;
6)评价宿主特定环境下微生物群体状态;
7)评价宿主病理表型特征;
8)提高微生物宏基因组测序数据的利用率;
9)小样本量的微生物群体功能分析;
10)特定环境下所有微生物的相互协作关系,以及微生物与环境之间或微生物与宿主之间的相互影响关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院北京基因组研究所,未经中国科学院北京基因组研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810644958.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置