[发明专利]微生物二代测序数据的宏基因组分析方法及系统在审
申请号: | 201811339970.9 | 申请日: | 2018-11-12 |
公开(公告)号: | CN109741790A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 徐强;尚河颖;张晓瑜;李莲莲;阴海鹏;刘红艳;刁玉涛;张之勇;俞勇 | 申请(专利权)人: | 山东省医学科学院基础医学研究所 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
地址: | 250062 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 测序数据 宏基因组分析 表数据 微生物 微生物基因组 标准化处理 宏基因组 微生物品种 丰度差异 输出图形 序列聚类 统计分析 映射 聚类 预设 基因 | ||
本公开提供了一种微生物二代测序数据的宏基因组分析方法及系统。其中,一种微生物二代测序数据的宏基因组分析方法,包括:聚类微生物基因组二代测序数据,相似性高于预设阈值的微生物基因组序列聚类为一个OTU,每个OTU对应一个微生物品种,生成OTUs表数据;标准化处理OTUs表数据;将标准化处理后的OTUs表数据映射到宏基因组功能;统计分析不同宏基因组功能的基因丰度差异,并输出图形化分析结果。
技术领域
本公开涉及数据处理领域,尤其涉及一种微生物二代测序数据的宏基因组分析方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
微生物宏基因组学研究的是微生物群落中全部微生物的功能基因与其生存环境之间,以及与宿主之间的相互依存关系,也就是如何解释这些微生物“它们在干什么,从而能导致什么?”,或者反之,由于生存环境的特征而导致“它们在干什么?”的问题。
对菌群进行宏基因组测序是目前解决上述问题的最佳方案。但发明人发现这种研究方法投入成本相对较多,分析方法也相对复杂。
发明内容
根据本公开的一个或多个实施例的一个方面,提供一种微生物二代测序数据的宏基因组分析方法,其能够快速准确地分析不同宏基因组功能的基因丰度差异,且能够图形化展示分析结果。
本公开的一个或多个实施例,提供的一种微生物二代测序数据的宏基因组分析方法,包括:
聚类微生物基因组二代测序数据,相似性高于预设阈值的微生物基因组序列聚类为一个OUT(operational taxonomic unit,操作分类单元),每个OTU对应一个微生物品种,生成OTUs表数据;
标准化处理OTUs表数据;
将标准化处理后的OTUs表数据映射到宏基因组功能;
统计分析不同宏基因组功能的基因丰度差异,并输出图形化分析结果。
在一个或多个实施例中,聚类微生物基因组二代测序数据之前,还包括:
从原始微生物基因组二代测序数据中提取barcode序列;
利用双向测序来识别所有barcode序列并组装成若干条完整的序列;
对完整的序列赋予唯一编号和样品归属信息。
在一个或多个实施例中,标准化处理OTUs表数据之前,还包括:
过滤掉丰度小于预设阈值的OUT。
在一个或多个实施例中,在将标准化处理后的OTUs表数据映射到宏基因组功能的过程中,将每个标准化处理后的OTU丰度乘以各预测功能性状的丰度,从而产生宏基因功能表;其中,行代表基因功能,列代表微生物品种。
本公开还提供了一种微生物二代测序数据的宏基因组分析系统,其能够快速准确地分析不同宏基因组功能的基因丰度差异,且能够图形化展示分析结果。
本公开的一种微生物二代测序数据的宏基因组分析系统,包括微生物二代测序数据采集装置、处理器和显示装置,所述处理器,包括:
聚类模块,其被配置为聚类微生物基因组二代测序数据,相似性高于预设阈值的微生物基因组序列聚类为一个OTU,每个OTU对应一个微生物品种,生成OTUs表数据;
标准化模块,其被配置为标准化处理OTUs表数据;
映射模块,其被配置为将标准化处理后的OTUs表数据映射到宏基因组功能;
分析模块,其被配置为统计分析不同宏基因组功能的基因丰度差异,并输出图形化分析结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省医学科学院基础医学研究所,未经山东省医学科学院基础医学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811339970.9/2.html,转载请声明来源钻瓜专利网。