[发明专利]一种高通量测序的微生物数据处理方法有效

专利信息
申请号: 201811130694.5 申请日: 2018-09-27
公开(公告)号: CN109273053B 公开(公告)日: 2021-10-08
发明(设计)人: 宁康;奚望;高岩;成章昱;陈超云;韩毛振 申请(专利权)人: 华中科技大学鄂州工业技术研究院;华中科技大学
主分类号: G16B30/00 分类号: G16B30/00;G16B20/00
代理公司: 上海精晟知识产权代理有限公司 31253 代理人: 熊娴;冯子玲
地址: 436000 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 通量 微生物 数据处理 方法
【说明书】:

发明公开了一种高通量测序的微生物数据处理方法,其中,所述方法包括:高通量测序的微生物16sRNA读段进行重叠群组装、分箱,以q‑PCR标记微生物重叠群,使所述微生物重叠群包含标记基因,去除含有标记基因的生物重叠群,获得高质量微生物宏基因组测序数据。本发明通过序列聚类等方法鉴定的去除来源于污染物的序列,得到更为高纯度的微生物宏基因组测序数据,保证基于微生物宏转录组测序数据的基因表达结果更为准确。本发明以微生物宏基因组测序数据作为研究对象,基于生物信息学思路,提高微生物宏基因组测序数据的质量。

技术领域

本发明涉及一种高通量测序的微生物数据处理方法,属于高通量测序质量控制领域。

背景技术

下一代测序技术(NGS)又称高通量测序,以高输出量和高解析度为主要特色,能一次并行对几十万到几百万条DNA分子进行序列读取,在提供丰富的遗传学信息的同时,还可以大大降低测序费用,缩短测序时间的测序技术。由于高通量测序技术数据处理量大,处理内容繁杂,因此对于测序质量的控制、污染源的确定与排除成为了一个重要的研究课题。测序质量的影响因素是多方面的,常见的影响因素多数为操作中的误差,跨越日期和组处理数据的批次效应的主要来源已被确定为实验性的,如来自DNA提取试剂盒,PCR批次或测序仪器,而不是生物学。这一问题在“多物种”NGS数据处理中尤为突出,一旦污染和测序,将读数与目标和污染物分开并不是一项简单的任务,即使污染物可以轻松识别。在大多数情况下,目标和污染都没有完整的基因组,这使得分配读数非常具有挑战性。因此迫切需要利用目标物种的有限信息去除环境微生物污染物。

目前已经研究并提出了一些基于相似性或组成信息的分箱程序。然而,互补的上游和下游加工方法需要与重叠群装箱结合以达到更高的灵敏度和特异性。一种有前途的污染物鉴定和过滤解决方案是宏基因组方法,它促进了污染微生物基因组的分类学和功能分析。已经针对基于不同计算方法的可能污染物的分析进行了一些软件研发:SourceTracker,其应用贝叶斯推断方法来估计微生物污染的组成和丰度;DeconSeq,可以通过长读取对齐处理可能来自人类的污染,目前采用上述两种软件并基于重叠群聚类方法,可以成功地区分读数与目标物种和污染物。然而,读取分配的假阳性率仍然很高,并且没有考虑潜在有价值的信息,例如多个样本(具有相似污染物)中某些目标物种的丰度相关性。因此,迫切需要对当前流程进行高级优化。

发明内容

针对现有技术存在的上述问题,本发明的目的是获得一种高通量测序的微生物数据处理方法。

为实现上述发明目的,本发明采用的高通量测序的微生物数据处理方法的技术方案如下:

所述方法包括:高通量测序的微生物16sRNA读段进行重叠群组装、分箱,以q-PCR标记微生物重叠群,使所述微生物重叠群包含标记基因,去除含有标记基因的生物重叠群,获得高质量微生物宏基因组测序数据。

优选的,所述数据处理方法包括如下步骤:

a)通过已公开序列建立模拟数据集,通过高通量测序数据建立真实宏基因数据集;

b)对数据集内数据进行质量控制,去掉低质量的碱基和读段,提取16sRNA基因;

c)采用Parallel-Meta pipeline(version 2.0)软件生成分类学概况,通过HMM从原始测序数据中提取16s rRNA序列,以Greengene数据库搜索序列以确定物种的来源,16sRNA数据搜索物种数量;

d)采用VELVET、MEGAHIT软件进行重叠群组装,使用velvet命令从velveth获得的k-mers构建de Bruijn图并提取重叠群,使用MEGAHIT对de Bruijn图进行汇编;

e)以q-PCR方法标记基因,将含有标记基因的重叠群鉴定为目标物质,对目标物种聚类鉴定,获得去除污染的高质量微生物宏基因组测序数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学鄂州工业技术研究院;华中科技大学,未经华中科技大学鄂州工业技术研究院;华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811130694.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top