[发明专利]一种宏基因组测序数据自动化分析方法在审
申请号: | 202011254551.2 | 申请日: | 2020-11-11 |
公开(公告)号: | CN112289375A | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 罗奇斌;申玉林;廖胜光;任毅 | 申请(专利权)人: | 天津奇云诺德生物医学有限公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300457 天津市*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 宏基 序数 自动化 分析 方法 | ||
1.一种宏基因组测序数据自动化分析方法,其特征在于,包括如下步骤:
原始下机数据过滤和质量控制步骤:使用Python脚本进行原始数据的过滤,调用Trimmomatic软件去除接头序列和低质量序列,同时将质控结果输出到单独的文件夹中,方便查看;
宿主基因组比对步骤:使用Python脚本调用Bowtie2软件将质控后的序列数据与宿主基因组的比对,与宿主基因组比对的同时计算并记录宿主DNA的含量,后续将其从质控后的序列中去除,以免在后续分析中对肠道菌群基因组的比对造成影响;
肠道菌群物种注释和比对步骤:使用Python脚本调用MetaPhlAn2软件对去除宿主DNA的序列进行和参考序列的比对注释并统计,MetaPhlAn2软件比对注释的优势在于该软件整理了超过17000个参考基因组,包括13500个细菌和古菌,3500个病毒和110种真核生物,可以精确的对宏基因组数据进行种水平上的分类和物种相对丰度的估算;
肠道菌群代谢潜能分析步骤:使用Python脚本调用Humann2软件对宏基因组数据进行菌群的代谢潜能分析,计算分析功能基因和代谢通路的组成,从更多方面了解肠道菌群多样性;
结果统计和输出步骤:使用Python脚本统计上述步骤中的结果文件,包括质控结果、人类DNA含量、菌群相对丰度、功能基因相对丰度、代谢通路相对丰度等,并将详细信息整理至输出文件夹,同时将各步骤的中间数据和流程的最终结果整理至输出文件夹中。
2.根据权利要求1所述的一种宏基因组测序数据自动化分析方法,其特征在于:所述步骤使用同一个Python脚本进行串联,使用统一的输入参数,运行脚本后可直接进行比对、分析、统计、整理等步骤,避免了宏基因组手动分析时繁琐的操作。
3.根据权利要求1所述的一种宏基因组测序数据自动化分析方法,其特征在于:所述Python脚本的输入数据和参数包括输入原始数据、高通量测序类型、流程运行使用线程数等,流程输出文件包括各步骤的中间数据、最终结果文件、统计文件、运行日志等,位于流程运行目录下的原始数据名称文件夹中。
4.根据权利要求1所述的一种宏基因组测序数据自动化分析方法,其特征在于:所述步骤每一步进行时和完成后,脚本将自动记录运行日志,包括使用的命令行和参数,流程运行出现错误后也会记录错误信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津奇云诺德生物医学有限公司,未经天津奇云诺德生物医学有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011254551.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种前拆式洁具感应出水模块
- 下一篇:一种检测门快速安装机构及方法