[发明专利]细菌全基因组测序数据的自动化分析方法及系统在审
申请号: | 202110271336.1 | 申请日: | 2021-03-12 |
公开(公告)号: | CN112863603A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 刘健;孙嘉良;陈娇 | 申请(专利权)人: | 南开大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 闫圣娟 |
地址: | 300071 天津*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 细菌 基因组 序数 自动化 分析 方法 系统 | ||
本公开提供了一种细菌全基因组测序数据的自动化分析方法,包括:获取细菌基因组测序数据,判断测序数据类型;根据测序数据的类型分别进行相应预处理;根据用户选择的分析类型及预设的工具软件和软件参数,对预处理后的测序数据进行重测序分析和从头测序分析;实现细菌全基因组的鉴定和注释。所述方案提供了一种用户友好的自动化分析方法,对于没有专业生物信息学知识的研究人员和临床医生,自动化了生物信息学分析步骤,包括测序质量控制、重测序和从头组装、相似细菌参考基因组鉴定、细菌基因组注释,同时,能够针对不同平台产生的短读长和长读长测序数据进行定制的生物信息学分析,获得准确的分析结果。
技术领域
本公开属于基因测序技术领域,尤其涉及一种细菌全基因组测序数据的自动化分析方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
细菌基因组信息的广泛应用要求基因组测序分析的自动化流程。细菌基因组分析工作流的研究已经取得了一定的成果。
发明人发现,现有的对于细菌全基因组的工作流通常专注于二代的细菌测序数据分析,无法满足目前快速发展的特点是长读长的三代甚至某些被称为第四代的测序技术所生成的测序数据的分析需求。并且它们涉及的方面通常不够全面,仅专注于从头测序或者重测序的单个方面。
而现有的宏基因组工作流通常侧重于宏基因组装箱、丰度计算等,并在宏基因组水平上提供良好的分析(宏基因组学通常侧重于环境中整个微生物群落的物种多样性和功能潜力),但忽视了菌株分离筛选后对单个细菌基因组的深入分析,如单个细菌基因组的鉴定(精确到菌株水平)及相应的注释,这在工业微生物菌种选育和改良中有着重要的应用。
此外,现有的工作流通常为序列预处理和组装提供较少的分析工具选择,其用户友好性较差。
发明内容
本公开为了解决上述问题,提供了一种细菌全基因组测序数据的自动化分析方法及系统,所述方案提供了一种用户友好的自动化分析方法,对于没有专业生物信息学知识的研究人员和临床医生,自动化了生物信息学分析步骤,包括测序质量控制、重测序和从头组装、相似细菌参考基因组鉴定、细菌基因组注释,同时,能够针对不同平台产生的短读长和长读长测序数据进行定制的生物信息学分析,获得准确的分析结果。
根据本公开实施例的第一个方面,提供了一种细菌全基因组测序数据的自动化分析方法,包括:
获取细菌基因组测序数据,判断测序数据类型;
根据测序数据的类型分别进行相应预处理;
根据用户选择的分析类型及预设的工具软件和软件参数,对预处理后的测序数据进行重测序分析和从头测序分析;
实现细菌全基因组的鉴定和注释。
进一步的,所述用户选择的分析类型及预设的工具软件和软件参数,通过配置文件进行保存,用户通过修改配置文件实现相关自定义设置。
进一步的,所述重测序分析具体为:
对预处理的测序数据进行组装,利用预选的工具软件将产生的contigs与本地细菌数据库中的参考基因组序列进行比对,确定相似度最高的全基因组序列;将contigs与所述相似度最高的全基因组序列进行比对,实现细菌全基因组的鉴定和注释;
或,使用预选的工具软件将预处理的测序数据与参考基因组对齐,利用预选的工具软件将产生的contigs与本地细菌数据库中的参考基因组序列进行比对,确定相似度最高的全基因组序列;将contigs与所述相似度最高的全基因组序列进行比对,实现细菌全基因组的鉴定和注释;
进一步的,所述从头测序分析具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110271336.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种病毒测序序列的自动化分析方法及系统
- 下一篇:一种电饭煲用的流量传感器