[发明专利]一种针对生信噪音的基于隐藏亚组的生信降噪分析方法及系统在审

专利信息
申请号: 202111000227.2 申请日: 2021-08-27
公开(公告)号: CN115732031A 公开(公告)日: 2023-03-03
发明(设计)人: 夏涵;胡龙;官远林;梁晓雪;魏康飞;段美林 申请(专利权)人: 予果生物科技(北京)有限公司;西咸新区予果微码生物科技有限公司;予果智造科技(北京)有限公司
主分类号: G16B20/30 分类号: G16B20/30
代理公司: 北京知汇林知识产权代理事务所(普通合伙) 11794 代理人: 董涛
地址: 100176 北京市大兴区北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 针对 噪音 基于 隐藏 生信降噪 分析 方法 系统
【说明书】:

本申请涉及一种测序数据背景噪音剔除的生信分析方法和系统。本方法基于“待测样本与生信对照之间形成的隐藏亚组”,对样本中组分之间的连接进行分析,从而实现在最大程度保留真实信号前提下,更加有效剔除引入的噪音信号。本申请不依赖于任何对待测真实信号和噪音信号的先验知识,即可高效去除噪音。

技术领域

本申请涉及生信分析领域,具体涉及一种测序数据的背景噪音剔除方法及系统。

技术背景

微生物群落的组成与环境生态系统、人类健康、临床疾病关系密切。宏基因组方法(metagenomic next generation sequencing,mNGS)是一种可以对样本中所有核酸分子进行检测的方法,可以对样本中微生物群落组成进行量化描述。由于其极高的灵敏度和极低的检测限(LOD)的特点,宏基因组方法在检出极微量的真实核酸分子信号的同时,也会检出实验过程中引入的污染(如环境微生物)的核酸分子。更麻烦的是,由于微生物物种之间的高度相似性,单一微生物的数据也会在后续的生物信息学分析过程中被注释为多种微生物,形成误检。如果没有有效的的分析处理,这些噪音信号,即,实验引入的污染和生信引入的误检,就会导致不准确的数据解释。

宏基因组测序方法包括将样本中的所有核酸分子进行提取、构建文库、文库测序和数据分析等几个步骤,以上的几个步骤均可能引入噪音信号。虽然已有文献报道可以通过严格的实验操作尽量控制和防止污染,但这些方案未取得显著成效,因此主流方法是采用生物信息学分析工具在后期数据处理过程中消除背景噪音。其中,一种广泛使用的方法是剔除所有低于指定相对丰度阈值的组分,但这种方法依赖于阈值的选择,常常会剔除低丰度的真实信号并保留高丰度的噪音信号。第二种方法利用阴性对照进行噪音剔除。在实践中,对待测样本进行宏基因组测序的同时,会配套同时设置一个阴性对照,即无核酸水,同步执行与待测样本完全一致的操作,来模拟无真实信号时的背景。因此,现有方法往往利用阴性对照的组成对待测样本的组成进行矫正,或直接移除所有同时被阴性对照报出的鉴定结果,或经过归一化(如Z-score方法)后,移除在阴性对照中更多在待测样本中更少的组分,但由于测序具有的随机性,这种方法常常会错误地剔除真实信号并保留噪音信号。第三类分析方法需要大量关于污染的先验信息来维护一个“黑名单”,并在待测样本的检出中直接剔除这些“黑名单”中的组分。但这些先验信息往往并不清楚,而且由于不同实验室之间的噪音信号差异很大,历史记录不能充分反映本次实验的具体状态,因此从“黑名单”中删除组分可能会导致假阴性和假阳性。第四类分析方法假设噪音信号与文库制备后的DNA浓度呈负相关,但由于测序的随机性,这种方法可能不适用于低含量污染物。综上所述,现有分析方法,均针对样本组成的单一组分进行分析,并通过不同假设和信息进行判断,将判断为噪音信号的单一组分进行剔除。但由于宏基因组测序极高的灵敏度、极低的检测限和较强的随机性的特点,针对单一组分进行判断并剔除的方法无法有效消除背景噪音信号。

有鉴于此,提出本申请。

发明内容

本申请要解决的核心问题是如何利用当前实验所能提供的信息,针对性地对当前实验结果进行高效的噪音去除工作。

本领域知晓,生信分析过程中,通常所能够观察到的待测样本的组成是真实信号与噪音信号的叠加。为了去除噪音信号,本申请需要将待测样本的组成与只包含噪音信号的背景组成进行比较,找到其中维持恒定不变的因素,根据这些恒定的因素构建模型,从而进行有效的噪音去除。

首先,一个经验性观察是,任何一种基因测序结果(比如宏基因组)里的噪音信号的组成并不单一,而是包含了极其多样的物种组合,这表明噪音的引入是以某种亚组(sub-group)为单位,而不是从某个单一污染源引入一个单一的噪音信号。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于予果生物科技(北京)有限公司;西咸新区予果微码生物科技有限公司;予果智造科技(北京)有限公司,未经予果生物科技(北京)有限公司;西咸新区予果微码生物科技有限公司;予果智造科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111000227.2/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top