[发明专利]使用机器学习技术分析纳米孔信号在审
申请号: | 201980076121.5 | 申请日: | 2019-11-26 |
公开(公告)号: | CN113166804A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 蒂莫西·L·马辛厄姆 | 申请(专利权)人: | 牛津纳米孔科技公司 |
主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869;G01N33/487 |
代理公司: | 上海君立衡知识产权代理事务所(特殊普通合伙) 31389 | 代理人: | 黄庆 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 机器 学习 技术 分析 纳米 信号 | ||
使用机器学习技术分析在包括一系列聚合物单元的聚合物相对于纳米孔易位期间从所述聚合物导出的信号。输出一系列权重分布,每个权重分布包括关于一组标签上的标签之间的转换的权重,所述一组标签表示所述聚合物中的可能类型的聚合物单元。来自所述权重分布的所述一系列聚合物单元的估计值。关于所述转换的权重的使用提高了所述技术的准确度。
技术领域
本发明涉及对在聚合物(例如但不限于多核苷酸)相对于纳米孔易位期间从聚合物导出的信号的分析。
背景技术
用于使用纳米孔估计聚合物中的聚合物单元的靶序列的测量系统是已知的,其中聚合物相对于纳米孔易位。系统的一些性质取决于纳米孔中的聚合物单元,并且进行所述性质的测量。性质取决于相对于纳米孔易位的聚合物单元的身份,并且因此,随时间变化的信号允许估计聚合物单元的序列。与孔的尺寸相比,每个聚合物单元可以非常小,从而允许多个聚合物单元在给定时间段内影响信号。由于聚合物链与纳米孔的相互作用、如缠绕或堆叠等链内性质或聚合物单元与用于控制其易位的任何系统之间的相互作用,也可以存在更长远的影响。信号形成必须被解码以估计潜在的聚合物单元的读段。
这种纳米孔测量系统可以提供表示范围为数百到数十万(并且可能更多)个核苷酸的多核苷酸的连续长读段的信号。使用纳米孔的这种类型的测量系统具有相当大的前景,特别是在对如DNA或RNA等多核苷酸进行测序的领域中,并且已经成为最近发展的主题。
然而,对聚合物单元的估计的准确度受到极其敏感的测量系统的限制。实际上,具有高准确度的估计需要机器学习技术,并且本发明涉及改善这种分析以增加估计准确度。
早期分析技术使用了隐马尔可夫模型(Hidden Markov Model,HMM),所述模型显式地对包括连续聚合物单元组的可能的k聚体进行建模。最近已经开发了使用递归神经网络(RNN)的技术。RNN的使用可以通过将远程信息考虑在内来提高准确度。随着读取速度的提高,RNN尤其有用,结果是像HMM等显式信号建模方法所基于的假设不那么有效。举例来说,Teng等人,“手性子:使用深度学习将纳米孔原始信号直接翻译为核苷酸序列(Chiron:Translating nanopore raw signal directly into nucleotide sequence using deeplearning)”,《大数据科学(Gigascience)》,2018年5月1日;7(5)[参考1]公开了使用向其输入原始信号的RNN对聚合物核苷酸进行测序的方法。RNN输出一系列后验概率分布,所述一系列后验概率分布包括关于表示四种可能类型的碱基以及空白的标签的后验概率。通过根据后验概率估计最可能的聚合物单元由链结式时间分类解码器对这些后验概率分布进行解码,以导出一系列聚合物单元的估计值。
发明内容
根据本发明的第一方面,提供了一种分析在聚合物相对于纳米孔易位期间从所述聚合物导出的信号的方法,所述聚合物包括属于一组可能类型的聚合物单元的一系列聚合物单元,所述方法包括:使用输出一系列权重分布的机器学习技术来分析所述信号,每个权重分布包括关于一组标签上的标签之间的转换的权重,所述一组标签包含表示所述可能类型的聚合物单元的标签;以及从所述权重分布导出所述一系列聚合物单元的估计值。
所述一组标签可以包含表示空白和/或停留的标签。换句话说,可以说所述组表示可能类型的聚合物单元。
转换可以在一个标签与另一个标签之间。转换可以在连续的标签之间。
因此,所述方法提供的权重是指表示可能类型的聚合物单元,而不是表示包括k个聚合物单元的k聚体的标签。然而,所述方法导出关于标签之间的转换的权重,而不是关于标签本身的权重。此类方法提供了优于比较方法的优点,所述比较方法导出关于一组标签上的标签的一系列权重,所述一组标签包含表示可能类型的聚合物单元的标签。通过提供关于所述一组标签上的标签之间的转换的权重,提供了另外的信息,所述另外的信息允许以更准确的方式估计一系列聚合物单元。这是因为权重提供有关标签可能路径的信息,而关于标签的权重却不提供。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于牛津纳米孔科技公司,未经牛津纳米孔科技公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980076121.5/2.html,转载请声明来源钻瓜专利网。