[发明专利]纳米孔测量结果的机器学习分析在审
| 申请号: | 201880026701.9 | 申请日: | 2018-05-04 |
| 公开(公告)号: | CN110546655A | 公开(公告)日: | 2019-12-06 |
| 发明(设计)人: | 蒂莫西·李·马辛厄姆;约瑟夫·爱德华·哈尔韦 | 申请(专利权)人: | 牛津楠路珀尔科技有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;C12Q1/6869;G01N33/487 |
| 代理公司: | 11240 北京康信知识产权代理有限责任公司 | 代理人: | 王红艳<国际申请>=PCT/GB2018 |
| 地址: | 英国*** | 国省代码: | 英国;GB |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 聚合物单元 后验概率 递归神经网络 纳米孔 导出 矩阵 机器学习技术 卷积神经网络 连续聚合物 特征检测器 操作对象 机器学习 矩阵表示 连续测量 特征向量 聚合物 分析 结果组 卷积 易位 决策 测量 反馈 输出 替代 | ||
本公开提供了纳米孔测量结果的机器学习分析。采用使用递归神经网络(RNN)的机器学习技术分析在通过纳米孔易位期间从聚合物获取的一系列测量结果。所述RNN可以导出后验概率矩阵,每个后验概率矩阵表示:就聚合物单元的对应于相应测量之前的测量结果的不同相应历史序列而言,聚合物单元的所述相应历史序列的多个不同变化的后验概率产生新的聚合物单元序列。可替代地,所述RNN可以输出关于所述一系列聚合物单元的连续聚合物单元的标识的决策,其中所述决策被反馈到所述递归神经网络中。所述分析可以包括使用如卷积神经网络等经过训练的特征检测器对连续测量结果组执行卷积,以导出作为RNN操作对象的一系列特征向量。
技术领域
本发明涉及在聚合物(例如但不限于多核苷酸)相对于纳米孔易位期间对从所述聚合物中的聚合物单元获取的测量结果进行分析。
背景技术
用于估计聚合物中聚合物单元的目标序列的一种类型的测量系统使用纳米孔,并且聚合物相对于纳米孔易位。该系统的一些性质取决于纳米孔中的聚合物单元,并且对所述性质进行测量。这种使用纳米孔的测量系统具有相当大的前景,特别是在对如DNA或RNA等多核苷酸进行测序的领域中,并且已经成为最近发展的主题。
发明内容
这种纳米孔测量系统可以提供对多核苷酸的长时间连续读取,读取范围从数百到数十万(并且可能更多)个核苷酸不等。以这种方式收集的数据包括测量结果,如离子电流的测量结果,其中序列相对于纳米孔的敏感部分的每次易位可能导致测量性质的变化。
根据本发明的第一方面,提供了一种在聚合物相对于纳米孔易位期间对从所述聚合物获取的一系列测量结果进行分析的方法,所述聚合物包括一系列聚合物单元,所述方法包括使用机器学习技术分析所述一系列测量结果并导出对应于相应测量结果或相应测量结果组的一系列后验概率矩阵,每个后验概率矩阵表示:就聚合物单元的对应于相应测量之前或之后的测量结果的不同相应历史序列而言,聚合物单元的所述相应历史序列的多个不同变化的后验概率产生新的聚合物单元序列。
表示后验概率的所述一系列后验概率矩阵提供了关于所述一系列聚合物单元的改进信息,测量结果从所述一系列聚合物单元中获取并且可以用于多种应用中。所述一系列后验概率矩阵可以用于导出关于至少一个参考系列聚合物单元的得分,所述得分表示所述聚合物的所述一系列聚合物单元是所述参考系列聚合物单元的概率。因此,所述一系列后验概率矩阵能够实现例如以下多种应用。
许多应用涉及从所述一系列后验概率矩阵导出所述一系列聚合物单元的估计值。这可以是所述一系列聚合物单元整体上的估计值。这可以通过从所有可能的系列中找到得分最高的此类系列来完成。例如,这可以通过估计通过所述一系列后验概率矩阵的最可能路径来执行。
可替代地,可以通过选择最可能对应于所述一系列后验概率矩阵的一组多个参考系列聚合物单元中的一个来找到所述一系列聚合物单元的估计值,例如基于得分。
通过估计所述聚合物的所述一系列聚合物单元与参考系列聚合物单元之间的差异,可以找到所述一系列聚合物单元的另一种类型的估计值。这可以通过对所述参考系列的变化进行评分来完成。
可替代地,所述估计可以是对所述一系列聚合物单元的部分的估计。例如,可以估计所述一系列聚合物单元的部分是否为参考系列聚合物单元。这可以通过针对所述一系列后验概率矩阵的部分对所述参考序列进行评分来完成。
这种方法提供了优于比较方法的优势,所述比较方法导出表示多个不同聚合物单元序列的后验概率的一系列后验概率向量。具体地税,所述一系列后验概率矩阵为这种后验概率向量提供另外的信息,从而允许以更准确的方式对所述一系列聚合物单元进行估计。举例来说,这一技术允许更好地估计重复序列的区域,包含重复一个或多个聚合物单元的短序列的区域。对均聚物进行更好的估计是重复区域中的优势的特定实例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于牛津楠路珀尔科技有限公司,未经牛津楠路珀尔科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880026701.9/2.html,转载请声明来源钻瓜专利网。





