[发明专利]将靶标富集的序列读出分配到基因组位置的方法在审

申请号：	201510742430.5	申请日：	2015-11-04
公开（公告）号：	CN105574360A	公开（公告）日：	2016-05-11
发明（设计）人：	克里斯提安·勒·科寇;马格纳斯·伊萨克森;阿舒拓史;莱纳斯·佛斯马克	申请（专利权）人：	安捷伦科技有限公司
主分类号：	G06F19/18	分类号：	G06F19/18
代理公司：	北京东方亿思知识产权代理有限责任公司 11258	代理人：	李晓冬
地址：	美国加利***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	靶标富集序列读出分配基因组位置方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于将序列读出分配到基因组位置的计算机实施方法，所述方法包括：

a)访问含序列读出的文件，其中所述序列读出获得自已通过与多个捕获序列杂交而被富集的核酸样品；和

b)通过下述将所述序列读出分配到基因组位置：

i)如果序列读出包含捕获序列的一个或更多个子序列，则将捕获序列识别为序列读出的匹配；

ii)使用计算机计算指示每个匹配的捕获序列和序列读出之间的序列相似性程度的评分；和

iii)如果对匹配的捕获序列计算的评分高于阈值，则将序列读出分配到基因组位置。

2.根据权利要求1所述的方法，其中

所述识别步骤i)包括：如果序列读出的末端区域包含捕获序列的一个或更多个子序列，则将一个或更多个捕获序列识别为与所述序列读出的匹配，其中所述末端区域任选地在距序列读出的末端10bp(碱基对)至50 bp的范围内；和/或

所述识别步骤i)还包括产生数据结构，其中捕获序列被存储在所述数据结构中作为由含捕获序列的子序列的序列密匙所映射的值，以及所述识别步骤包括：如果序列读出包含一个或更多个序列密匙，则将一个或更多个捕获序列识别为与所述序列读出的匹配。

3.根据权利要求1或2所述的方法，其中

所述一个或更多个子序列的长度在5bp-15bp的范围内；和/或

所述捕获序列的一个或更多个子序列选自所述捕获序列的4-20个子序列，其中所述子序列任选地穿过整个捕获序列平铺。

4.根据权利要求1-3中任一项所述的方法，其中计算的评分基于匹配的捕获序列和序列读出之间的序列同一性的长度、匹配的捕获序列和序列读出之间的字符串编辑距离、序列读出内每个错配的位置，或它们的组合来计算。

5.根据权利要求1-4中任一项所述的方法，其中富集的样品包括片段化基因组核酸的扩增拷贝，其中所述片段化基因组核酸通过与多个捕获序列杂交而被富集，以及其中所述片段化基因组核酸任选地通过在预定位置酶促切割基因组核酸而被片段化。

6.根据权利要求1-5中任一项所述的方法，其中对多个序列读出执行所述方法，从而将多个序列读出分配到基因组位置。

7.根据权利要求1-6中任一项所述的方法，其中所述分配步骤b)还包括：

iv)将在所有匹配的捕获序列中具有最高计算评分的匹配的捕获序列识别为最佳匹配；和

v)通过将序列读出添加到匹配最佳匹配的捕获序列的独特序列读出集合来将所述序列读出分配到基因组位置，其中集合中的每个独特序列读出包含与集合中的所有其它序列读出的子序列相同的子序列，

以及其中所述分配步骤任选地包括：如果序列读出不含捕获序列的任何子序列，则丢弃所述序列读出。

8.根据权利要求7所述的方法，其中与集合中的所有其它序列读出的子序列相同的子序列是条码序列，其中所述方法任选地还包括：对分配到捕获序列的独特序列读出集合的数目进行计数。

9.一种将序列读出分配到基因组位置的方法，所述方法包括：

a)将用于富集核酸样品的捕获序列集合输入含序列读出分配程序的计算机系统中，所述富集通过与集合中的多个捕获序列杂交进行，其中所述序列读出分配程序包括以下指令：

i)访问含序列读出的文件，其中所述序列读出获得自经富集的核酸样品；和

ii)通过下述将所述序列读出分配到基因组位置：

如果所述序列读出包含捕获序列的一个或更多个子序列，则将捕获序列识别为与序列读出的匹配；

使用计算机计算指示每个匹配的捕获序列和序列读出之间的序列相似性程度的评分；和

如果对匹配的捕获序列计算的评分高于阈值，则将所述序列读出分配到基因组位置；

b)将含所述序列读出的文件输入所述序列读出分配程序；和

c)执行所述序列读出分配程序。

10.包含序列读出分配程序的计算机可读存储介质，所述序列读出分配程序包括以下指令：

a)访问含序列读出的文件，其中所述序列读出获得自已通过与多个捕获序列杂交而被富集的核酸样品；和

b)通过下述将所述序列读出分配到基因组位置：

i)如果所述序列读出包含捕获序列的一个或更多个子序列，则将捕获序列识别为与序列读出的匹配；

ii)使用计算机计算指示每个匹配的捕获序列和序列读出之间的序列相似性程度的评分；和

iii)如果对匹配的捕获序列计算的评分高于阈值，则将所述序列读出分配到基因组位置。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安捷伦科技有限公司，未经安捷伦科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510742430.5/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载