[发明专利]将靶标富集的序列读出分配到基因组位置的方法在审

专利信息
申请号: 201510742430.5 申请日: 2015-11-04
公开(公告)号: CN105574360A 公开(公告)日: 2016-05-11
发明(设计)人: 克里斯提安·勒·科寇;马格纳斯·伊萨克森;阿舒拓史;莱纳斯·佛斯马克 申请(专利权)人: 安捷伦科技有限公司
主分类号: G06F19/18 分类号: G06F19/18
代理公司: 北京东方亿思知识产权代理有限责任公司 11258 代理人: 李晓冬
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 靶标 富集 序列 读出 分配 基因组 位置 方法
【权利要求书】:

1.一种用于将序列读出分配到基因组位置的计算机实施方法,所述方 法包括:

a)访问含序列读出的文件,其中所述序列读出获得自已通过与 多个捕获序列杂交而被富集的核酸样品;和

b)通过下述将所述序列读出分配到基因组位置:

i)如果序列读出包含捕获序列的一个或更多个子序列,则将 捕获序列识别为序列读出的匹配;

ii)使用计算机计算指示每个匹配的捕获序列和序列读出之 间的序列相似性程度的评分;和

iii)如果对匹配的捕获序列计算的评分高于阈值,则将序列 读出分配到基因组位置。

2.根据权利要求1所述的方法,其中

所述识别步骤i)包括:如果序列读出的末端区域包含捕获序列的一个 或更多个子序列,则将一个或更多个捕获序列识别为与所述序列读出的匹 配,其中所述末端区域任选地在距序列读出的末端10bp(碱基对)至50 bp的范围内;和/或

所述识别步骤i)还包括产生数据结构,其中捕获序列被存储在所述数 据结构中作为由含捕获序列的子序列的序列密匙所映射的值,以及所述识 别步骤包括:如果序列读出包含一个或更多个序列密匙,则将一个或更多 个捕获序列识别为与所述序列读出的匹配。

3.根据权利要求1或2所述的方法,其中

所述一个或更多个子序列的长度在5bp-15bp的范围内;和/或

所述捕获序列的一个或更多个子序列选自所述捕获序列的4-20个子序 列,其中所述子序列任选地穿过整个捕获序列平铺。

4.根据权利要求1-3中任一项所述的方法,其中计算的评分基于匹配的 捕获序列和序列读出之间的序列同一性的长度、匹配的捕获序列和序列读 出之间的字符串编辑距离、序列读出内每个错配的位置,或它们的组合来 计算。

5.根据权利要求1-4中任一项所述的方法,其中富集的样品包括片段化 基因组核酸的扩增拷贝,其中所述片段化基因组核酸通过与多个捕获序列 杂交而被富集,以及其中所述片段化基因组核酸任选地通过在预定位置酶 促切割基因组核酸而被片段化。

6.根据权利要求1-5中任一项所述的方法,其中对多个序列读出执行所 述方法,从而将多个序列读出分配到基因组位置。

7.根据权利要求1-6中任一项所述的方法,其中所述分配步骤b)还包 括:

iv)将在所有匹配的捕获序列中具有最高计算评分的匹配的捕获 序列识别为最佳匹配;和

v)通过将序列读出添加到匹配最佳匹配的捕获序列的独特序列 读出集合来将所述序列读出分配到基因组位置,其中集合中的每个独 特序列读出包含与集合中的所有其它序列读出的子序列相同的子序列,

以及其中所述分配步骤任选地包括:如果序列读出不含捕获序列 的任何子序列,则丢弃所述序列读出。

8.根据权利要求7所述的方法,其中与集合中的所有其它序列读出的 子序列相同的子序列是条码序列,其中所述方法任选地还包括:对分配到 捕获序列的独特序列读出集合的数目进行计数。

9.一种将序列读出分配到基因组位置的方法,所述方法包括:

a)将用于富集核酸样品的捕获序列集合输入含序列读出分配程序的 计算机系统中,所述富集通过与集合中的多个捕获序列杂交进行,其中所 述序列读出分配程序包括以下指令:

i)访问含序列读出的文件,其中所述序列读出获得自经富集的核 酸样品;和

ii)通过下述将所述序列读出分配到基因组位置:

如果所述序列读出包含捕获序列的一个或更多个子序列,则 将捕获序列识别为与序列读出的匹配;

使用计算机计算指示每个匹配的捕获序列和序列读出之间的 序列相似性程度的评分;和

如果对匹配的捕获序列计算的评分高于阈值,则将所述序列 读出分配到基因组位置;

b)将含所述序列读出的文件输入所述序列读出分配程序;和

c)执行所述序列读出分配程序。

10.包含序列读出分配程序的计算机可读存储介质,所述序列读出分 配程序包括以下指令:

a)访问含序列读出的文件,其中所述序列读出获得自已通过与 多个捕获序列杂交而被富集的核酸样品;和

b)通过下述将所述序列读出分配到基因组位置:

i)如果所述序列读出包含捕获序列的一个或更多个子序列, 则将捕获序列识别为与序列读出的匹配;

ii)使用计算机计算指示每个匹配的捕获序列和序列读出之 间的序列相似性程度的评分;和

iii)如果对匹配的捕获序列计算的评分高于阈值,则将所述 序列读出分配到基因组位置。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安捷伦科技有限公司,未经安捷伦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510742430.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top