[发明专利]对DNA序列的数据分析在审
| 申请号: | 201180068731.4 | 申请日: | 2011-12-20 |
| 公开(公告)号: | CN103403725A | 公开(公告)日: | 2013-11-20 |
| 发明(设计)人: | S.斯里拉姆;N.埃兰戈;L.萨斯特里-登特;J.佩托里诺 | 申请(专利权)人: | 陶氏益农公司 |
| 主分类号: | G06F19/22 | 分类号: | G06F19/22 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张文辉 |
| 地址: | 美国印*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | dna 序列 数据 分析 | ||
对相关申请的交叉引用
本申请要求2010年12月29日提交的美国临时专利申请61/428,191,和2011年7月1日提交的美国临时专利申请61/503,784的优先权,其全部公开内容通过提及并入。
发明背景
锌指核酸酶(ZFN)是可以工程化改造为在基因组中的特定序列处切割DNA链以生成双链断裂的酶。修复双链断裂的一种过程(process)是非同源末端连接(NHEJ)。NHEJ介导的修复在ZFN切割位点处产生随机碱基对的添加和/或缺失,创建ZFN诱导的基因组修饰。该修饰可以创建DNA的不同编码链,其可以用于生物学分析。对ZFN诱导的基因组修饰的分析可以指示特定ZFN在基因组中在特定切割位置/位点处的相对效力。
多种工具可以用于切割或修饰DNA的序列。例如,EXZACT Precision Technology品牌设备(可获自Dow Agrosciences,位于Indianapolis的9330Zionsville Road,Indiana46268)是一种用于基因组修饰的刃口的(cutting-edge)、通用的且稳健的工具箱。它基于ZFN的设计和使用。
新测序技术的快速开发实质性延伸许多生物学应用(包括全基因组变异的扫描、新基因组装配和转录物组学研究)的规模和分辨率。生产中的所有下一代测序(NGS)平台,包括可获自Roche Diagnostics Corp.,ILLUMINA的Roche454品牌测序平台和/或可获自Illumina,Inc.的SOLEXA品牌测序平台,以及可获自Applied Biosystems的SOLiD品牌测序平台每机器天能够产生千兆碱基对(Gbp)级的数据。Roche454品牌测序平台产生长的“阅读”序列,而Illumina(Solexa)和SOLiD品牌测序仪是短阅读测序平台(通常约36-100bp)。下一代测序(NGS)技术容许产生大量测序数据,提供高水平的检测灵敏性,并且容许分析许多样品。
发明概述
在本公开内容的一个例示性的实施方案中,呈现了量化锌指核酸酶的靶向活性的分析系统和计算方法。提供了可以用于在特定基因组系统中在其特定靶物处筛选并分级大量ZFN的系统和方法。可以使用该系统和方法来确认使用任何技术(例示性的技术包括蛋白质或小分子定向或两者的组合或物理方法)实施的任何基因组修饰(例示性基因组修饰包括核苷酸插入/缺失、基因添加、点突变、和甲基化)。另外,所述系统和方法可以进一步修改为允许翻译脚本(translational script),其容许基因组修饰的功能性读出(即,经修饰的基因组的蛋白质产物)。
在本公开内容的一个例示性实施方案中,提供了一种用于分析的方法。该方法包括:电子接收与多个序列相关的序列数据;从所述多个序列中鉴定多个高质量阅读序列(high quality read sequence);从所述多个高质量阅读序列提取多个独特阅读序列(unique read sequence);并针对与参照样品对应的参照序列比较所述多个独特阅读序列。
在本公开内容的另一个例示性实施方案中,提供了一种用于分析的方法。该方法包括:电子接收与多个序列相关的序列数据;从所述多个序列中鉴定多个高质量阅读序列;从所述多个高质量阅读序列提取多个独特阅读序列;并针对与参照样品对应的参照序列比较所述多个独特阅读序列。该方法进一步包括在针对与所述参照样品对应的参照序列数据比对所述多个独特阅读序列后,计算高质量比对。
在本公开内容的又一个例示性实施方案中,提供了一种用于分析的方法。该方法包括:电子接收与多个序列相关的序列数据;从所述多个序列中鉴定多个高质量阅读序列;从所述多个高质量阅读序列提取多个独特阅读序列;并针对与参照样品对应的参照序列比较所述多个独特阅读序列。该方法进一步包括对比对的独特阅读序列进行定性分析。
在本公开内容的又一个例示性实施方案中,提供了一种用于分析的方法。该方法包括:电子接收与多个序列相关的序列数据;从所述多个序列中鉴定多个高质量阅读序列;从所述多个高质量阅读序列提取多个独特阅读序列;并针对与参照样品对应的参照序列比较所述多个独特阅读序列。该方法进一步包括对比对的独特阅读序列的定量分析。
在本公开内容的又一个例示性实施方案中,提供了一种用于分析的方法。该方法包括:电子接收与多个序列相关的序列数据;从所述多个序列中鉴定多个高质量阅读序列;从所述多个高质量阅读序列提取多个独特阅读序列;并针对与参照样品对应的参照序列比较所述多个独特阅读序列。该方法进一步包括显现比对的独特阅读序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陶氏益农公司,未经陶氏益农公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180068731.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





