[发明专利]一种通用寡核苷酸序列库的构建及应用无效

专利信息
申请号: 201010120887.X 申请日: 2010-03-10
公开(公告)号: CN102191311A 公开(公告)日: 2011-09-21
发明(设计)人: 雷向东;魏崟泷 申请(专利权)人: 常州楚天生物科技有限公司
主分类号: C12Q1/68 分类号: C12Q1/68;C40B40/06
代理公司: 暂无信息 代理人: 暂无信息
地址: 213022 江苏省常州市*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 通用 寡核苷酸 序列 构建 应用
【说明书】:

技术领域

发明属于生物技术领域,通过生物信息学的手段和优化算法对多个物种的遗传信息进行挖掘,得到由少数高频寡核苷酸序列组成的通用序列库。具体涉及一种可对多物种进行集成化实验设计的通用寡核苷酸序列库的构建方法及其应用领域。

背景技术

基于核酸序列的遗传信息分析是生物学的重要内容和技术手段。核酸序列分析的实验技术利用碱基互补配对的高度精确性,实现对某一特定目标DNA序列的检测。传统遗传信息分析通常使用“一对一”的模式,如一条探针分析一个基因。这种“一对一”的模式,虽然有专一性高的特点,但其缺点和局限也很明显:第一,缺乏通用性,导致成本高昂。例如,实时定量PCR(qPCR)实验中,对所选探针专一性和通用性的平衡始终是一个挑战。常用的由淬灭基团和荧光报导基团组成的双标记寡核苷酸荧光探针,也称为水解探针(hydrolysis probes)或TaqMan探针,设计为与目标序列上、下游引物间的序列配对,虽然具有较高的专一性,但这种“一对一”的模式没有灵活性和通用性,成本高昂。一旦目的序列或设计的引物改变,原先合成的探针便无用处。而本发明通过选择通用库中的探针,配合专一性的引物进行qPCR实验,即保证了对目标序列的专一性,又使探针具有通用性。

第二,“一对一”的模式直接从高度复杂的基因库到单一基因,无法对基因库进行分组分析。目前利用专一捕获探针进行靶序列捕获的基因捕获技术,虽然保证了对单一序列的特异性捕获,但无法对某一组功能基因进行分组分析,可重复利用性低,也导致了成本高昂。在本发明中,通过设计通用捕获探针的多种组合,可得到多种靶序列的分离、提纯;通过设计一系列这样的捕获探针组合,可实现对高度复杂的遗传信息的定向分离、筛选。

第三,“一对一”模式要求使用较长的探针或引物,通常需要知道至少16个碱基的序列,因而不适用序列不明的基因。而本发明的通用寡核苷酸序列库只需要8-12个碱基的序列,作为通用引物可启动一组带有该引物序列的RNA的反转录或DNA的复制。

随着LNA(Locked Nucleic Acid)和ZNA(Zip Nucleic Acids)等核苷酸修饰技术的出现,大幅度提高了短探针的解链温度,使得用8-12个碱基的短序列设计引物和各种探针成为可能。本发明通过建立通用寡核苷酸序列库,采用“一对多”的策略对传统遗传信息分析中“一对一”的模式进行补充和优化,可极大程度的降低遗传信息分析成本,并实现对遗传信息的分组分析。

发明内容

本发明涉及一种通用寡核苷酸序列库的构建方法及其应用,这里的寡核苷酸序列是一类可作为实验探针、引物的,经过分子修饰的8-12个碱基短序列。本发明通过生物信息学的手段,对多种模式生物和已测序物种的转录组、全基因组序列等信息进行挖掘;通过设计优化算法,对高频分布的寡核苷酸序列进行评价、筛选,最终得到由少量寡核苷酸组成的通用序列库。

本发明涉及对16个物种转录组、基因组中的高频8-12个碱基短序列的优化建库,包括七种模式生物:人、黑猩猩、小鼠、大鼠、果蝇、线虫、拟南芥;和已测序的九个物种:猕猴、牛、狗、马、原鸡、斑马鱼、海鞘、水稻和葡萄。并通过整合各个物种的通用序列库,得到对绝大多数物种适用的通用寡核苷酸序列库。

一种构建通用寡核苷酸序列库的方法:如图1所示,对所有可能的该长度的寡核苷酸序列,去掉出现连续四位相同碱基的序列;每条序列的GC含量在30%-70%之间。对这样的备选序列,我们分别在物种的转录组、基因组等目标序列集中对其出现频率和分布情况进行分析,选取出现频率最高的一部分序列组成高频备用寡核苷酸序列库。所选择的序列应不低于备选序列总数的0.1%,不高于备选序列总数的15%。后设计贪婪算法对备选高频序列在目标序列集中的分布情况进行分析,得到对目标序列集最优化的通用探针组合,即构成该目标序列集的通用寡核苷酸序列库。

由于图1的备选高频寡核苷酸序列库中存在大量的相似序列,它们大部分交叉重叠或仅相差1-2个碱基,这样的寡核苷酸序列往往互相伴随且均高频出现;此外,某些高频寡核苷酸序列在目标序列集的分布较集中,且盲区较多。对构建一个优化的通用序列库,显然仅仅统计目标序列集中寡核苷酸序列的出现频率是远远不够的。需要我们考察每条寡核苷酸序列及各种序列组合在目标序列集中的分布情况,利用一定数目的寡核苷酸序列对目标序列集中序列获得最大覆盖率的同时,保证寡核苷酸序列分布的均匀性和一定的分布密度,尽量少出现分布的盲区,这样得到的一组寡核苷酸序列才可作为优化的通用库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州楚天生物科技有限公司,未经常州楚天生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010120887.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top