[发明专利]用于碱基序列分析的参考序列处理系统及方法无效

专利信息
申请号: 201310009073.2 申请日: 2013-01-10
公开(公告)号: CN103294932A 公开(公告)日: 2013-09-11
发明(设计)人: 朴旻胥;金判奎;全皓湘 申请(专利权)人: 三星SDS株式会社
主分类号: G06F19/16 分类号: G06F19/16
代理公司: 北京铭硕知识产权代理有限公司 11286 代理人: 韩明星;王兆赓
地址: 韩国*** 国省代码: 韩国;KR
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 碱基 序列 分析 参考 处理 系统 方法
【说明书】:

技术领域

发明涉及用于分析基因组的碱基序列的技术。

背景技术

由于下一代测序(next-generation sequencing;NGS)技术的出现和DNA测序(sequencing;碱基序列解读)成本的减少,使得可以大规模地生产人类基因组碱基序列以用于医学遗传学(medical genetics)和群体遗传学(population genetics)的研究。为碱基序列分析而使用的NGS测序仪能够生产出长度虽然非常短但具有数十亿个的短序列(短片段;read)。每个个体的基因组序列通过用于确定所生产的短片段位于参考序列的哪一位置的重测序(Resequencing;索引(Indexing)、映射(Mapping)和比对(Alignment))作业而获得。

在进行碱基序列分析时,为了短片段的正确的映射,必需需要参考序列。但是,在这种参考序列中的一部分由于测序错误、实验误差等原因而具有不明确应当表现为A、C、G、T中的哪一种碱基的情形,此时通常将相关位置标记为N。此时,为了处理如上所述的不明确的碱基,现有的碱基序列分析系统将其假设为A、C、G、T中任意选择的碱基,或者利用概率方法论等处理了不明确的碱基。但是,这样的方法使不明确的碱基的处理程序增加,从而存在导致碱基序列分析速度非常慢,或者导致碱基序列分析的准确度下降的问题。

发明内容

本发明的实施例的目的在于提供一种在不损害碱基序列分析的准确度的同时能够高速处理的、参考序列内的不明确的碱基的处理技术。

根据本发明一实施例提供的参考序列处理系统包括:种子片段提取部,从参考序列提取种子片段;判断部,判断由种子片段提取部提取的所述种子片段中是否存在不明确的碱基;索引生成部,当所述种子片段中存在不明确的碱基时,将所述种子片段加入到索引中。

另外,用于解决上述问题的根据本发明一实施例提供的参考序列处理方法包括步骤:由参考序列处理系统从参考序列提取种子片段;由所述参考序列处理系统判断所提取的所述种子片段中是否存在不明确的碱基;当所述种子片段中存在不明确的碱基时,所述参考序列处理系统将所述种子片段加入到索引中。

另外,用于解决上述问题的根据本发明一实施例提供的参考序列处理装置包括一个以上的处理器、存储器、一个以上的程序,该装置构成为所述一个以上程序存储于所述存储器且由所述一个以上的处理器执行,所述程序包括用于执行如下步骤的指令:从参考序列提取种子片段;判断所提取的所述种子片段中是否存在不明确的碱基;当所述种子片段中存在不明确的碱基时,将所述种子片段加入到索引中。

根据本发明的实施例,在进行碱基序列分析时,无需包括用于从参考序列中处理不明确的碱基的算法,因此能够使碱基序列分析过程简单,同时能够大幅缩短分析时间。

并且,根据本发明的实施例,散列表的容量将大幅减少,因此即使使用较小的存储器也能够执行碱基序列分析。

附图说明

图1为例示出从参考序列提取种子片段的过程的图。

图2为用于说明基因组碱基序列(genome sequencing)分析过程的流程图。

图3为用于说明在基因组碱基序列分析中,短片段与参考序列之间的映射过程的图。

图4为根据本发明一实施例提供的参考序列处理系统的方块构成图。

图5为用于说明通过参考序列与短片段之间的对比推导不明确的碱基的过程的图。

图6为示出根据本发明一实施例提供的参考序列处理方法的流程图。

符号说明:

400:参考序列处理系统

402:种子片段提取部

404:判断部

406:索引生成部

具体实施方式

以下,参照附图说明本发明的具体的实施方式。但是,这只不过是示例,本发明并不局限于此。

在说明本发明时,当判断为对于与本发明相关的公知技术的具体说明有可能混淆本发明的要旨时,省略对其的详细说明。而且,后述的术语是考虑到在本发明中的功能而进行定义的,其根据用户、应用者的意图或惯例等而可能不同。因此,其定义应当以整个本说明中的内容来定义。

本发明的技术思想由权利要求书来确定,以下的实施例只不过是用于向本发明所属技术领域的具有通常的知识的技术人员有效率地说明本发明的技术思想的一种手段。

在详细说明本发明的实施例之前,首先对在本发明中所使用的术语进行说明为如下。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星SDS株式会社,未经三星SDS株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310009073.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top