[发明专利]人类短片段串联重复序列高通量测序信息的处理方法有效

专利信息
申请号: 201610102496.2 申请日: 2016-02-24
公开(公告)号: CN107122625B 公开(公告)日: 2020-10-09
发明(设计)人: 周骋;姚旭斌;潘雅姣 申请(专利权)人: 北京爱普益生物科技有限公司
主分类号: G16B20/20 分类号: G16B20/20;G16B25/00;G16B30/10;G16B40/00;G16B45/00;G16B50/00
代理公司: 北京圣州专利代理事务所(普通合伙) 11818 代理人: 王振佳
地址: 100176 北京市大兴区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 人类 片段 串联 重复 序列 通量 信息 处理 方法
【说明书】:

发明公开了人类短片段串联重复序列高通量测序信息的处理方法,属于生物检测领域。该方法为:保留单张芯片的STR高通量测序信息中具有预设测序长度的序列,形成第一序列;根据样本标签信息,将第一序列分类至不同样本文件夹中,根据STR目的片段特异引物信息,将第一序列再分类至不同STR基因座文件夹中,形成第二序列;建立针对不同STR基因座的阶梯参比序列,将第二序列与其中相应STR基因座的序列比对,保留序列相似度≥90%的第三序列;将样本测序条目数的阈值设为1000,将基因座测序条目数的阈值设为50,将基因座内分型测序条目数的阈值设为5,将基因座内分型测序条目数/基因座测序条目数的阈值设为40%,筛选第三序列中≥以上阈值的序列,得STR分型结果。

技术领域

本发明涉及生物检测领域,特别涉及一种人类短片段串联重复序列高通量测序信息的处理方法。

背景技术

短片段串联重复序列(short tandem repeat,简称STR)是广泛存在于人类染色体DNA中的一类多态性遗传标记系统,因其存在范围广(平均16kb中即有一个STR基因座),核心序列小(2-7bp)且扩增产物长度均小于500bp,等位基因位点的数字即代表序列重复的次数。STR基因座的等位基因片断长度集中,故可对多个STR基因座进行复合扩增。复合扩增多个STR基因座,累计鉴别能力可以接近或达到DNA指纹水平,是现代法医学使用范围最广的DNA指纹标记。

自上世纪90年代以来,对STR通用的检测方法是以多重PCR检测约20个基因座的基因型,在检测中使用以荧光标记的引物并设计好扩增子的长度,使所产生的不同长短的具有荧光标记的针对每个基因座的扩增子在毛细管电泳中分离,并与标准物进行比对,从而实现对每个基因座中的等位基因进行分型。但是,这种方法也存在着由于技术上的限制而带来的缺陷,主要有:(1)由于荧光标记物的相互干扰和毛细管长度及成像技术等方面的限制,被分析基因座的数目已难以进一步大幅提升;(2)由于分析的对象是各个片段的长度大小,无法进一步检测到组成片段的核酸一级结构的微小差异,因此限制了检测的分辨度;(3)出峰宽度受电泳条件影响,导致碱基个数相差1-2bp时难易分辨。而高通量测序法的出现则能够弥补以上缺陷,其具有以下特点:(1)检测位点数几乎不受平台限制;(2)核心重复数一致的情况下,测定出的序列微变异可以进一步区分不同个体,提高检测的分辨度;(3)序列信息直接反映核心重复数,更加准确。此外,各测序公司已经开展应用高通量测序法平台测定人类STR基因座的研究工作,包括罗氏的GS FLX、Illumina的GAIIx和LifeTechnology的PGM平台。商业化的STR高通量测序法检测试剂盒已开始逐渐涌现,其中不乏国产试剂盒。

然而,发明人发现,通过高通量测序法得到的高通量测序信息,其信息量非常大,基于此,有必要对人类短片段串联重复序列高通量测序信息进行简单快速地处理,以得到常规的STR分型结果,同时,将其中不同人个体的STR序列的微变异以直观的方式显现出来。

发明内容

本发明实施例所要解决的技术问题在于,提供了一种人类短片段串联重复序列高通量测序信息的处理方法。具体技术方案如下:

人类短片段串联重复序列高通量测序信息的处理方法,所述处理方法包括:步骤a、获取单张芯片的STR高通量测序信息作为原始序列,并根据预设测序长度,过滤所述原始序列,保留具有所述预设测序长度的序列,形成第一待处理序列;

步骤b、根据样本标签信息,将所述第一待处理序列分类至不同的样本文件夹中,然后根据STR目的片段特异引物信息,分别将每个所述样本文件夹中的第一待处理序列再分类至不同的STR基因座文件夹中,以在每个所述STR基因座文件夹中形成第二待处理序列;

步骤c、建立针对不同STR基因座的阶梯参比序列,作为比对基础数据库,将每个所述STR基因座文件夹中的所述第二待处理序列分别与所述比对基础数据库中相对应STR基因座的序列进行比对,在每个所述STR基因座文件夹中保留序列相似度大于等于90%的序列,形成第三待处理序列;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱普益生物科技有限公司,未经北京爱普益生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610102496.2/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top