[发明专利]超低频突变分子标签聚类分群算法有效

专利信息
申请号: 201610350317.7 申请日: 2016-05-24
公开(公告)号: CN106021987B 公开(公告)日: 2019-04-09
发明(设计)人: 曾华萍;宋卓;袁梦兮 申请(专利权)人: 人和未来生物科技(长沙)有限公司
主分类号: G16B20/00 分类号: G16B20/00;G16B40/00;C12Q1/68
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 李志东
地址: 410152 湖南省长沙*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种对测序读段进行聚类的方法,所述测序读段携带标签序列,该方法包括:(1)将多个测序读段与参考序列进行比对,并确定各测序读段的两端位置,将两端位置一致的测序读段归类至相同的一级群;(2)对属于同一个一级群的测序读段根据其标签序列进一步分二级群,将分子标签序列相似的测序读段分为同一个二级群。通过该方法能准确有效地对测序读段进行聚类分群,为后期通过各个群的一致性序列来精确检测低频突变奠定坚实的基础。
搜索关键词: 低频 突变 分子 标签 分群 算法
【主权项】:
1.一种对测序读段进行聚类的方法,所述测序读段携带标签序列,其特征在于,所述方法包括以下步骤:(1)将多个测序读段与参考序列进行比对,并确定各测序读段两端的位置,将两端位置一致的测序读段归类至相同的一级群;(2)对属于同一个一级群的测序读段根据其标签序列进一步分二级群,将分子标签序列相似的测序读段分为同一个二级群;所述步骤(2)的详细步骤包括:(a)确定所述一级群内的各标签的深度;(b)将所述各标签按深度从高到低进行排序;(c)针对深度由高至低的标签依次实施下列步骤:如果所述标签与已有的种子标签序列的错配不超过指定错配数,则将具有所述标签的测序读段分配至所述种子标签子群中;如果所述标签与已有的种子标签序列的错配超过指定错配数,则选择所述标签为新的种子标签,并将具有所述标签的测序读段分配至相应的种子标签子群中;经过上述二级群处理后,所有的测序读段都分成了若干个二级群,这些二级群即最后的分群结果;其中,(c)中所述种子标签是指该二级群的深度最高的标签序列,认为是该群的真实的标签序列,同时该群中存在一些深度较低的含有错误的标签序列。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人和未来生物科技(长沙)有限公司,未经人和未来生物科技(长沙)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610350317.7/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top