[发明专利]超低频突变分子标签聚类分群算法有效
申请号: | 201610350317.7 | 申请日: | 2016-05-24 |
公开(公告)号: | CN106021987B | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 曾华萍;宋卓;袁梦兮 | 申请(专利权)人: | 人和未来生物科技(长沙)有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00;C12Q1/68 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 李志东 |
地址: | 410152 湖南省长沙*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种对测序读段进行聚类的方法,所述测序读段携带标签序列,该方法包括:(1)将多个测序读段与参考序列进行比对,并确定各测序读段的两端位置,将两端位置一致的测序读段归类至相同的一级群;(2)对属于同一个一级群的测序读段根据其标签序列进一步分二级群,将分子标签序列相似的测序读段分为同一个二级群。通过该方法能准确有效地对测序读段进行聚类分群,为后期通过各个群的一致性序列来精确检测低频突变奠定坚实的基础。 | ||
搜索关键词: | 低频 突变 分子 标签 分群 算法 | ||
【主权项】:
1.一种对测序读段进行聚类的方法,所述测序读段携带标签序列,其特征在于,所述方法包括以下步骤:(1)将多个测序读段与参考序列进行比对,并确定各测序读段两端的位置,将两端位置一致的测序读段归类至相同的一级群;(2)对属于同一个一级群的测序读段根据其标签序列进一步分二级群,将分子标签序列相似的测序读段分为同一个二级群;所述步骤(2)的详细步骤包括:(a)确定所述一级群内的各标签的深度;(b)将所述各标签按深度从高到低进行排序;(c)针对深度由高至低的标签依次实施下列步骤:如果所述标签与已有的种子标签序列的错配不超过指定错配数,则将具有所述标签的测序读段分配至所述种子标签子群中;如果所述标签与已有的种子标签序列的错配超过指定错配数,则选择所述标签为新的种子标签,并将具有所述标签的测序读段分配至相应的种子标签子群中;经过上述二级群处理后,所有的测序读段都分成了若干个二级群,这些二级群即最后的分群结果;其中,(c)中所述种子标签是指该二级群的深度最高的标签序列,认为是该群的真实的标签序列,同时该群中存在一些深度较低的含有错误的标签序列。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人和未来生物科技(长沙)有限公司,未经人和未来生物科技(长沙)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610350317.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能抗微生物肽的最优多标记集成预测方法
- 下一篇:时相标化的系统及方法