[发明专利]基于contig质量评估分类及图优化的scaffolding方法有效
申请号: | 201810242418.1 | 申请日: | 2018-03-22 |
公开(公告)号: | CN108491687B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 李敏;唐丽;吴彬彬;罗军伟;王建新 | 申请(专利权)人: | 中南大学 |
主分类号: | G16B30/20 | 分类号: | G16B30/20;G16B40/00 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 杨萍 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于contig质量评估分类及图优化的scaffolding方法,采用序列比对信息以及contig的GC含量信息对contig集合进行质量评估并分类,再将每个contig作为一个节点,根据双端读数比对到contig上的数量期望值以及实际值之间的差异判断是否在两个节点之间构建边,并计算边的权值,构建加权的scaffold图。最后通过为节点分配方向以及剪切节点来消除scaffold图中的方向冲突,通过为节点分配顺序来消除scaffold图中的顺序冲突。本发明简单易用,在四组真实测序数据上表现出良好的拼接结果,较其他序列拼接方法具有更高的F‑score值。 | ||
搜索关键词: | 基于 contig 质量 评估 分类 优化 scaffolding 方法 | ||
【主权项】:
1.一种基于contig质量评估分类及图优化的scaffolding方法,其特征在于,包括以下步骤:步骤1、数据预处理:首先将双端读数比对到已有的contig集合上,得到比对结果;然后对比对结果进行过滤;步骤2、节点质量评估及分类:利用步骤1中保留的比对信息以及contig中的GC含量特征来对contig的质量进行评估,并根据质量评估结果将contig分为正确,错误,不确定三大类;步骤3、构建加权的scaffold图:将每个contig作为一个节点,根据双端读数比对到contig上的数量期望值以及实际值之间的差异判断是否在两个节点之间构建边,并计算边的权值;步骤4、对scaffold图进行优化:在比对信息的基础上结合节点的分类与边的权值对scaffold图进行优化;步骤5、从图中提取scaffolds:采用广度遍历的方法从优化后的scaffold图中尽可能提取较长的scaffolds,作为最后的输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810242418.1/,转载请声明来源钻瓜专利网。