[发明专利]一种快速检测HGT的方法在审

专利信息
申请号: 202211652294.7 申请日: 2022-12-21
公开(公告)号: CN116312768A 公开(公告)日: 2023-06-23
发明(设计)人: 赵梓丞;李梦瑶;高鹏;贺小兰 申请(专利权)人: 深圳百人科技有限公司
主分类号: G16B20/30 分类号: G16B20/30;G16B30/10;G16B50/00;G06F18/2321
代理公司: 合肥钩知专利代理事务所(特殊普通合伙) 34305 代理人: 孙秀丽
地址: 518118 广东省深圳市坪山区坑梓街*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 快速 检测 hgt 方法
【说明书】:

发明公开了一种快速检测HGT的方法,涉及HGT检测技术领域,解决了现有HGT检测技术检测过程缓慢,计算成本高,且HGT检测精度相对较低,难以应用于实际的大规模宏基因组学研究中的问题,现提出如下方案,其包括第一部分为一种允许近似匹配的k‑mer编码算法;第二部分为基于上述k‑mer编码算法估计基因组深度和跨物种reads比对,而从参考数据库中提取HGT相关片段的程序;第三部分为利用BWA比对从不一致的reads比对中再次确定HGT精确断点位置。本方法具有将参考数据库减少到一个小型的HGT相关参考数据库来加快对比,在执行速度提高四倍以上的同时具有较高的准确性,同时提高了计算效率,也降低了计算成本,还能够便利地应用于实际的大规模宏基因组学研究中的特点。

技术领域

本发明涉及HGT检测技术领域,尤其涉及一种快速检测HGT的方法。

背景技术

DLIGHT、Ranger-DTL和AnGST通过基因和物种树之间的冲突识别HGT事件;Darkhorse和HGTector利用BLAST匹配来搜索同一基因组中分类上不一致的基因片段。上述HGT检测工具需要现有的参考组装基因组,根据各种序列特征推断转移基因,侧重通过探索系统发育树或者基因组组成不一致来检测过去的HGT事件。它们都不适合寻找个体中的HGT事件。

近些年,LEMON和DAISY通过把宏基因组测序数据比对到参考基因组,来检测HGT事件。它们可以寻找个性化的HGT事件,但是所依赖的参考基因组过于庞大,导致消耗过多的计算资源。这限制了它们在大规模研究中的应用。

现有HGT检测技术需要现有的参考分离物基因组,受制于将测序读数与大型参考数据库比对或组装过程,导致检测过程缓慢,计算成本高,且HGT检测精度相对较低,难以应用于实际的大规模宏基因组学研究中。因此提出一种快速检测HGT的方法。

发明内容

本发明的目的在于提供一种快速检测HGT的方法,解决了现有HGT检测技术检测过程缓慢,计算成本高,且HGT检测精度相对较低,难以应用于实际的大规模宏基因组学研究中的问题。

为实现上述目的,本发明提供如下技术方案:一种快速检测HGT的方法,包括以下步骤:

S1:允许近似匹配的k-mer编码算法:

(1)用n个散列函数对k-mer进行编码,DNA序列的四种碱基有12种类型的替换错配,每个映射中,每两个碱基映射到相同的值,因此每个映射容许4种类型的替换;

(2)在散列函数中用随机映射将每个k-mer转换成一个二进制数字,再将二进制数转换为十进制数;

(3)通过在不同的哈希函数中为每个碱基分配不同的映射来容忍更多的替换;

S2:基于上述k-mer编码算法估计基因组深度和跨物种reads比对,而从参考数据库中提取HGT相关片段的程:

(1)在所有reads中,枚举所有k-mers,并记录出现次数,最多随机选择M个碱基对的读数,采用滑动窗口法丢弃样本中不存在的参考片段;

(2)k-mer排列中,结构变化断点附近的深度为零,因此沿着基因组深度急剧变化的区域可能包含HGT断点,收集这些选定区域周围的k-mers作为标记;

(3)我们比较每个位置左段和右段的平均深度,一旦深度差超过截止阈值,该位置将被选择为候选断点,并记录其对应的物种和断点位置;

(4)枚举每一个read,并检查其是否包含k-mer标记,来自不同物种但位于相同read的标记代表可能的HGT信号,对应的位置被赋值为HGT候选断点,通过从参考数据库中收集HGT候选断点前后各500bp来提取HGT相关参考片段;

S3:从不一致的read比对中再次推断精确HGT断点位置:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳百人科技有限公司,未经深圳百人科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211652294.7/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top