[发明专利]基于FPGA的基因序列组装算法计算加速方法有效
| 申请号: | 202011484784.1 | 申请日: | 2020-12-16 |
| 公开(公告)号: | CN113012760B | 公开(公告)日: | 2022-07-05 |
| 发明(设计)人: | 柳星;张敏杰;蔡晨冉;叶晓艺 | 申请(专利权)人: | 武汉理工大学 |
| 主分类号: | G16B30/20 | 分类号: | G16B30/20;G16B30/10;G16B40/00 |
| 代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 李丹 |
| 地址: | 430070 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 fpga 基因 序列 组装 算法 计算 加速 方法 | ||
本发明公开了一种基于FPGA的基因序列组装算法计算加速方法,包括CPU和FPGA的异构计算平台,该方法包括以下步骤:1)过滤阶段,在CPU主机上将查询序列Kmer化得到一系列种子,然后依次寻找所有种子在参考序列区间上的匹配位置,即命中;然后对各个命中区间中种子重叠的碱基数目进行计数,挑选数量大于阈值的位置作为候选位置;2)扩展阶段,通过优化后的Smith‑Waterman算法,以候选位置作为起点开始扩展,通过CPU对矩阵的分块加以控制;FPGA对每个分块矩阵进行运算得到部分回溯路径;3)CPU将这些回溯路径依次进行拼接从而获取完整的回溯路径。本发明采用一种优化后的Smith‑Waterman算法,能大幅提高序列比对的运行速度。
技术领域
本发明涉及基因序列比对计算技术,尤其涉及一种基于FPGA的基因序列组装算法计算加速方法。
背景技术
近年来,随着测序技术的快速发展,基因组数据的增长速度远远超过了摩尔定律,导致现有的计算机资源无法满足人们处理这些海量数据的需求。基因组组装作为处理这些海量数据的首要环节,如何优化或者加快组装过程是目前一个热门的话题。而序列比对作为基因组组装的重要环节之一,同时也在精准医疗领域发挥着重要作用。
目前的序列比对算法大都基于种子与扩展策略,该策略相较于原始的比对算法,在进行比对计算前先通过滤波的方式筛选出未来比对结果可能出现的区域,然后在这些区域的范围内进行比对计算,从而避免计算整个范围造成的大量的时间和空间的资源浪费。根据该策略,目前主要的研究方向有以下几种:过滤技术优化、种子索引技术优化、对比算法优化以及使用硬件对对比算法进行加速。
尽管基因组装的计算量极大,但当前大多基因组装的应用程序工具仍然停留在基于传统CPU平台开发。然而,由于CPU作为一种通用处理器,其硬件结构并非针对基因计算算法而专门设计的,导致面对大数据时代下的海量基因组数据使用CPU执行组装算法成为了瓶颈。
与传统采用CPU并行或GPU硬件加速方式相比,利用FPGA实现硬件加速不仅能够更好地减少计算时间,而且能耗更低。本发明通过设计一个CPU+FPGA的异构计算平台实现对序列比对的加速,本发明由国家级大学生创新创业训练计划资助202010497040资助。
发明内容
本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种基于FPGA的基因序列组装算法计算加速方法。
本发明解决其技术问题所采用的技术方案是:一种基于FPGA的基因序列组装算法计算加速方法,包括CPU和FPGA的异构计算平台,该方法包括以下步骤:
1)过滤阶段,在CPU主机上将查询序列Kmer化得到一系列种子,然后依次寻找所有种子在参考序列区间上的匹配位置,即命中;然后对各个命中区间中种子重叠的碱基数目进行计数,挑选数量大于阈值的位置作为候选位置;
2)扩展阶段,通过优化后的Smith-Waterman算法,以候选位置作为起点开始扩展,通过CPU对矩阵的分块加以控制;FPGA对每个分块矩阵进行运算得到部分回溯路径;
3)CPU将这些回溯路径依次进行拼接从而获取完整的回溯路径。
按上述方案,所述步骤1)中寻找所有种子在参考序列区间上的匹配位置,具体如下:
1.1)使用K大小的滑动窗口得到一系列查询序列种子,并将参考序列按固定大小进行分区;
1.2)寻找种子在参考序列区间对角带上的命中位置。
按上述方案,所述步骤1.2)通过使用基于哈希索引的数据结构的种子指针表和种子位置表完成,具体如下:
使用相同的K大小滑动窗口得到参考序列种子,将这些种子的位置按顺序记录在种子位置表中,同时种子指针表记录每种类型种子在种子位置表的存储的起始位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011484784.1/2.html,转载请声明来源钻瓜专利网。





