[发明专利]一种基于偏移量优化高性能计算集群上G-BLASTN数据传输的方案在审

专利信息
申请号: 202010834337.8 申请日: 2020-08-18
公开(公告)号: CN112069119A 公开(公告)日: 2020-12-11
发明(设计)人: 钱红燕;张雁楠 申请(专利权)人: 南京航空航天大学
主分类号: G06F15/163 分类号: G06F15/163;G06F15/16
代理公司: 暂无信息 代理人: 暂无信息
地址: 211106 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 偏移 优化 性能 计算 集群 blastn 数据传输 方案
【说明书】:

发明公布了一种数据传输性能高效的、适合于高性能计算集群的G‑BLASTN优化方案。目前的G‑BLASTN执行过程是传输一条核酸数据库中的序列到GPU显存上,执行一次查询序列比对该条的过程。这种设计模式是基于降低性能换取兼容性的考虑。但对于高性能计算集群而言,它往往拥有超大的内存、显存足够容纳各种核酸数据库。我们通过将核酸数据库中的所有序列集中组织到一起,以偏移量形式存、取序列,实现了核酸序列整体传输到GPU端,让显存中包含整个核酸数据库后再依次执行序列的比对。这大幅地提升了数据传输的并发性,使得CPU内存到GPU设备内存的数据传输性能提高1.93倍,GPU总运算时间缩短了21.3%。

技术领域

本发明是一种基于偏移量优化高性能计算集群上G-BLASTN数据传输的方案。方案采用了以偏移量的方式来组织所有subject sequence序列到CPU端,从而实现一次传输整个数据库,并且整个核酸数据库中的subject sequence全部传输完成后才一次执行比对。这种方式避免了浪费带宽、数据传输耗时长的弊端,提升了GPU计算部分的整体性能。

背景技术

目前关于高性能计算集群上G-BLASTN软件的数据传输耗时长问题尚未引起足够重视,本篇文章是首次提出使用偏移量的方式对G-BLASTN的数据传输模式进行优化。G-BLASTN程序执行时,是每次传输一条数据库中的subject sequence到GPU显存上,然后执行该条序列与查询序列的比对。这种数据传输模式具有以下几个缺点:

(1)GPU-CPU间带宽利用率低:subject sequence往往都不是长度都不是很大,一般而言10Mb左右,这样就导致GPU-CPU间带宽利用率低。

(2)传输性能差:各种核酸数据库中存在数量不少的短序列,这种短序列往往只有零点几兆,这样就导致管理内存的CUDA API调用的耗时都会比传输耗时大的多。

(3)限制多序列并发查询:目前的G-BLASTN的kernel函数执行状态是每条subjectsequence都要逐次启动kernel,这是因为每次比对的主体subject sequence都要传输到GPU。这种情况下没有可能提升查询的并发性;

(4)各序列比对间有时间间隙:在上一条序列对比完后,要执行下一条比对之前需要将该次要比对的序列传到GPU,这造成了比对间的时间间隙。

本发明使用偏移量方式来从一大块内存上存、取所要使用到的subjectsequence,所以所有的subject sequence序列都组织到同一块内存区域中,不会造成内存浪费。本发明所提出的优化方式显著改善了原数据传输模式中存在的上述四点问题。

发明内容

本发明的目的在于采用偏移量组织所有subject sequence,从而实现了一次传输整体核酸数据库到设备设备端,该数据传输模式有效地改善高性能计算集群上G-BLASTN软件中存在的低带宽利用、高耗时、阻碍序列间比对的数据传输问题,内容主要包括:

i.采用偏移量的方式组织所有subject sequence到内存

我们通过使用原程序中的API循环收集数据库的subject到已开辟好的一大块内存空间中,使用长度和偏移量来记录确定存放位置以及长度。对于高性能计算集群而言,拥有超大内存和显存,本次实验的高性能计算集群拥有512个节点,一个节点配备8*32G大小内存,GPU设备内存为16G。若经过核酸数据库经过数据压缩后(4倍压缩),设备内存无法满足要求(最大容纳4*16G大小核酸数据库),则高性能集群会调度其他的GPU来存储并执行剩余部分的核酸数据库,一般情况才不会出现该情况。本发明提出的传输模式使得数据传输性能提升1.93倍。

ii对所有subject sequence传输到GPU设备内存上

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010834337.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top