[发明专利]一种运行于多核计算机平台的并行通用序列的比对方法在审
申请号: | 201410491798.4 | 申请日: | 2014-09-24 |
公开(公告)号: | CN104239732A | 公开(公告)日: | 2014-12-24 |
发明(设计)人: | 李肯立;朱香元;唐卓;徐雨明;李克勤;肖正 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 长沙市融智专利事务所 43114 | 代理人: | 黄美成 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 运行 多核 计算机 平台 并行 通用 序列 方法 | ||
技术领域
本发明属于计算机软件技术领域,涉及一种运行于多核计算机平台的并行通用序列的比对方法。
背景技术
序列是生物信息的载体,包括DNA(脱氧核糖核酸)、RNA(核糖核酸)和蛋白质等。生物序列比对(sequence alignment)是以序列为研究对象,通过比较序列中各字符间的对应关系或字符的对比排列,发现序列之间的相似性,辨别序列之间的差异,从而推测其结构、功能以及进化上的联系。序列比对是生物序列分析领域最重要的研究方向之一,已被广泛应用于进化分析、功能预测、相似性搜索、生物制药、疾病诊断与治疗等方面。
高性能计算的发展现状表明,计算机体系结构已朝着单核到多核、同构到异构体系结构快速发展。有关并行的序列比对方法主要分成二种思路。
第一种思路是在经典体系结构上提出并行序列比对解决方法,经典体系结构包括总线网、Mesh网、机群和众核计算机等计算平台。在国内,中科院计算技术研究所在DAWING 2000-I机群系统上开发了并行S-W方法,通过应用分而治之策略,有效地降低了内存需求,实现了大规模序列比对数据的并行处理。还有应用64核Tile64平台实现的N-W序列比对方法,获得了20倍的加速效果。另外,还采用了Amazon Elastic Cloud(EC2)平台实现了T-COFFEE序列比对方法。
另一种思路是鉴于通用计算平台处理生物序列比对的局限性,目前国内外大多采用硬件加速部件与通用微处理器组成异构处理结构,对生物序列比对的应用进行加速。硬件加速部分包括GPU(Graphic Processing Unit)、FPGA(Field Programmable Gate Array)和Cell BE(Cell Broadband Engine)。自2006年最早提出GPU加速S-W方法以来,已提出了许多GPU在序列比对领域的应用。采用的GPU类型大部分基于NVIDIA GPU的实现,2011年,中国首先采用AMD ATI HD4850实现多序列比对的加速,也是迄今为止唯一将AMD GPU应用于序列比对领域的方法。除了单GPU上实现序列比对外,也提出了多GPU协同实现序列比对的方法。自1998年首次应用FPGA加速序列比对应用以来,已有许多采用线性脉动阵列处理器的序列比对方法。2007年,Sachdeva等第一次将Cell BE平台应用到序列比对领域,随后提出了FASTA、ClustalW、BLASTP等方法的Cell BE加速方法。
通用计算平台和异构计算平台加速序列比对的方法各有优劣。具体分析如下:
虽然采用通用计算平台对序列比对的并行计算取得了明显的加速效果,但从并行效率上分析,通用计算平台对序列比对这类数据相关性较强的计算密集型应用,并行效率一般不超过60%。而且随着序列比对问题规模的增大和处理器数量的增加,并行效率呈明显下降趋势。
鉴于异构体系结构能够适应序列比对算法多样性的同时保持系统软件兼容,并且随着GPU、FPGA和Cell BE性能提升和价格、功耗的不断降低,基于异构体系结构的并行序列比对方法是序列比对领域正在探索的重要发展方向。虽然GPU等加速部件拥有强大的计算能力和卓越的性价比,但是由于其硬件结构固定,拥有有限的内存,不能在运算粒度、存储调度、计算适应度方面适应序列比对具体应用的特点,限制了实际计算性能。因此,异构计算平台序列比对加速方法研究目前急需解决以下问题:
(1)异构平台的高效协同方式。CPU与加速部件(GPU、FPGA和Cell BE)之间的高效协同计算是提升序列比对性能的关键因素。必须根据硬件加速部件的计算能力和执行特点,确定合理的协同方式,以保证CPU与加速部件之间的负载平衡,降低各种交互开销,进而提高并行方法的执行效率。
(2)序列比对程序的性能优化。对采用硬件加速部件加速的序列比对并行计算程序而言,影响其性能的因素主要有:计算的组织方式、寄存器和缓存的使用、存储器访问特点、同步以及数据传输等。如何优化这些影响性能的主要因素,是研究序列比对硬件加速方法的难点。
发明内容
本发明的所要解决的技术问题是提供一种运行于多核计算机平台的并行通用序列的比对方法,以克服现有技术中序列比对的执行效率不高的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410491798.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗咽喉疾病的喉钳
- 下一篇:一种肿瘤提取器
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用