[发明专利]一种生物信息学高性能计算平台的测试方法在审
申请号: | 201410196381.5 | 申请日: | 2014-05-12 |
公开(公告)号: | CN103984882A | 公开(公告)日: | 2014-08-13 |
发明(设计)人: | 金莲 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06F19/28 | 分类号: | G06F19/28 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生物 信息学 性能 计算 平台 测试 方法 | ||
技术领域
本发明涉及属于计算机科学和生物信息学的交叉学科,尤其涉及一种生物信息学高性能计算平台的测试方法。
背景技术
生物信息学是是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。在基因组学研究方向,测序技术是重要的研究手段,对于测序数据的分析就需要借助高性能计算平台完成,因此高性能计算平台的性能对生物信息学研究进展起着至关重要的作用,如何评测一套生物信息学平台的性能如何,是很多生物信息学专家以及高性能计算专家面临的问题。因为熟悉生物信息学的专家不熟悉具体的计算系统的配置,高性能计算专家对生物信息分析的流程和资源需求也知之甚少,所以发展一套标准化的生物信息学计算平台测试方法十分必要。
发明内容
本发明针对现有技术的不足之处,提供了一种生物信息学高性能计算平台的测试方法。
本发明所述生物信息学计算平台的性能测试方法,之前没有一种方法对生物信息学计算平台进行标准化的测试和评估;没有设置标准化测试平台,软件和运行算例,以及测试方法;本发明针对该现状,整理了一套全面系统的测试方法,涵盖硬件系统的配置,中间件的配置,系统层的性能测试以及应用层的性能测试.
本发明公开了一种生物信息学高性能计算平台的测试方法,其解决所述技术问题采用的技术方案如下:该测试方法依据生物信息学计算的需求,配置适合的硬件环境进行测试,测试中考虑系统性能是否正常,应用软件以及算例的选择是否具有生物信息学软件的代表性,测试用例的压力是否足够大等,并最后给出固定平台下的资源使用情况;
先确定适用于生物信息学平台的硬件平台,搭建测试环境,如安装操作系统,系统中部署软件,如intel编译器,mpi等,安装生物信息学软件,选择具有代表性的测试用例;其中,
所述确定的硬件平台使用于生物信息学的数据分析,生物信息学的计算需求一般内存容量消耗大,磁盘读写频繁,且存储占用空间大等,依据这一特点我们选用了128GB的内存容量,多块盘做RAID0,存储空间2TB,以满足运算的需求;
所述搭建测试环境是指,在确定硬件配置后,在其上部署系统环境,安装编译器,并行环境等,并进行系统基础性能测试,分别测试系统的Linpack效率,测试系统的内存带宽,磁盘顺序读写等;并对系统测试的指标进行分析,以确保系统性能正常,以便在稳定正常的系统环境下进行应用性能测试;
所述安装生物信息学软件是指,进行应用测试时,在搭建测试环境后,在系统中部署应用软件,应用软件是生物信息学分析常用软件,且计算需求较高,计算耗时,具有代表性,在本发明中我们选用序列比对软件BWA和序列拼接软件VELVET进行测试;对于测试用例的的规模,要能涵盖或是代表大部分用户的生物信息分析的数据规模,我们选用ILLUMIA的测序数据进行分析;
选择具有代表性的测试用例: 统计两款软件在计算平台下的运行时间,并监控资源消耗情况,最后整理出完成的测试信息。
本发明公开的生物信息学高性能计算平台的测试方法的有益效果是:本方法所述测试环境适合生物信息学软件运行,可以为用户提供配置依据;对于测试平台进行基本系统性能测试,确保测试环境正常;测试软件选择是生物信息学中常用且计算相对耗时的两款软件,在不同生物信息学研究中具有通用性;应用软件的测试用例规模足够大,是人类十倍覆盖度的测试数据,数据规模基本能够涵盖目前生物信息学分析大部分计算规模。
附图说明
附图1为本发明测试方法的流程图。
具体实施方式
下面通过附图,对本发明所述一种生物信息学高性能计算平台的测试方法做进一步详细说明,并不造成对本发明的限制。
本发明的目的是设计一种生物信息学计算平台的标准benchmark测试方法和流程,使生物信息学计算平台的测试标准,规范化,为生物信息学计算平台的性能评估提供参考和依据。
本发明的构思时这样的:先确定适用于生物信息学平台的硬件平台,搭建测试环境,如安装操作系统,系统中部署软件,如intel编译器,mpi等,安装生物信息学软件,选择具有代表性的测试用例;其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410196381.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用