[发明专利]一种基于空闲历史信息的计算阵列节能方法无效
| 申请号: | 201010282077.4 | 申请日: | 2010-09-15 |
| 公开(公告)号: | CN101943944A | 公开(公告)日: | 2011-01-12 |
| 发明(设计)人: | 陈海涛;卢宇彤;周恩强;谢旻;曹宏嘉;董勇;蒋艳凰;所光 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
| 主分类号: | G06F1/32 | 分类号: | G06F1/32;G06F9/50 |
| 代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 郭敏 |
| 地址: | 410073 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 空闲 历史 信息 计算 阵列 节能 方法 | ||
技术领域
本发明涉及高性能计算系统计算阵列的节能方法。
背景技术
随着高性能计算系统技术的不断发展,新一代大规模并行计算系统的研制面临许多新的挑战。特别是随着系统性能的不断提升,规模越来越庞大,系统的能耗飞速增长,造成了大规模计算系统的能耗危机。系统能耗和系统性能的比值正成为高性能计算的主要评价指标之一。
高性能计算系统通常包括前端服务阵列、计算阵列、后端存储阵列三个组成部分。计算阵列由大量的计算结点组成,对外提供作业的执行服务。计算阵列作为高性能计算阵列的主要能耗部件,是能耗优化研究和工程设计的重点。目前常见的计算阵列节能方法包括:
1)限制可用结点数量的节能方法。根据计算系统的历史平均利用率P,关闭计算阵列中百分比为(1-P)的计算结点,达到节能的目的。该方法会增加作业的平均等待时间,降低用户满意度。此外该方法不能适应系统利用率频繁变化的用户环境。
2)定时休眠空闲结点的节能方法。管理员手工设定一个时间参数T。当计算结点空闲时间达到T后,将空闲结点置于S3休眠状态。S3休眠状态是ACPI(Advanced Configuration and Power Interface Specification)标准定义的计算系统的一种低功耗状态,相比开机状态能够节省90%-95%的能耗。广泛应用的slurm高性能资源管理系统即采用该手工设定时间参数T的节能方法。如果T参数的设定时间过短,则计算结点可能刚进入休眠状态,很快又被分配作业然后被唤醒,导致计算结点状态切换频繁,影响系统稳定性。如果T参数的设定时间过长,则计算结点空闲很长时间后才进入休眠状态,影响节能效果。
当前绝大多数计算结点生产厂商和通用操作系统均支持ACPI标准规定的S3休眠状态,为基于S3休眠状态的节能方法提供了支持。由于用户作业提交的不均衡特性和作业调度策略的部分保序特性,计算阵列运行过程中存在大量的空闲计算结点。如何对这些空闲的计算结点进行节能设计,是本领域技术人员极为关注的技术问题。
发明内容
本发明要解决的技术问题在于:针对高性能计算系统计算阵列的节能问题,提出一种基于空闲历史信息的计算结点节能方法,利用结点空闲时间的历史记录动态自适应地控制计算结点进入S3休眠状态,达到较好的节能效果,同时维持结点的能耗状态切换次数在一个可控的低水平。
为了解决上述技术问题,本发明的技术方案为:为每个计算结点建立一个独立的空闲历史信息队列,根据空闲历史信息队列对每个计算结点的能耗状态进行独立控制。每当计算结点上作业被释放时,结合管理员配置的结点能耗状态切换次数限制和空闲历史信息队列设定空闲结点进入S3休眠状态的时间点。结点从空闲状态切换到S3休眠状态、S3休眠状态切换到开机状态均算一次能耗状态切换。每当该计算结点从空闲状态加载作业或者S3休眠状态被重新唤醒然后加载作业时,将该次空闲的开始时间和空闲时间长度加入空闲历史信息队列。根据大量高性能计算系统的运行数据统计,结点的空闲时间长度具有相似性,根据结点的空闲历史规律预测结点未来的空闲时间长度具有较高的准确度,这奠定了本发明的理论基础。
具体技术方案为:
第一步,构造计算阵列节能系统。计算阵列节能系统是部署在高性能计算系统前端服务阵列中的服务器上的软件包,由能耗状态调节模块和能耗状态控制模块组成。能耗状态调节模块是节能优化决策模块,构造计算结点的空闲历史信息队列,根据空闲历史信息设定计算结点进入S3休眠状态的时间点,将计算结点休眠的时间点传递给能耗控制模块。能耗状态控制模块是节能优化实施模块,负责根据能耗状态调节模块指定的时间点将空闲计算结点置于S3休眠状态,在已休眠计算结点被分配作业后唤醒计算结点。
第二步,设定节能参数:历史信息队列的时间窗口HISTORY_WINDOW(单位为秒),其取值范围为7天到1个月,其取值决定了历史信息队列中保存的记录的时间约束;计算结点一天中允许能耗状态切换的次数SWITCHS_LIMIT,其取值范围为2到10次;结点从空闲状态进入S3休眠状态的最短时间限制MINI_SUSPEND_TIME,其取值范围为1到5分钟,避免过于频繁的结点能耗状态切换。
第三步,能耗状态调节模块构造空闲历史信息队列,根据空闲历史信息设定计算结点进入S3休眠状态的时间点。方法是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010282077.4/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





