[发明专利]一种基于PBS作业调度管理集群负载的实现方法有效
| 申请号: | 201710108069.X | 申请日: | 2017-02-27 |
| 公开(公告)号: | CN106897133B | 公开(公告)日: | 2020-09-29 |
| 发明(设计)人: | 胡叶 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
| 主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50 |
| 代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 张亮 |
| 地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 pbs 作业 调度 管理 集群 负载 实现 方法 | ||
1.一种基于PBS作业调度管理集群负载的实现方法,其特征在于,包括如下步骤:
步骤1:定义数据模型,阈值配置文件为config.xml、节点IPMI配置文件为node_ipmi.conf、扫描输出文件为scaner.conf、节点实时开关机状态文件为ipmi-state.conf、策略输出文件为policy.conf;
步骤2:定义阈值配置模块,配置信息包括缓冲池空闲节点数、单次最多操作节点数、节点保护时长以及服务轮询时长,将配置信息存放到阈值配置文件config.xml中;
步骤3:定义扫描模块,根据配置的服务轮询时长定时扫描,通过PBS作业调度器得到当前集群的节点实时开关机状态、节点状态列表、作业信息列表以及负载操作信息,分析节点实时开关机状态和节点状态列表得到离线节点列表和空闲节点列表,将节点实时开关机状态存放到节点实时开关机状态文件ipmi-state.conf中,将离线节点列表、空闲节点列表、作业信息列表以及负载操作信息存放到扫描输出文件scaner.conf中并到记录数据库日志;
步骤4:定义策略模块,设置定时以扫描模块获取的当前集群的离线节点列表和空闲节点列表、作业信息列表作为输入,结合负载策略判断当前是否需要进行节点开关机以及如何操作,将负载操作信息提供给扫描模块同时存入策略输出文件policy.conf中;
步骤5:创建扫描脚本并运行,根据配置的服务轮询时长定时扫描,扫描分析得到节点实时开关机状态、离线节点列表、空闲节点列表和作业信息列表,
判断策略输出文件policy.conf中有无负载操作信息,
若有,将节点实时开关机状态存入节点实时开关机状态文件ipmi-state.conf中,将离线节点列表、空闲节点列表、作业信息列表和负载操作信息存放到扫描输出文件scaner.conf中并记录到数据库日志,
若没有,则将节点实时开关机状态存入节点实时开关机状态文件ipmi-state.conf中,将离线节点列表、空闲节点列表、作业信息列表存放到扫描输出文件scaner.conf中并记录到数据库日志;
步骤6:创建策略脚本并运行,定时判断当前是否存在扫描输出文件scaner.conf,
若存在,以扫描模块获取的当前集群的离线节点列表和空闲节点列表、作业信息列表作为输入,结合负载策略判断当前是否需要进行节点开关机以及如何操作,将负载操作信息提供给扫描模块同时存入策略输出文件policy.conf中,
若不存在,则等待下次轮询。
2.如权利要求1所述的一种基于PBS作业调度管理集群负载的实现方法,其特征在于,步骤1中的节点IPMI配置文件node_ipmi.conf存放节点配置信息包括节点主机名和IPMI地址信息。
3.如权利要求1所述的一种基于PBS作业调度管理集群负载的实现方法,其特征在于,步骤3中的PBS作业调度器采用PBS Torque作业调度器。
4.如权利要求1所述的一种基于PBS作业调度管理集群负载的实现方法,其特征在于,步骤3中定义扫描模块具体步骤如下:
步骤31.设置通过PBS作业调度器同时根据配置的服务轮询时长定时扫描;
步骤32.通过节点IPMI配置文件node_ipmi.conf文件获取节点的ipmi地址信息,根据IPMI命令获取节点实时开关机状态,存入节点实时开关机状态文件ipmi-state.conf中;
IPMI命令返回的节点状态为on、off或unknown三种;
步骤33.根据PBS命令获取集群当前的节点状态列表以及作业信息列表;
PBS命令返回的节点状态为idle,busy,runnning或down四种;
步骤34.分析节点实时开关机状态,节点状态列表以及作业信息列表,得到当前空闲节点列表、离线节点列表以及等待作业数量并存入扫描输出文件scaner.conf中;
步骤35.判断是否存在策略输出文件policy.conf;
若存在,将当前空闲节点列表当前空闲节点列表、离线节点列表以及等待作业数量和负载操作信息存入数据库日志;
若不存在,则只将当前空闲节点列表当前空闲节点列表、离线节点列表以及等待作业数量存入数据库日志。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710108069.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服务器任务调度的方法以及装置
- 下一篇:一种定位功能管理方法及装置





