[发明专利]作业实际运行时间的预测方法有效
| 申请号: | 201811556853.8 | 申请日: | 2018-12-19 |
| 公开(公告)号: | CN109636212B | 公开(公告)日: | 2023-06-16 |
| 发明(设计)人: | 孙广中;吴燕晶 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F16/2458 |
| 代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;郑哲 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 作业 实际 运行 时间 预测 方法 | ||
本发明公开了一种作业实际运行时间的预测方法,包括:采集历史数据,从而计算每一用户的估计运行时间准确率分布,即R值分布;根据每一用户的R值分布对所有用户进行聚类;对于待预测的新作业,根据新作业所属的用户及聚类结果,提取相应用户所属类别下所有用户的历史数据作为训练数据;利用训练数据中各作业的作业特征训练用于预测R值的多个不同类型的预测模型;将新作业中的作业特征分别输入至每一训练好的预测模型中,并综合所有预测模型的输出结果计算新作业的R值,进而预测新作业实际运行时间。该方法一定程度上改善基于作业历史和基于作业内在特征的建模方法的局限性,使得作业的运行时间预测更加的准确。
技术领域
本发明涉及高性能作业性能预测技术领域,尤其涉及一种作业实际运行时间的预测方法。
背景技术
在高性能计算领域,对提交的作业进行运行时间预测是一项非常重要的研究。准确的预测高性能计算作业的运行时间,对于资源的合理分配和作业的合理调度有非常重要的意义。
一种常用于作业运行时间预测的方法是基于作业历史的预测。基于作业历史的预测指的是,利用计算平台上历史运行作业的信息对当前提交的作业进行运行时间预测。运行作业的信息指的是作业泛属性即作业所用的CPU核数、用户估计作业运行时间、用户作业提交的等待队列等属性。当前基于作业历史的运行时间预测的建模主要有三种方法。其一是利用作业之间的相似性,这种研究方法通过在历史任务数据中找到和当前最相似的任务,然后再利用这些相似的任务来预测当前任务的运行时间。其二是使用回归方法,这种研究方法通过构建各种回归模型比如线性回归模型,从而对新任务进行运行时间预测。其三是利用用户估计运行时间准确率,这种方法不是直接预测作业的运行时间而是通过预测用户估计时间的准确性间接的预测作业的运行时间。它所基于的公式为:用户估计运行时间准确率=作业实际的运行时间/用户估计时间。基于作业历史的预测,这类研究方法的局限性主要在于作业泛属性和作业运行时间的关联性无法保证。
另一种常用于作业运行时间预测的方法是基于作业内在特征的预测。用户提交的运行作业有其内在的特征,比如输入参数,输入文件,配置参数,通信过程以及资源等。基于作业内在特征的预测指的是,利用作业内在的特征作为输入,然后利用各类算法比如机器学习算法进行作业运行时间预测。这类研究方法的局限性在于,它只适用与内在特征和运行时长有明确关系的一类作业。
发明内容
本发明的目的是提供一种作业实际运行时间的预测方法,可以准确实现作业实际运行时间的预测。
本发明的目的是通过以下技术方案实现的:
一种作业实际运行时间的预测方法,包括:
采集历史数据,从而计算每一用户的估计运行时间准确率分布,即R值分布;
根据每一用户的R值分布对所有用户进行聚类;
对于待预测的新作业,根据新作业所属的用户及聚类结果,提取相应用户所属类别下所有用户的历史数据作为训练数据;
利用训练数据中各作业的作业特征训练用于预测R值的多个不同类型的预测模型;
将新作业中的作业特征分别输入至每一训练好的预测模型中,并综合所有预测模型的输出结果计算新作业的R值,进而预测新作业实际运行时间。
由上述本发明提供的技术方案可以看出,从用户建模的角度出发,根据R值分布对用户进行了聚类,后续过程中不是直接预测作业的运行时间而是通过预测R值的大小间接的预测作业的运行时间,本发明能在一定程度上改善基于作业历史和基于作业内在特征的建模方法的局限性,使得作业的运行时间预测更加的准确。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811556853.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





