[发明专利]资源推荐方法、装置、电子设备及机器可读存储介质有效
| 申请号: | 202011446780.4 | 申请日: | 2020-12-08 |
| 公开(公告)号: | CN112559859B | 公开(公告)日: | 2023-06-30 |
| 发明(设计)人: | 叶铿 | 申请(专利权)人: | 杭州海康威视系统技术有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06N3/0464;G06N3/047;G06N3/084;G06Q50/00 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 杨春香 |
| 地址: | 310051 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 资源 推荐 方法 装置 电子设备 机器 可读 存储 介质 | ||
1.一种资源推荐方法,其特征在于,包括:
获取任务提交信息,所述任务提交信息包括期望最大运行时长以及需要运行的目标数据量;
确定所述目标数据量是否处于预先构建的数据集的范围内;其中,所述预先构建的数据集包括多条任务运行数据,所述任务运行数据包括数据量、资源值以及运行时长的对应关系;
若所述目标数据量处于所述预先构建的数据集的范围内,依据期望最大运行时长、所述目标数据量以及所述预先构建的数据集进行资源推荐;
其中,所述依据期望最大运行时长、所述目标数据量以及所述预先构建的数据集进行资源推荐,包括:
依据所述期望最大运行时长,以及所述目标数据量,确定所述预先构建的数据集中是否存在匹配的目标任务运行数据;
若不存在匹配的目标任务运行数据,确定所述期望最大运行时长和所述目标数据量归属的目标聚类簇;其中,所述预先构建的数据集中的聚类簇是依据任务运行数据包括的运行时长和数据量进行聚类得到的;
依据所述目标聚类簇中各任务运行数据与所述期望最大运行时长、所述目标数据量的相似度,按照相似度从高到低的顺序,将前k个任务运行数据确定为候选任务运行数据;
依据所述k个候选任务运行数据,利用预设资源推荐系统进行资源推荐;
其中,所述确定所述期望最大运行时长和所述目标数据量归属的目标聚类簇,包括:
确定所述预先构建的数据集的至少一个聚类簇中是否存在所述期望最大运行时长和所述目标数据量归属的目标聚类簇;
若不存在,则按照预设步长,缩小所述任务运行数据包括的运行时长,并对运行时长缩小后的任务运行数据进行聚类,直至对运行时长缩小后的任务运行数据进行聚类得到的至少一个聚类簇中存在所述期望最大运行时长和所述目标数据量归属的目标聚类簇,或,当缩小后的运行时长达到预设阈值,且对运行时长缩小后的任务运行数据进行聚类得到的至少一个聚类簇中不存在所述期望最大运行时长和所述目标数据量归属的目标聚类簇时,将运行时长缩小后的所述数据集作为所述目标聚类簇。
2.根据权利要求1所述的方法,其特征在于,所述依据期望最大运行时长、所述目标数据量以及所述预先构建的数据集进行资源推荐,还包括:
若存在匹配的目标任务运行数据,则依据所述目标任务运行数据进行资源推荐。
3.根据权利要求1或2所述的方法,其特征在于,所述预先构建的数据集通过以下方式构建:
获取第一数量的YARN系统运行过的真实任务运行数据;
依据所述第一数量的真实任务运行数据构建分段线性回归模型;
依据所述分段线性回归模型,构建第二数量的模拟任务运行数据;
依据所述第一数量的真实任务运行数据,以及所述第二数量的模拟任务运行数据,构建所述数据集。
4.根据权利要求1或2所述的方法,其特征在于,所述任务提交信息还包括目标业务模型;
所述确定所述目标数据量是否处于预先构建的数据集的范围内,包括:
从预先构建的数据集中确定与所述目标业务模型匹配的目标数据集;
确定所述目标数据量是否处于所述目标数据集的范围内;
其中,不同业务模型对应不同的分段线性回归模型,且不同业务模型对应不同数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视系统技术有限公司,未经杭州海康威视系统技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011446780.4/1.html,转载请声明来源钻瓜专利网。





