[发明专利]一种深度学习云平台的智能缓存加速系统及方法有效

专利信息
申请号: 202210957648.2 申请日: 2022-08-10
公开(公告)号: CN115022405B 公开(公告)日: 2022-10-25
发明(设计)人: 胡安;常峰;朱建;王景祥;肖玉;刘海峰;王子磊 申请(专利权)人: 合肥中科类脑智能技术有限公司
主分类号: H04L67/568 分类号: H04L67/568;H04L67/10;G06F9/455;G06F12/0811
代理公司: 上海市锦天城律师事务所 31273 代理人: 陆少凡
地址: 230000 安徽省合肥市高新*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 深度 学习 平台 智能 缓存 加速 系统 方法
【权利要求书】:

1.一种深度学习云平台的智能缓存加速系统,其特征在于,包括:数据集使用频率统计组件、多级缓存自动部署组件、挂载数据集路径组件、根据数据集缓存的优化调度组件;

其中,所述数据集使用频率统计组件通过分析训练任务的日志信息,得出各数据集在指定时间段内的使用次数,从而决定后续部署哪些数据集作为缓存;

所述多级缓存自动部署组件根据数据集使用频率,以动态规划算法计算出收益最高的数据集,并把它们实际部署到服务器的空闲内存和/或SSD空间上;

所述挂载数据集路径组件通过判断训练任务使用的数据集是否存在本地缓存,将对应的物理路径挂载到训练任务的Docker容器中,从而保证数据集能够被训练任务访问;

所述优化调度组件,根据每个节点的缓存信息优先将训练任务调度到缓存有对应数据集的节点上,尽量将训练任务调度到包含所需数据集缓存的服务器上,从而最大限度发挥数据集缓存的加速作用。

2.根据权利要求1所述的深度学习云平台的智能缓存加速系统,其特征在于,所述数据集使用频率统计组件配置为,首先使用管理员账户获取用户鉴权令牌,向平台请求获取全部训练任务的配置信息;之后从全部所述配置信息中过滤出指定时段内提交的训练任务;通过累加得出各数据集使用次数,再进行排序,即可统计出指定时段内各数据集的使用频率。

3.根据权利要求1所述的深度学习云平台的智能缓存加速系统,其特征在于,所述多级缓存自动部署组件配置为,首先,获取数据集使用频率统计组件统计的数据集使用频率,并根据使用频率计算出每个数据集的增益值,将缓存部署转化为0-1背包问题,使用动态规划的方法计算出每个计算节点应缓存的数据集,以及对应的缓存路径;后续将对应的数据集拷贝到对应节点的缓存路径中。

4.根据权利要求1所述的深度学习云平台的智能缓存加速系统,其特征在于,所述挂载数据集路径组件,用于将计算节点上的存储路径挂载到Docker容器中从而被计算任务使用。

5.根据权利要求4所述的深度学习云平台的智能缓存加速系统,其特征在于,所述挂载数据集路径组件包括判断数据集路径组件,其用于在把数据集缓存挂载到Docker容器中之前判断缓存在服务器上是否存在。

6.根据权利要求5所述的深度学习云平台的智能缓存加速系统,其特征在于,所述判断数据集路径组件被配置为,在训练任务的Docker容器启动脚本中调用本组件,通过读取上述数据集缓存信息对数据集缓存进行判断,如果任务指定的数据集存在于指定文件中,直接把对应缓存路径挂载到所述容器中对应的本地SSD存储路径或本地tmpfs存储路径;如果不存在的话,意味着该数据集在本地节点尚未缓存,默认挂载任务配置中的远程NFS 存储路径,数据集从NFS中读取。

7.根据权利要求1所述的深度学习云平台的智能缓存加速系统,其特征在于,所述优化调度组件被配置为,首先,包含能够表示各节点的数据集缓存情况的列表一,其包括以下字段:节点IP地址、缓存数据集名称;其次,根据平台使用的调度器,修改其调度逻辑,在调度器的代码中增加查询节点缓存函数,该函数通过查询所述列表一,获得节点缓存的数据集信息;此函数在筛选节点时添加对数据集缓存的偏好,其后,返回包含对应数据集缓存的节点列表;当所有节点均不包含指定数据集缓存时,该函数筛选功能失效。

8.根据权利要求7所述的深度学习云平台的智能缓存加速系统,其特征在于,在所述函数在筛选节点时所产生的筛选步骤,是一种调度建议,实际的挂载仍然需要根据节点数据集缓存情况,选择是否挂载,即当本地缓存信息与数据库所述列表一的信息有冲突时,以本地缓存信息为准。

9.根据权利要求1-8任一项所述的深度学习云平台的智能缓存加速系统的加速方法,其特征在于,包括以下步骤:

S01.获取配置信息,统计数据集使用频率;

S02.根据所述数据集使用频率,计算数据集增益,动态规划方法计算节点缓存部署情况,完成缓存部署,得出节点缓存数据集信息;

S03.调度器查询所述节点缓存数据集信息,并进行筛选;

S04.判断所述节点是否包含任务使用数据集;

S041.如包含,则任务调度到包含数据集缓存的节点上;

S042.如不包含,则忽略此筛选,进行正常调度;

S05.读取缓存配置文件,所述缓存配置文件包括所述节点缓存数据集信息;

S06.根据所述缓存配置文件,判断数据集路径;

S061.如缓存不存在,则挂载远程NFS存储路径;

S062.如缓存在SSD中,则挂载本地SSD存储路径;

S063.如缓存在内存中,则挂载本地tmpfs存储路径;

S07.所述容器中训练任务读取所述S06步骤中挂载的所述路径,开始训练。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥中科类脑智能技术有限公司,未经合肥中科类脑智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210957648.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top