[发明专利]一种深度学习开发环境的构建方法、装置、设备及介质在审
| 申请号: | 201911244714.6 | 申请日: | 2019-12-06 |
| 公开(公告)号: | CN111090456A | 公开(公告)日: | 2020-05-01 |
| 发明(设计)人: | 袁绍 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
| 主分类号: | G06F8/71 | 分类号: | G06F8/71;G06F9/50 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 陈丽 |
| 地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 深度 学习 开发 环境 构建 方法 装置 设备 介质 | ||
本申请公开了一种深度学习开发环境的构建方法、装置、电子设备及计算机可读存储介质,该深度学习开发环境的构建方法包括:接收输入的硬件资源设置参数和深度学习训练框架类型;基于预设的开发环境调度系统,根据硬件资源设置参数为深度学习开发环境分配硬件资源,获取并加载对应类型的深度学习训练框架容器镜像;基于开发环境调度系统,加载与硬件资源适配的驱动,启动深度学习开发环境。本申请基于预设的开发环境调度系统,以容器部署方式可在大规模GPU集群中快速有效地搭建深度学习开发环境,减轻开发人员工作量,并有效改善开发环境搭建过程中的局限性,提高了用户的灵活分配性,极大便利了用户操作、提高了开发环境的搭建效率与质量。
技术领域
本申请涉及人工智能技术领域,特别涉及一种深度学习开发环境的构建方法、装置、电子设备及计算机可读存储介质。
背景技术
随着人工智能(AI)行业的蓬勃发展,AI应用所需的计算资源和数据资源越来越庞大。通常,AI应用多基于GPU集群构建,但随着集群规模的扩大,如何快速分配GPU计算资源以搭建AI训练环境成为了一个亟需解决的问题。
当前业界中普遍由集群管理员手动分配资源、手动创建深度学习开发环境。由于GPU集群规模越来越过大,手动分配的复杂度和难度越来越大;并且现有技术中依赖虚拟机搭建AI环境受限较多,使得手工操作工作量大、过程繁琐、灵活性差。鉴于此,提供一种解决上述技术问题的方案,已经是本领域技术人员所亟需关注的。
发明内容
本申请的目的在于提供一种深度学习开发环境的构建方法、装置、电子设备及计算机可读存储介质,以便在大规模GPU集群中快速有效地搭建深度学习开发环境,减轻开发人员工作量并提高工作效率。
为解决上述技术问题,第一方面,本申请公开了一种深度学习开发环境的构建方法,包括:
接收输入的硬件资源设置参数和深度学习训练框架类型;
基于预设的开发环境调度系统,根据所述硬件资源设置参数为所述深度学习开发环境分配硬件资源,获取并加载对应类型的深度学习训练框架容器镜像;
基于所述开发环境调度系统,加载与硬件资源适配的驱动,启动所述深度学习开发环境。
可选地,所述硬件资源设置参数包括CPU数和GPU数。
可选地,所述获取并加载对应类型的深度学习训练框架容器镜像,包括:
判断本地是否存在对应类型的深度学习训练框架容器镜像;
若有,则加载本地的所述深度学习训练框架容器镜像;
若无,则从预设docker容器镜像管理仓库中获取并加载所述深度学习训练框架容器镜像。
可选地,所述加载与硬件资源适配的驱动,包括:
通过预设docker驱动映射程序加载与硬件资源适配的驱动。
可选地,在所述启动所述深度学习开发环境之后,还包括:
启动深度学习训练框架中的工具服务。
可选地,所述启动所述深度学习开发环境,包括:
运行所述深度学习开发环境并配置登录密码。
第二方面,本申请还公开了一种深度学习开发环境的构建装置,包括:
接收模块,用于接收输入的硬件资源设置参数和深度学习训练框架类型;
构建模块,用于基于预设的开发环境调度系统,根据所述硬件资源设置参数为所述深度学习开发环境分配硬件资源,获取并加载对应类型的深度学习训练框架容器镜像;加载与硬件资源适配的驱动,启动所述深度学习开发环境。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911244714.6/2.html,转载请声明来源钻瓜专利网。





