[发明专利]一种人工智能管控平台在审
| 申请号: | 202111174467.4 | 申请日: | 2021-10-09 |
| 公开(公告)号: | CN113869497A | 公开(公告)日: | 2021-12-31 |
| 发明(设计)人: | 张丽妙 | 申请(专利权)人: | 张丽妙 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 陈彦朝 |
| 地址: | 516600 广东省汕尾*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 人工智能 平台 | ||
本发明公开了一种人工智能管控平台,包括:计算集群深度学习分系统,用于通过计算集群,创建人工智能深度学习集群基础;深度学习多模部署分系统,用于通过深度学习集群基础,搭建多种深度学习框架,部署多模式深度学习训练环境;监测训练多维评估分系统,用于通过多模式深度学习训练系统监测,对深度学习训练任务运行性能进行多维度评估;资源调度智能管控分系统,用于根据多维度评估分析,对计算集群深度学习分系统、深度学习多模部署分系统、监测训练多维评估分系统资源进行集成调度、智能管控。
技术领域
本发明涉及人工智能技术领域,更具体地说,本发明涉及一种人工智能管控平台。
背景技术
目前,在部署私有人工智能AI服务时,通常需要多种型号服务器、配备多个型号的CPU、GPU;根据业务,需要在不同服务器上分别安装使用TensorFlow、Caffe、MXNet等多种计算框架,同时维护多个版本;训练样本数据需要频繁拷贝管理,多个算法的训练模型、应用彼此隔离;需要为每个训练任务分配、调节时间片、服务器等资源;往往被困扰在超参数调优等使用细节中;随着人工智能AI利用规模的扩大,基础计算环境的管控,成为制约企业高效部署人工智能AI的障碍;因此,有必要提出一种人工智能管控平台,以至少部分地解决现有技术中存在的问题。
发明内容
在发明内容部分中引入了一系列简化形式的概念,这将在具体实施方式部分中进一步详细说明。本发明的发明内容部分并不意味着要试图限定出所要求保护的技术方案的关键特征和必要技术特征,更不意味着试图确定所要求保护的技术方案的保护范围。
为至少部分地解决上述问题,本发明提供了一种人工智能管控平台,其特征在于,包括:
计算集群深度学习分系统,用于通过计算集群,创建人工智能深度学习集群基础;
深度学习多模部署分系统,用于通过深度学习集群基础,搭建多种深度学习框架,部署多模式深度学习训练环境;
监测训练多维评估分系统,用于通过多模式深度学习训练系统监测,对深度学习训练任务运行性能进行多维度评估;
资源调度智能管控分系统,用于根据多维度评估分析,对计算集群深度学习分系统、深度学习多模部署分系统、监测训练多维评估分系统资源进行集成调度、智能管控。
优选的,计算集群深度学习分系统包括:
计算集群硬件子系统,用于通过集群硬件搭建、扩展,建立深度学习的集群硬件基础;
计算集群软件子系统,用于通过集群软件创建、运行,建立深度学习的集群软件基础。
优选的,深度学习多模部署分系统包括:
深度学习框架子系统,用于通过深度学习集群基础,集成多种深度学习框架;
多模式部署子系统,在集成多种深度学习框架中,部署多模式深度学习训练环境。
优选的,监测训练多维评估分系统包括:
训练集群监控子系统,在多模式深度学习训练过程中,监控计算集群深度学习分系统;
平台部署分析子系统,对深度学习多模部署分系统进行部署分析;
任务过程评估子系统,通过监控、分析以及对训练全过程监控,对深度学习训练任务运行性能进行多维度评估。
优选的,资源调度智能管控分系统包括:
集群调度管控子系统,用于根据多维度评估结果,对计算集群深度学习分系统进行集群调度智能管控;
智能运维管控子系统,用于在集群调度智能管控基础上,对深度学习多模部署分系统进行智能升级扩展;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张丽妙,未经张丽妙许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111174467.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:WebGIS系统的搭建方法
- 下一篇:一种可调理血压的银杏蛹虫草冲剂





