[发明专利]GPU资源配置方法、装置、电子设备及存储介质在审
| 申请号: | 202211408163.4 | 申请日: | 2022-11-10 | 
| 公开(公告)号: | CN115700486A | 公开(公告)日: | 2023-02-07 | 
| 发明(设计)人: | 蒲永杰;张广勇;段亦涛 | 申请(专利权)人: | 网易有道信息技术(北京)有限公司 | 
| 主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N5/04 | 
| 代理公司: | 北京维昊知识产权代理事务所(普通合伙) 11804 | 代理人: | 刁益帆 | 
| 地址: | 100094 北京市海淀区西北*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | 本发明的实施方式提供了一种GPU资源配置方法、装置、电子设备及存储介质。该方法包括:响应于推理任务请求,在若干服务器中确定执行推理任务请求的执行服务器;其中,若干服务器的内存中部署有多个待分配GPU的推理服务的服务模型,每一服务器中部署有用于为推理服务分配GPU的GPU管理单元,执行服务器上部署有执行推理任务所需的目标推理服务;通过GPU管理单元为目标推理服务分配GPU。该方法通过在服务器的内存中提前部署推理服务的服务模型,使其处于已启动但待激活的状态,从而避免了线程启停所产生的延迟。本发明的方法能够显著地降低推理服务的响应时长,为用户带来了更好的体验。 | ||
| 搜索关键词: | gpu 资源配置 方法 装置 电子设备 存储 介质 | ||
【主权项】:
                暂无信息
            
                    下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
                
                
            该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易有道信息技术(北京)有限公司,未经网易有道信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211408163.4/,转载请声明来源钻瓜专利网。
- 上一篇:定制家居的产销协同方法及系统
 - 下一篇:一种开关电源的控制电路和控制方法
 





