[发明专利]针对部署在终端的模型进行算力分配的方法、装置和设备在审
申请号: | 202310617475.4 | 申请日: | 2023-05-26 |
公开(公告)号: | CN116737369A | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 张长浩;申书恒;傅欣艺;王维强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 朱文杰 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本说明书实施例公开了一种针对部署在终端的模型进行算力分配的方法、装置和设备,所述方法可在确定终端上安装的目标应用中待分配算力的多个模型后,将所述多个模型的算力档位和执行顺序作为参数,建立以所述多个模型对应的全局业务价值为优化目标,以所述多个模型的算力消耗为约束条件的最优化问题;对所述最优化问题进行求解得到针对所述多个模型的最优算力分配方案;基于所述最优算力分配方案在所述终端上为所述多个模型分配算力。 | ||
搜索关键词: | 针对 部署 终端 模型 进行 分配 方法 装置 设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310617475.4/,转载请声明来源钻瓜专利网。