[发明专利]一种推理加速方法、设备及存储介质在审
申请号: | 202310580983.X | 申请日: | 2023-05-22 |
公开(公告)号: | CN116776978A | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 李克森;赵大川;游亮 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06F16/2455;G06F16/22;G06F16/28 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 邓春燕 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本申请实施例提供一种推理加速方法、设备及存储介质。提出在推理执行阶段中,响应于推理指令而为推理模型中各个待加速的推理操作分别确定在本轮推理过程中所对应的加速需求参数值,这样,可实时地感知到各个推理操作所对应加速需求参数值在推理执行阶段中的动态变化情况,从而可跟随加速需求参数的动态变化而自适应地为各个推理操作匹配到合适的加速算子,保证了推理模型中的各个待加速的推理操作在每一轮推理过程中均可匹配到合适的加速算子。与传统的在推理初始化阶段进行算子匹配并固化到推理执行阶段的方案相比,可实现加速算子的自适应匹配,从而支持推理执行阶段中复杂多变的推理指令,进而保证每一轮推理过程中的推理加速性能。 | ||
搜索关键词: | 一种 推理 加速 方法 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310580983.X/,转载请声明来源钻瓜专利网。