[发明专利]多精度神经网络模型实现方法及系统有效
| 申请号: | 202110753398.6 | 申请日: | 2021-07-02 |
| 公开(公告)号: | CN113469349B | 公开(公告)日: | 2022-11-08 |
| 发明(设计)人: | 鲍丹;季圣洁;沈沙 | 申请(专利权)人: | 上海酷芯微电子有限公司 |
| 主分类号: | G06N3/063 | 分类号: | G06N3/063 |
| 代理公司: | 上海段和段律师事务所 31334 | 代理人: | 黄磊;郭国中 |
| 地址: | 200082 上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 精度 神经网络 模型 实现 方法 系统 | ||
本发明提供了一种多精度神经网络模型实现方法及系统,包括:获取硬件加速器的算子约束条件,生成多精度神经网络模型的计算图算子配置信息;对多精度神经网络模型进行结构分析,结合计算图算子配置信息得到不同数值精度与计算图算子的对应关系;根据不同数值精度与计算图算子的对应关系,对多精度神经网络模型的参数进行调整,获取多精度神经网络模型在降低数值精度后的性能补偿;根据参数调整后的多精度神经网络模型,产生各层次配置信息,根据各层次配置信息将多精度神经网络模型部署到硬件加速器。本发明在将复杂神经网络部署到特定硬件加速器时,保证算子采用不同的数值精度组合,以获得优化的功耗、效率和存储带宽,降低模型部署难度。
技术领域
本发明涉及计算机技术领域,具体地,涉及一种多精度神经网络模型实现方法及系统。
背景技术
由于复杂任务的神经网络计算复杂度高,在特定硬件加速器上需要进行多精度的数值表示方法,以获得优化的功耗和效率,这一需求为模型部署增加了难度。
现有技术中,公开号为CN110942139A的中国专利申请,公开了“深度学习神经网络部署系统及其方法”,这种部署方法,虽然能够支持多种神经网络框架识别、解析、和部署模型的生成,但是不能支持多种精度模型在特定硬件加速器上的实现。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种多精度神经网络模型实现方法及系统。
根据本发明提供的一种多精度神经网络模型实现方法,包括:
生成步骤:获取硬件加速器的算子约束条件,生成多精度神经网络模型的计算图算子配置信息;
对应关系确认步骤:对多精度神经网络模型进行结构分析,结合所述计算图算子配置信息得到不同数值精度与计算图算子的对应关系;
调整步骤:根据不同数值精度与计算图算子的对应关系,对多精度神经网络模型的参数进行调整,获取多精度神经网络模型在降低数值精度后的性能补偿;
配置生成步骤:根据参数调整后的多精度神经网络模型,产生各层次配置信息,根据各层次配置信息将多精度神经网络模型部署到所述硬件加速器。
优选地,所述生成步骤包括:
根据所述硬件加速器的算子数值精度约束条件,生成多精度神经网络模型计算图算子配置信息。
优选地,所述对应关系确认步骤包括:
对多精度神经网络模型进行结构分析,生成多精度神经网络模型的结构信息;
根据所述计算图算子配置信息和所述结构信息,生成计算图算子与数值精度的对应关系。
优选地,对多精度神经网络模型的参数进行调整的方法包括:重新训练方式或统计分析方式;
对于重新训练方式,根据计算图算子与算子数值精度对应关系增加训练节点到计算图中,所述计算图包括框架构建,所述训练节点包括采用算子构建;
对于统计分析方式,根据计算图算子与算子数值精度对应关系增加统计节点到计算图中,所述统计节点包括采用统计量构建;或者,不增加统计节点到计算图中,直接采用独立于计算图的分析。
优选地,所述配置生成步骤包括:
对调整好模型参数的多精度神经网络模型,格式化生成各层次的配置信息,所述配置信息格式来自于所述硬件加速器的需求。
根据本发明提供的一种多精度神经网络模型实现系统,包括:
生成模块:获取硬件加速器的算子约束条件,生成多精度神经网络模型的计算图算子配置信息;
对应关系确认模块:对多精度神经网络模型进行结构分析,结合所述计算图算子配置信息得到不同数值精度与计算图算子的对应关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海酷芯微电子有限公司,未经上海酷芯微电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110753398.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种特种材料射线灭菌车
- 下一篇:图像自动化调试方法、系统、介质及设备





