[发明专利]模型翻译方法、装置及计算机可读存储介质在审
| 申请号: | 202110209225.8 | 申请日: | 2021-02-24 |
| 公开(公告)号: | CN112905189A | 公开(公告)日: | 2021-06-04 |
| 发明(设计)人: | 高威特;张楠赓 | 申请(专利权)人: | 嘉楠明芯(北京)科技有限公司 |
| 主分类号: | G06F8/51 | 分类号: | G06F8/51;G06N3/04 |
| 代理公司: | 北京市中伦律师事务所 11410 | 代理人: | 钟锦舜 |
| 地址: | 100094 北京市海淀区东北旺西*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 翻译 方法 装置 计算机 可读 存储 介质 | ||
本申请提供了一种模型翻译方法、装置及计算机可读存储介质,其中该方法包括:获取待翻译模型以及训练数据集;将所述待翻译模型的神经网络层转换成目标处理器支持的目标神经网络层,得到目标模型;根据所述训练数据集对所述目标模型进行训练,以确定所述目标模型中各个目标神经网络层的参数。利用上述方法,能够将特定框架下生成的模型转换成目标处理器能够运行的目标模型,从而扩展了模型的实施场景。
技术领域
本申请属于人工智能领域,具体涉及一种模型翻译方法、装置及计算机可读存储介质。
背景技术
本部分旨在为权利要求书中陈述的本申请的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
工程人员通常会采用诸如TensorFlow框架创建神经网络模型,也有的采用Caffe框架或Darknet框架创建神经网络模型。
然而,在现有技术中,不同框架下创建的神经网络模型均只能在特定的处理器上运行,换言之,基于这些常用框架训练出的模型可能无法在其他通用的处理器直接运行,也即模型和处理器存在格式不兼容的问题。因此,如何解决该模型和处理器之间存在的格式不兼容的问题,成为本领域亟待解决的技术问题。
发明内容
本申请实施例提出了一种模型翻译方法、装置及计算机可读存储介质。利用这种模型方法及装置,能够解决上述模型和处理器之间存在的格式不兼容的技术问题。
本申请的实施例中提供了以下方案。
第一方面,提供一种模型翻译方法,包括:获取待翻译模型以及训练数据集,其中,所述待翻译模型包含多个神经网络层;将所述待翻译模型的神经网络层转换成目标处理器支持的目标神经网络层,得到目标模型;根据所述训练数据集对所述目标模型进行训练,以确定所述目标模型中各个目标神经网络层的参数。
在一种可能的实施方式中,获取待翻译模型,包括:基于编程界面接收所述待翻译模型的程序代码,确定待翻译模型;其中,所述编程界面禁用目标处理器不支持的函数。
在一种可能的实施方式中,将所述待翻译模型的神经网络层转换成目标处理器支持的目标神经网络层,包括:基于待翻译模型中神经网络层的函数功能与目标处理器支持的目标神经网络层的函数功能之间的等效关系,确定待翻译模型中神经网络层与目标处理器支持的目标神经网络层之间的层映射关系;基于层映射关系,将待翻译模型中的神经网络层等效转换为目标处理器支持的目标神经网络层。
在一种可能的实施方式中,确定待翻译模型中神经网络层与目标处理器支持的目标神经网络层之间的层映射关系,还包括:基于等效关系确定待翻译模型中指定神经网络层与目标处理器支持的目标神经网络层之间的层映射关系;和/或,基于等效关系确定待翻译模型中指定神经网络层与目标处理器支持的目标神经网络层组合之间的层映射关系;和/或,基于等效关系确定待翻译模型中指定神经网络层组合与目标处理器支持的目标神经网络层之间的层映射关系;和/或,基于等效关系确定待翻译模型中指定神经网络层组合与目标处理器支持的目标神经网络层组合之间的层映射关系。
在一种可能的实施方式中,所述方法还包括:将所述训练数据集中的样本数据输入所述目标模型,以确定所述目标模型的至少一个目标神经网络层的输入值的数值范围;根据所述输入值的数值范围和预设量化规则,确定所述目标模型中至少一个目标神经网络层的量化参数。
在一种可能的实施方式中,所述方法还包括:获取所述目标模型的待处理对象;将所述待处理对象输入所述目标模型,以确定所述目标模型的至少一个目标神经网络层的输入值的数值范围;根据所述输入值的数值范围和预设量化规则,确定所述目标模型中至少一个目标神经网络层的量化参数。
在一种可能的实施方式中,确定所述目标模型中各个目标神经网络层的参数之后,所述方法还包括:根据所述目标模型的各个目标神经网络层及对应的参数生成输出代码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于嘉楠明芯(北京)科技有限公司,未经嘉楠明芯(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110209225.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像融合方法以及装置
- 下一篇:一种基于砂石消防的安全设备





