[发明专利]量化定点模型的训练方法、装置及电子设备在审

专利信息
申请号: 202111664630.5 申请日: 2021-12-31
公开(公告)号: CN114330710A 公开(公告)日: 2022-04-12
发明(设计)人: 胡建兵;袁涛 申请(专利权)人: 湖南国科微电子股份有限公司
主分类号: G06N3/08 分类号: G06N3/08;G06N3/04
代理公司: 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人: 王新哲
地址: 410131 湖南省长沙市*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 量化 定点 模型 训练 方法 装置 电子设备
【说明书】:

本申请实施例提供了一种量化定点模型的训练方法、装置及电子设备,其中方法包括:获取标准浮点训练数据和标准定点训练数据;根据深度学习浮点模型、初始深度学习定点模型、标准浮点训练数据、标准定点训练数据、预设构造函数、预设相似度计算函数确定与深度学习浮点模型对应的量化定点模型。这样,可以通过预设构造函数、预设相似度计算函数获取与深度学习浮点模型匹配的深度学习定点模型,能快速实现深度学习浮点模型量化为深度学习定点模型,提高量化的精度。

技术领域

本申请涉及神经网络技术领域,尤其涉及一种量化定点模型的训练方法、装置及电子设备。

背景技术

现有的深度学习模型的量化处理过程一般分为两个大类,第一类为训练量化处理过程,是指在深度学习模型训练时加入量化操作,在训练完成后就可以得到量化好的深度学习模型训练;第二类为后量化处理过程,指训练深度学习模型时不加入量化操作,在训练深度学习模型完成后,通过附加的量化方案来得到量化好的深度学习模型。

现有技术中后量化处理过程的流程为:(1)向深度学习模型输入训练数据或测试数据;(2)使用深度学习浮点模型进行推理;(3)统计深度学习浮点模型的输出信息;(4)对统计的输出信息进行截断映射;(5)修改深度学习浮点模型的参数映射为定点;(5)输出深度学习定点模型。在上述过程中,步骤(1)中要求用户提供训练或者测试的数据集,一般来说,训练或者测试的数据集为上千张图片,以确保在步骤(3)中可以获得与训练相同的输出信息。现有技术中后量化处理过程存在量化精度比较低的问题。

发明内容

为了解决上述技术问题,本申请实施例提供了一种量化定点模型的训练方法、装置及电子设备。

第一方面,本申请实施例提供了一种量化定点模型的训练方法,所述方法包括:

获取标准浮点训练数据和标准定点训练数据;

通过深度学习浮点模型对所述标准浮点训练数据进行训练,得到所述深度学习浮点模型各隐藏层的第一浮点输出数据,获取各隐藏层的第一浮点输出数据对应的第一波动表征数据;

通过初始深度学习定点模型对所述标准定点训练数据进行训练,得到所述初始深度学习定点模型各隐藏层的第一定点输出数据,获取各隐藏层的第一定点输出数据对应的第二波动表征数据;

根据各所述第一波动表征数据、各所述第二波动表征数据,确定预设构造函数的第一结果;根据所述深度学习浮点模型的各隐藏层的第一浮点输出数据、所述初始深度学习定点模型的各隐藏层的第一定点输出数据,确定预设相似度计算函数的第二结果;根据所述第一结果和所述的第二结果对所述初始深度学习定点模型的权重参数进行调整,得到修正深度学习定点模型;

根据所述修正深度学习定点模型、所述第一波动表征数据、所述标准浮点训练数据和所述标准定点训练数据确定所述预设构造函数的第三结果和所述预设相似度计算函数的第四结果;

若所述第一结果与所述第三结果的第一变化趋势为降低趋势,且所述第二结果与所述第四结果的第二变化趋势为降低趋势,则将所述修正深度学习定点模型确定为所述深度学习浮点模型对应的量化定点模型。

第二方面,本申请实施例提供了一种量化定点模型的训练装置,所述装置包括:

获取模块,用于获取标准浮点训练数据和标准定点训练数据;

第一训练模块,用于通过深度学习浮点模型对所述标准浮点训练数据进行训练,得到所述深度学习浮点模型各隐藏层的第一浮点输出数据,获取各隐藏层的第一浮点输出数据对应的第一波动表征数据;

第二训练模块,用于通过初始深度学习定点模型对所述标准定点训练数据进行训练,得到所述初始深度学习定点模型各隐藏层的第一定点输出数据,获取各隐藏层的第一定点输出数据对应的第二波动表征数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南国科微电子股份有限公司,未经湖南国科微电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111664630.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top