[发明专利]模型的量化训练方法、装置及存储介质在审

专利信息
申请号: 201910875016.X 申请日: 2019-09-17
公开(公告)号: CN110610237A 公开(公告)日: 2019-12-24
发明(设计)人: 谢思敏 申请(专利权)人: 普联技术有限公司
主分类号: G06N3/08 分类号: G06N3/08;G06N3/04
代理公司: 44414 深圳中一联合知识产权代理有限公司 代理人: 刘永康
地址: 518000 广东省深圳市南山区深南路科技*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 激活 量化 量化参数 权重量化 权重 迭代训练 计算机视觉 存储介质 反向计算 分布动态 分布特点 梯度调整 图像分析 性能损失 权重和 特征图 像素点 前向 申请 运算 输出 更新 学习
【说明书】:

本申请属于模型量化技术领域,提供了一种模型的量化训练方法、装置及存储介质,用于对计算机视觉深度学习模型量化,该方法包括:在每一次模型迭代训练时,根据所述模型权重或激活值的数值分布特点确定量化参数;所述激活值表示由像素点组成的特征图;根据所述量化参数量化所述模型的每一层权重和激活值,得到权重量化值和激活量化值;采用所述权重量化值和所述激活量化值进行前向运算,以进行图像分析输出下一所述激活值;根据所述权重量化值和所述激活量化值反向计算所述模型的梯度,以通过所述梯度调整所述模型权重。本申请实施例通过在每次模型迭代训练时均根据模型的权重或激活值的数值分布动态更新量化参数,解决模型的性能损失问题。

技术领域

发明涉及模型量化的技术领域,尤其涉及一种模型的量化训练方法、装 置及存储介质。

背景技术

卷积神经网络模型推理过程中,卷积和全连接是算力占用最多的算子,这 两个算子的权重是模型中最主要的参数。在当前计算机结构中,浮点数计算的 功耗和时间都比定点数计算多。如果能够将卷积和全连接的运算数都变为定点 数,将大幅提升运算效率,减小功耗,减少存储空间使用。现有技术中,学术 界已有将浮点模型量化为定点模型的理论。动态定点原理将一个集合中的浮点 权重,表示为定点数乘以公共的动态缩放因子,动态缩放因子限制为2的整数 次幂。根据上述理论构建低精度动态定点权重的模型训练方法。在神经网络训 练过程中,模型权重会随着训练而不断改变。但由于量化权重的动态缩放因子中的定点位置被固定为预设范围或初始位置,使得通过此方法训练出来的量化 模型只能在初始选择的定点位置基础上得到定点模型,限制模型权值的取值范 围,导致模型在训练过程中无法自适应的学习最优参数,从而造成模型的性能 损失。

发明内容

有鉴于此,本发明实施例提供了一种模型的量化训练方法、装置及存储介 质,以解决模型的性能损失问题。

本发明实施例的第一方面提供了一种模型的量化训练方法,所述方法用于 对计算机视觉深度学习模型量化,包括:

在每一次模型迭代训练时,根据所述模型权重或激活值的数值分布特点确 定量化参数;所述激活值表示由像素点组成的特征图;

根据所述量化参数量化所述模型的每一层权重和激活值,得到权重量化值 和激活量化值;

采用所述权重量化值和所述激活量化值进行前向运算,以进行图像分析输 出下一所述激活值;

根据所述权重量化值和所述激活量化值反向计算所述模型的梯度,以通过 所述梯度调整所述模型权重。

在一个实施示例中,所述根据所述模型权重或激活值的数值分布特点确定 量化参数,包括:

选取所述模型的所有权重或激活值的绝对值中最大值;

根据所述最大值确定动态定点位置P,以使所述权重量化值和所述激活量 化值在范围[-2p+7,2p+7)内表示。

在一个实施示例中,所述根据所述模型权重或激活值的数值分布特点确定 量化参数,包括:

获取所述模型中每一权重或激活值的定点位置;

根据所述模型的权重或激活值的定点位置分布状态,确定满足预设范围内 的权重或激活值数量最多的定点位置p为动态定点位置。

在一个实施示例中,所述根据所述量化参数量化所述权重和所述激活值, 得到权重量化值和激活量化值,包括:

根据所述动态定点位置P确定动态缩放因子2p

根据所述动态缩放因子与量化值的关系分别对所述权重和所述激活值进行 量化,得到权重量化值和激活量化值;其中,

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普联技术有限公司,未经普联技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910875016.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top