[发明专利]模型的量化训练方法、装置及存储介质在审
| 申请号: | 201910875016.X | 申请日: | 2019-09-17 |
| 公开(公告)号: | CN110610237A | 公开(公告)日: | 2019-12-24 |
| 发明(设计)人: | 谢思敏 | 申请(专利权)人: | 普联技术有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
| 代理公司: | 44414 深圳中一联合知识产权代理有限公司 | 代理人: | 刘永康 |
| 地址: | 518000 广东省深圳市南山区深南路科技*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 激活 量化 量化参数 权重量化 权重 迭代训练 计算机视觉 存储介质 反向计算 分布动态 分布特点 梯度调整 图像分析 性能损失 权重和 特征图 像素点 前向 申请 运算 输出 更新 学习 | ||
1.一种模型的量化训练方法,所述方法用于对计算机视觉深度学习模型量化,其特征在于,包括:
在每一次模型迭代训练时,根据所述模型权重或激活值的数值分布特点确定量化参数;所述激活值表示由像素点组成的特征图;
根据所述量化参数量化所述模型的每一层权重和激活值,得到权重量化值和激活量化值;
采用所述权重量化值和所述激活量化值进行前向运算,以进行图像分析输出下一所述激活值;
根据所述权重量化值和所述激活量化值反向计算所述模型的梯度,以通过所述梯度调整所述模型权重。
2.如权利要求1所述的模型的量化训练方法,其特征在于,所述根据所述模型权重或激活值的数值分布特点确定量化参数,包括:
选取所述模型的所有权重或激活值的绝对值中最大值;
根据所述最大值确定动态定点位置P,以使所述权重量化值和所述激活量化值在范围[-2p+7,2p+7)内表示。
3.如权利要求1所述的模型的量化训练方法,其特征在于,所述根据所述模型权重或激活值的数值分布特点确定量化参数,包括:
获取所述模型中每一权重或激活值的定点位置;
根据所述模型的权重或激活值的定点位置分布状态,确定满足预设范围内的权重或激活值数量最多的定点位置p为动态定点位置。
4.如权利要求2或3所述的模型的量化训练方法,其特征在于,所述根据所述量化参数量化所述模型的每一层权重和激活值,得到权重量化值和激活量化值,包括:
根据所述动态定点位置P确定动态缩放因子2p;
根据所述动态缩放因子与量化值的关系分别对所述权重和所述激活值进行量化,得到权重量化值和激活量化值;其中,
所述动态缩放因子与量化值的关系为:Qint-k=round(Wflt-k*2-P);
Qint-k为所述模型的每一层第k个权重的权重量化值或第k个激活值的激活量化值;Wflt-k为第k个权重或激活值的浮点值;2p为动态缩放因子。
5.如权利要求2所述的模型的量化训练方法,其特征在于,所述根据所述最大值确定动态定点位置P,以使所述权重量化值和所述激活量化值在范围[-2p+7,2p+7)内表示,包括:
计算以2为底的所述最大值的对数;
确定不小于所述对数的下一整数与7的差值为动态定点位置P。
6.如权利要求3所述的模型的量化训练方法,其特征在于,所述获取所述模型中每一权重或激活值的定点位置,包括:
对于所述模型中每一权重或激活值,获取所述权重或所述激活值的浮点值;
根据浮点值与定点位置的关系,得到所述权重或所述激活值对应的定点位置;其中,
所述浮点值与所述定点位置的关系为:Wint-k=round(Wflt-k*2-position);
Wint-k为权重或激活值的定点值;Wflt-k为权重或激活值的浮点值;position为定点位置。
7.一种模型的量化训练装置,其特征在于,包括:
量化参数确定模块,用于在每一次模型迭代训练时,根据所述模型权重或激活值的数值分布特点确定量化参数;所述激活值表示由像素点组成的特征图;
量化模块,用于根据所述量化参数量化所述模型的每一层权重和激活值,得到权重量化值和激活量化值;
前向运算模块,用于采用所述权重量化值和所述激活量化值进行前向运算,以进行图像分析输出下一所述激活值;
梯度计算模块,用于根据所述权重量化值和所述激活量化值反向计算所述模型的梯度,以通过所述梯度调整所述模型权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普联技术有限公司,未经普联技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910875016.X/1.html,转载请声明来源钻瓜专利网。





