[发明专利]基于LSQ量化的知识蒸馏方法在审
| 申请号: | 202211271826.2 | 申请日: | 2022-10-18 |
| 公开(公告)号: | CN115470902A | 公开(公告)日: | 2022-12-13 |
| 发明(设计)人: | 谭钦红;文洪伟;黄俊 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 400065*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 lsq 量化 知识 蒸馏 方法 | ||
1.一种基于LSQ量化的知识蒸馏方法,其特征在于,包括:
S1:使用LSQ量化全精度模型,得到量化模型;输入数据,量化模型自学习初始化量化模型;
S2:使用知识蒸馏算法,2阶段训练量化模型,第1阶段训练冻结每一层伪量化层的激活步长,第2阶段训练冻结每一层伪量化层的权重步长。
2.如权利要求1所述的基于LSQ量化的知识蒸馏方法,其特征在于,所述S1具体步骤包含如下子步骤:
S11:计算权重的量化区间,计算激活的量化区间。
S12:在全量化模型中插入伪量化层,得到量化模型。
S13:根据所述全量化模型的权重初始化所述量化模型每一个伪量化层的权重步长;随机采集一小批数据数据输入到所述量化模型中,初始化每一个伪量化层的激活步长。
S14:输入数据,同时训练所述量化模型的权重和每一个伪量化层中的所述权重步长和所述激活步长。
3.如权利要求1所述的基于LSQ量化的知识蒸馏方法,其特征在于,所述S2具体步骤包含如下子步骤:
S21:使用全量化模型作为教师模型,使用量化模型作为学生模型。
S22:冻结所述学生模型中冻结所有伪量化层中激活步长,使用所述教师模型中的提供知识辅助训练所述学生模型权重和所有伪量化层的权重步长。
S23:冻结所述学生模型中冻结所有伪量化层中权重步长,使用所述教师模型中的提供知识辅助训练训练所述学生模型权重和所有伪量化层的激活步长。
4.如权利要求1、2所述的基于LSQ量化的知识蒸馏方法,其特征在于,所述量化权重步长sw和量化步长sx的初始化公式为:
5.如权利要求1、3所述的基于LSQ量化的知识蒸馏方法,所述S23、S24中所述教师模型中的提供知识包括:基于软目标的知识,基于中间特征的知识,基于关系的知识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211271826.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种摩托车车载道路路况检测系统
- 下一篇:一种组合使用辊刀





