[发明专利]神经网络的量化方法及装置在审
申请号: | 202110015968.1 | 申请日: | 2021-01-07 |
公开(公告)号: | CN112613604A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 王堃;韩亚敏 | 申请(专利权)人: | 江苏禹盛科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N3/08 |
代理公司: | 北京德崇智捷知识产权代理有限公司 11467 | 代理人: | 曹婷 |
地址: | 210000 江苏省南京市栖霞区马*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 量化 方法 装置 | ||
1.一种神经网络的量化方法,其特征在于,包括:
加载网络模型,从所述网络模型中按照卷积层逐层提取权重Wi,其中,i为自然数;
将验证集投入到所述网络模型的每一层卷积层分别提取特征值,获取特征值的数据范围;
对每一层卷积层的权重Wi进行量化,得到量化后的权重Wfinal,i,具体包括:
W'=Wi×2j-1; (1)
其中j∈[2,8],表示位宽;[-2j-1+1,2j-1-1]为通过位宽j表示的所述特征值的数据范围,对于不在所述数据范围之内的特征值,对式(1)进行clip饱和操作,即将大于值域|[-2j-1+1,2j-1-1]|的数据饱和到[-2j-1+1,2j-1-1]内重新计算卷积层i的权重Wfinal,i;
将所述验证集投入到权重为所述Wfinal,i的卷积层进行验证获取验证准确率;
获取不同的位宽j对应的权重Wfinal,i及验证准确率,确定最大的验证准确率对应的位宽j及卷积层的权重Wfinal,i,直至确定每一层卷积层的权重,完成神经网络的量化,保存量化后的网络模型。
2.如权利要求1所述的神经网络的量化方法,其特征在于,所述网络模型包括VGG16、YOLOv3和ResNet50。
3.一种神经网络的量化装置,其特征在于,包括:
权重提取单元,用于加载网络模型,从所述网络模型中按照卷积层逐层提取权重Wi,其中,i为自然数;
特征值提取单元,用于将验证集投入到所述网络模型的每一层卷积层分别提取特征值,获取特征值的数据范围;
量化单元,用于对每一层卷积层的权重Wi进行量化,具体包括:
W'=Wi×2j-1; (1)
其中j∈[2,8],表示位宽;[-2j-1+1,2j-1-1]为通过位宽j表示的所述特征值的数据范围,对于不在所述数据范围之内的特征值,对式(1)进行clip饱和操作,即将大于值域|[-2j-1+1,2j-1-1]|的数据饱和到[-2j-1+1,2j-1-1]内重新计算卷积层i的权重Wfinal,i;
验证单元,将所述验证集投入到权重为Wfinal,i的卷积层进行验证获取验证准确率;
确定单元,获取不同的位宽j对应的权重Wfinal,i及验证准确率,确定最大的验证准确率对应的位宽j及卷积层的权重Wfinal,i,直至确定每一层卷积层的权重,完成神经网络的量化,保存量化后的网络模型。
4.如权利要求3所述的神经网络的量化装置,其特征在于,所述网络模型包括VGG16、YOLOv3和ResNet50。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏禹盛科技有限公司,未经江苏禹盛科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110015968.1/1.html,转载请声明来源钻瓜专利网。