[发明专利]一种神经网络的优化方法及相关设备在审
申请号: | 202010650726.5 | 申请日: | 2020-07-06 |
公开(公告)号: | CN111950700A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 辛经纬;王楠楠;姜馨蕊;宋德华;韩凯;王云鹤 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06K9/62;G06T3/40 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 李杭 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 优化 方法 相关 设备 | ||
1.一种神经网络的优化方法,其特征在于,所述神经网络包括第一神经网络模块,所述第一神经网络模块包括n个卷积层,所述方法包括:
获取第一量化模型,所述第一量化模型用于根据所述第一神经网络模块的第1层至第m层的m个第一权重矩阵,得到所述第一神经网络模块的第m层的第二权重矩阵,其中,每层的第一权重矩阵均为用32位浮点数表示的权重矩阵,每层的第二权重矩阵均为赋值+1或-1的权重矩阵,1≤m≤n;
根据所述第一量化模型,将所述第一神经网络模块各层对应的每个第一权重矩阵进行二值化操作,得到所述第一神经网络模块各层对应的每个第二权重矩阵;
通过训练集中的训练数据对所述神经网络进行训练,得到训练后的神经网络;
将所述训练后的神经网络部署在目标设备上。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一量化模型,将所述第一神经网络模块各层对应的每个第一权重矩阵进行二值化操作,得到所述第一神经网络模块各层对应的每个第二权重矩阵包括:
通过得到所述第m层的第二权重矩阵,其中,W1,W2,...,Wm为第1层的第一权重矩阵至第m层的第一权重矩阵,α1,α2,...,αm为与W1,W2,...,Wm对应的第一线性组合参数,WN(·)为对α1W1+α2W2+…+αmWm进行的归一化操作,Sign(·)为对WN(α1W1+α2W2+…+αmWm)进行二值化操作的符号函数,为所述第m层的第二权重矩阵,为所述第一量化模型。
3.根据权利要求1-2中任一项所述的方法,其特征在于,在通过训练集中的训练数据对所述神经网络进行训练,得到训练后的神经网络之前,所述方法还包括:
确定所述第m层的第二权重矩阵的权值增益;
根据所述第m层的第二权重矩阵的权重增益对所述第m层的第二权重矩阵进行调整,使得调整后的第m层的第二权重矩阵与第m层的第一权重矩阵之间的差值小于所述第m层的第二权重矩阵与所述第m层的第一权重矩阵之间的差值。
4.根据权利要求2-3中任一项所述的方法,其特征在于,在通过训练集中的训练数据对所述神经网络进行训练,得到训练后的神经网络之前,所述方法还包括:
设置所述第一线性组合参数为所述神经网络的网络参数,以使得在根据训练集中的训练数据对所述神经网络进行训练的过程中,对所述第一线性组合参数进行训练。
5.根据权利要求2-3中任一项所述的方法,其特征在于,在通过训练集中的训练数据对所述神经网络进行训练,得到训练后的神经网络之前,所述方法还包括:
确定所述第m层的第一权重矩阵与所述第m层的第二权重矩阵的模值为所述第一线性组合参数中的αm;
对所述模值进行线性回归得到所述αm的最终取值。
6.根据权利要求1-5中任一项所述的方法,其特征在于,在根据所述第一量化模型,将所述第一神经网络模块各层对应的每个第一权重矩阵进行二值化操作,得到所述第一神经网络模块各层对应的每个第二权重矩阵之后,所述方法还包括:
按照所述n个卷积层连接的先后顺序依次计算所述第一神经网络模块每层的第一特征表示;
获取第二量化模型,所述第二量化模型用于根据所述第一神经网络模块的第1层至第m层的m个第一特征表示,得到所述第一神经网络模块的第m层的第二特征表示,其中,每层的第一特征表示均为用32位浮点数表示的特征表示,每层的第二特征表示均为赋值+1或-1的特征表示,1≤m≤n;
根据所述第二量化模型,将所述第一神经网络模块各层对应的每个第一特征表示进行二值化操作,得到所述第一神经网络模块各层对应的每个第二特征表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010650726.5/1.html,转载请声明来源钻瓜专利网。