[发明专利]神经网络模型的训练方法及其介质和电子设备在审
申请号: | 202010086380.0 | 申请日: | 2020-02-11 |
公开(公告)号: | CN111401546A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 刘默翰;周力;白立勋;石文元;俞清华;隋志成 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 上海音科专利商标代理有限公司 31267 | 代理人: | 夏峰 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及神经网络技术领域,公开了一种神经网络模型的训练方法及其介质和电子设备。本申请的神经网络模型的训练方法包括:n个网络层中的第一个网络层获取样本数据,并将样本数据输入到第二个网络层;对于n个网络层中的第i个网络层,执行如下操作:当i=2时,基于初始输入数据和第i个网络层的多个初始权重得到第i个网络层的输出数据,当2i≤n时,基于第i‑1个网络层的输出数据和第i个网络层的多个初始权重得到第i个网络层的输出数据,第i个网络层的多个初始权重是基于m个离散值得到的。本申请将神经网络模型的多个初始权重设定为低比特的离散值,能够有效避免低比特权重训练过程中神经网络模型的梯度消失问题,加速神经网络模型的收敛。 | ||
搜索关键词: | 神经网络 模型 训练 方法 及其 介质 电子设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010086380.0/,转载请声明来源钻瓜专利网。