首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种分布式训练中参数更新方法及装置有效

申请号：	201910864527.1	申请日：	2019-09-12
公开（公告）号：	CN110633798B	公开（公告）日：	2023-04-07
发明（设计）人：	王洪伟;李鑫;李长亮	申请（专利权）人：	北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司
主分类号：	G06N3/08	分类号：	G06N3/08
代理公司：	北京智信禾专利代理有限公司 11637	代理人：	王治东
地址：	100085 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种分布式训练参数更新方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种分布式训练中参数更新方法，其特征在于，包括：

接收分布式训练集群中的每个训练节点传递的梯度；

根据每个训练节点传递的梯度计算平均累积梯度，根据平均累积梯度训练模型的损失值并更新所述训练模型的模型参数；

根据所述损失值的收敛速率确定模型训练的训练阶段，其中，所述训练阶段包括第一训练阶段、第二训练阶段和第三训练阶段；

根据所述训练阶段对所述模型参数进行压缩，获得压缩模型参数，其中，在所述训练阶段在第二训练阶段或第三训练阶段的情况下，对所述模型参数中的第二压缩张量集合进行压缩，获得压缩模型参数，所述第二压缩张量集合根据张量参与压缩的比例从所述模型参数中确定；

将所述压缩模型参数同步至所述分布式训练集群的每个训练节点，更新每个训练节点中的模型参数。

2.如权利要求1所述的分布式训练中参数更新方法，其特征在于，根据每个训练节点传递的梯度计算平均累积梯度，根据平均累积梯度训练模型的损失值并更新所述训练模型的模型参数，包括：

将每个训练节点传递的梯度累加并计算均值，得到平均累积梯度；

根据所述平均累积梯度计算训练模型的损失值并更新训练模型的参数。

3.如权利要求1所述的分布式训练中参数更新方法，其特征在于，根据所述损失值的收敛速率确定模型训练的训练阶段，包括：

在所述损失值的收敛速率大于等于第一预设阈值的情况下，确定模型训练处于第一训练阶段；

在所述损失值的收敛速率小于第一预设阈值且大于等于第二预设阈值的情况下，确定模型训练处于第二训练阶段；

在所述损失值的收敛速率小于第二预设阈值情况下，确定模型训练处于第三训练阶段。

4.如权利要求1所述的分布式训练中参数更新方法，其特征在于，还包括：

根据张量参与压缩的比例将所述模型参数中的张量分组，获得第一压缩张量集合和第二压缩张量集合。

5.如权利要求4所述的分布式训练中参数更新方法，其特征在于，根据所述训练阶段对所述模型参数进行压缩，包括：

在模型训练处于第一训练阶段的情况下，采用第一压缩法对所述第一压缩张量集合和所述第二压缩张量集合中的张量进行压缩；

在模型训练处于第二训练阶段的情况下，采用第二压缩法对所述第二压缩张量集合中的张量进行压缩；

在模型训练处于第三训练阶段的情况下，采用第三压缩法对所述第二压缩张量集合中的张量进行压缩；

其中，第一压缩法的压缩效率和损失精度大于第二压缩算法，第二压缩算法的压缩效率和损失精度大于第三压缩算法。

6.如权利要求1所述的分布式训练中参数更新方法，其特征在于，更新每个训练节点中的模型参数，包括：

每个训练节点接收所述压缩模型参数并解压，用解压后的压缩模型参数更新训练节点中的模型参数。

7.一种分布式训练中参数更新装置，其特征在于，包括：

接收模块，被配置为接收分布式训练集群中的每个训练节点传递的梯度；

计算更新模块，被配置为根据每个训练节点传递的梯度计算平均累积梯度，根据平均累积梯度训练模型的损失值并更新所述训练模型的模型参数；

确定模块，被配置为根据所述损失值的收敛速率确定模型训练的训练阶段，其中，所述训练阶段包括第一训练阶段、第二训练阶段和第三训练阶段；

压缩模块，被配置为根据所述训练阶段对所述模型参数进行压缩，获得压缩模型参数，其中，在所述训练阶段在第二训练阶段或第三训练阶段的情况下，对所述模型参数中的第二压缩张量集合进行压缩，获得压缩模型参数，所述第二压缩张量集合根据张量参与压缩的比例从所述模型参数中确定；

同步更新模块，被配置为将所述压缩模型参数同步至所述分布式训练集群的每个训练节点，更新每个训练节点中的模型参数。

8.一种计算设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令，其特征在于，所述处理器执行所述指令时实现权利要求1-6任意一项所述方法的步骤。

9.一种计算机可读存储介质，其存储有计算机指令，其特征在于，该指令被处理器执行时实现权利要求1-6任意一项所述方法的步骤。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司，未经北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910864527.1/1.html，转载请声明来源钻瓜专利网。

上一篇：网络模型结构的搜索方法、装置以及电子设备
下一篇：一种全连接神经网络优化方法和装置

同类专利

专利分类

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top