[发明专利]通信避免方法、装置、电子设备和存储介质有效
申请号: | 202110782183.7 | 申请日: | 2021-07-12 |
公开(公告)号: | CN113377546B | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 肖俊敏;曹连雨 | 申请(专利权)人: | 中科弘云科技(北京)有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F16/901;G06F17/16;G06N3/04;G06N3/08 |
代理公司: | 北京维正专利代理有限公司 11508 | 代理人: | 张鸿基;马希超 |
地址: | 100089 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通信 避免 方法 装置 电子设备 存储 介质 | ||
1.一种通信避免方法,其特征在于,包括:
确定训练神经网络模型每层的计算过程的统一表达形式,所述统一表达形式为变量矩阵和参数矩阵的相互关系;
基于涉及训练神经网络模型的计算过程的所有进程数量,将所述变量矩阵重复Pr次且使每个进程持有所述变量矩阵的1/Pc块、所述参数矩阵重复Pc次且使每个进程持有所述参数矩阵的1/Pr块,其中Pc和Pr的乘积等于所有进程数量;
基于所述统一表达形式、所述变量矩阵的划分结果以及所述参数矩阵的划分结果确定训练神经网络模型时的通信复杂度,并调整Pc和Pr使得所述通信复杂度最优,以所述通信复杂度最优的方式来进行通信;
其中,所述确定训练神经网络模型每层的计算过程的统一表达形式包括:
确定训练神经网络模型过程中前向传递的表达形式为:
Yi=WiXi、Xi+1=f(Yi)
其中,的每列表示神经网络模型第i层的输入变量,的每列表示神经网络模型第i层的输出变量,的每列表示从第i-1层到第i层之间的神经网络模型的权重参数,Yi 为神经网络模型的输出变量矩阵,Wi 为神经网络模型的权重参数矩阵,Xi 为神经网络模型的输入变量矩阵,f为神经网络模型的损失函数,i为神经网络模型的层数,di 为神经网络模型的神经元个数,B为集合Batch中元素的个数,Batch为索引指标集;
确定训练神经网络模型过程中反向传递的表达形式为:
其中,为损失函数关于输入变量矩阵的梯度矩阵,为损失函数关于输出变量矩阵的梯度矩阵,为损失函数关于神经网络模型每层的权重参数矩阵的梯度矩阵;
由于非线性变换Xi+1=f(Yi)的计算不涉及通信,那么,
确定Yi=WiXi、以及为训练神经网络模型每层的计算过程的统一表达形式;
其中,所述基于所述统一表达形式、所述变量矩阵的划分结果以及所述参数矩阵的划分结果确定训练神经网络模型时的通信复杂度包括:
通过下式确定所述通信复杂度:
其中,T为通信复杂度,L为神经网络模型的层数,P为涉及训练神经网络模型的计算过程的所有进程数,α为网络延迟,β为带宽的倒数,B为Batch中元素的个数,Batch为随机索引指标集,di 为神经网络模型的神经元个数,∣Wi ∣为神经网络模型第i层中模型参数的总数。
2.根据权利要求1所述的方法,其特征在于,所述基于涉及训练神经网络模型的计算过程的所有进程数量,将所述变量矩阵重复Pr次且使每个进程持有所述变量矩阵的1/Pc块、所述参数矩阵重复Pc次且使每个进程持有所述参数矩阵的1/Pr块包括:
将输入变量矩阵重复Pr次且使每个进程持有输入变量矩阵的1/Pc块;
将输出变量矩阵重复Pr次且使每个进程持有输出变量矩阵的1/Pc块;
将权重参数矩阵重复Pc次且使每个进程持有权重参数矩阵的1/Pr块;
将损失函数关于输入变量矩阵的梯度矩阵重复Pr次且使每个进程持有损失函数关于输入变量矩阵的梯度矩阵的1/Pc块;
将损失函数关于输出变量矩阵的梯度矩阵重复Pr次且使每个进程持有损失函数关于输出变量矩阵的梯度矩阵的1/Pc块;
将损失函数关于权重参数矩阵的梯度矩阵重复Pc次且使每个进程持有重复Pc次且使每个进程持有损失函数关于权重参数矩阵的梯度矩阵的1/Pr块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科弘云科技(北京)有限公司,未经中科弘云科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110782183.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无人机目标跟踪方法、终端设备及存储介质
- 下一篇:一种便于维修的轴流风机