[发明专利]基于动量和剪枝的分布式深度学习系统有效

申请号：	201811390273.6	申请日：	2018-11-21
公开（公告）号：	CN109299781B	公开（公告）日：	2021-12-03
发明（设计）人：	郑啸;邵光梅;梁越永;何诗兴;后盾	申请（专利权）人：	安徽工业大学;飞马智科信息技术股份有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08
代理公司：	南京九致知识产权代理事务所(普通合伙) 32307	代理人：	严巧巧
地址：	243032 ***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于动量剪枝分布式深度学习系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于动量和剪枝的分布式深度学习系统，其特征在于，包括如下步骤：

(1)采用spark分布式集群，搭建spark开发环境，每台集群机器配置Caffe深度学习环境，spark分布式集群包括一个主控制节点和多个分别与主控制节点通信连接的工作节点；

(2)将需要处理的数据进行加载，在HDFS下经过spark进行数据处理，转化为Caffe特定LMDB格式，并将数据均匀划分并分布到各工作节点上；

(3)对每个工作节点存储的数据，创建深度学习模型，并根据每个工作节点本地存储的数据进行分批次并行深度学习模型的向前向后传播训练；

(4)前期采用随机梯度下降算法方法，后期采用动量梯度下降法计算工作节点本地权值参数的更新量，传送至主控制节点，与主控制节点全局权值参数进行交互通信；主控制节点记录工作节点的节点信息，包括该工作节点的本地权值参数的更新量，将所得工作节点的本地权值参数平衡后回传至各对应工作节点；

(5)各工作节点继续下一个批次数据训练，主控制节点进行模型参数平衡，重复上述训练模型直到达到迭代次数或收敛条件。

2.根据权利要求1所述的基于动量和剪枝的分布式深度学习系统，其特征在于，步骤(3)中每个节点创建相同的深度学习模型，且每个工作节点对任意一个批次数据中的每条数据都进行了深度学习模型的一个向前向后传播计算。

3.根据权利要求2所述的基于动量和剪枝的分布式深度学习系统，其特征在于，步骤(3)中深度学习模型的向前向后传播计算过程为：

向前传播阶段：从训练集中的随机抽取一批容量为m的样本集{x₁,…,x_m}，以及相对应的理想输出为{y₁,…,y_m}，从样本集中随机选取一个样本(x_p，y_p)，1≤p≤m；将x_p输入网络，计算相应的实际输出O_p，O_P＝F_n(…(F₂(F₁(x_pW⁽¹⁾)W⁽²⁾)…)W⁽ⁿ⁾，其中，F_n表示对应输出层的Sigmoid函数，W⁽ⁿ⁾为对应层输出的权值矩阵；