[发明专利]基于冷热分离的梯度聚合方法与系统有效

专利信息
申请号: 202110861852.X 申请日: 2021-07-29
公开(公告)号: CN113642736B 公开(公告)日: 2023-09-12
发明(设计)人: 潘恒;崔鹏来;贾茹;李振宇;谢高岗 申请(专利权)人: 中国科学院计算技术研究所
主分类号: G06N20/00 分类号: G06N20/00
代理公司: 北京律诚同业知识产权代理有限公司 11006 代理人: 祁建国
地址: 100080 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 冷热 分离 梯度 聚合 方法 系统
【权利要求书】:

1.一种基于冷热分离的梯度聚合方法,其特征在于,包括:

步骤1,对稀疏场景的训练数据进行随机采样以对稀疏模型进行预训练;

步骤2,统计该稀疏模型的预训练过程中参数的频率,并根据该频率的大小将该参数分类为热参数或冷参数;

步骤3,利用该稀疏场景的训练数据对该稀疏模型进行重新训练,各训练节点分别传输该重新训练过程中的热参数梯度和冷参数梯度;

步骤4,该热参数梯度在可编程交换机上进行聚合后发送至远程服务器进行同步,该冷参数梯度由该可编程交换机直接该发送至远程服务器上进行聚合及同步;

该步骤3包括:

步骤31,将该稀疏场景的训练数据切分为多段训练数据并分别发送至各该训练节点以解析该稀疏模型的参数;

步骤32,各该训练节点从该远程服务器拉取该稀疏模型的参数的最新值,并结合该训练数据进行训练,计算对应的参数梯度;

步骤33,各该训练节点根据冷热参数的标记将计算的该参数梯度分类为该热参数梯度和该冷参数梯度,并对该热参数梯度和该冷参数梯度分别进行封装与发送;

该步骤4包括:

步骤41,对该热参数按照名字符号大小进行排序,并根据该排序对该热参数进行分组;

步骤42,该可编程交换机根据该热参数的分组对寄存器进行分组,对携带该热参数梯度的数据包按照该分组进行解析,并将解析结果加至对应的该寄存器分组以进行该热参数梯度的聚合。

2.如权利要求1所述的基于冷热分离的梯度聚合方法,其特征在于,该步骤1包括:

步骤11,利用随机函数对大规模的该稀疏场景的训练数据进行随机采样得到小规模的训练数据集;

步骤12,将该训练数据集切分为多段训练数据并分别发送至各训练节点以解析该稀疏模型的参数;

步骤13,各该训练节点从远程服务器拉取该稀疏模型的参数的最新值,并结合该训练数据集进行训练,计算对应的参数梯度;

步骤14,各该训练节点将计算的该参数梯度发送至该远程服务器进行全局同步。

3.如权利要求2所述的基于冷热分离的梯度聚合方法,其特征在于,该步骤2中,利用可编程交换机截获并统计各该训练节点发送至该该远程服务器的该参数的频率,并根据该频率大小对该参数进行排序,将频率之和大于等于全部参数的频率之和的50%的前N个参数标记为该热参数,其余标记为该冷参数。

4.一种基于冷热分离的梯度聚合系统,其特征在于,包括:

模型预训练模块,用于对稀疏场景的训练数据进行随机采样以对稀疏模型进行预训练;

冷热参数标记模块,用于统计该稀疏模型的预训练过程中参数的频率,并根据该频率的大小将该参数分类为热参数或冷参数;

模型重训练模块,用于利用该稀疏场景的训练数据对该稀疏模型进行重新训练,各训练节点分别传输该重新训练过程中的热参数梯度和冷参数梯度;

梯度聚合模块,用于该热参数梯度在可编程交换机上进行聚合后发送至远程服务器进行同步,该冷参数梯度由该可编程交换机直接该发送至远程服务器上进行聚合及同步;

该模型重训练模块包括:

参数解析子模块,用于将该稀疏场景的训练数据切分为多段训练数据并分别发送至各该训练节点以解析该稀疏模型的参数;

参数更新子模块,用于各该训练节点从该远程服务器拉取该稀疏模型的参数的最新值,并结合该训练数据进行训练,计算对应的参数梯度;

冷热参数分类子模块,用于各该训练节点根据冷热参数的标记将计算的该参数梯度分类为该热参数梯度和该冷参数梯度,并对该热参数梯度和该冷参数梯度分别进行封装与发送;

该梯度聚合模块包括:

热参数分组子模块,用于对该热参数按照名字符号大小进行排序,并根据该排序对该热参数进行分组;

热参数聚合子模块,用于该可编程交换机根据该热参数的分组对寄存器进行分组,对携带该热参数梯度的数据包按照该分组进行解析,并将解析结果加至对应的该寄存器分组以进行该热参数梯度的聚合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110861852.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top