[发明专利]用于机器学习的硬件实现的点对点通信原语在审
| 申请号: | 201810419238.6 | 申请日: | 2018-05-04 |
| 公开(公告)号: | CN108805795A | 公开(公告)日: | 2018-11-13 |
| 发明(设计)人: | S·斯瑞哈兰;K·维迪雅纳坦;D·达斯 | 申请(专利权)人: | 英特尔公司 |
| 主分类号: | G06T1/20 | 分类号: | G06T1/20;G06N3/04 |
| 代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘瑜;王英 |
| 地址: | 美国加*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 一个实施例提供用于计算并分发数据以用于神经网络的分布式训练的系统,该系统包括:第一存储器,其存储包括机器学习框架的第一组指令;结构接口,其实现与该组可训练机器学习参数相关联的数据的传输和接收;第一组通用处理器核心,其执行第一组指令,该第一组指令提供训练工作流以用于针对可训练机器学习参数的梯度的计算并与第二组指令通信,该第二组指令有利于经由结构接口来传输和接收梯度;以及图形处理器,其执行与训练工作流相关联的计算操作以生成针对可训练机器学习参数的梯度。 | ||
| 搜索关键词: | 机器学习 组指令 可训练 结构接口 工作流 通用处理器核心 原语 关联 点对点通信 图形处理器 存储器 传输 分发数据 计算操作 神经网络 硬件实现 存储 通信 | ||
【主权项】:
1.一种用于计算并且分发数据以用于神经网络的分布式训练的系统,所述系统包括:第一存储器,其存储包括机器学习框架的第一组指令;结构接口,其实现与一组可训练机器学习参数相关联的数据的传输和接收;第一组通用处理器核心,其执行所述第一组指令,所述第一组指令提供训练工作流以用于针对所述可训练机器学习参数的梯度的计算并且与第二组指令通信,所述第二组指令有利于经由所述结构接口来传输和接收所述梯度;以及图形处理器,其执行与所述训练工作流相关联的计算操作以生成针对所述可训练机器学习参数的所述梯度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810419238.6/,转载请声明来源钻瓜专利网。
- 上一篇:乘法-累加"0"数据门控
- 下一篇:用于整数深度学习原语的动态精度管理





