[发明专利]用于机器学习操作的经优化计算硬件在审

专利信息
申请号: 201810427080.7 申请日: 2018-05-07
公开(公告)号: CN108805797A 公开(公告)日: 2018-11-13
发明(设计)人: D·达斯;R·格拉姆温特;M·斯密尔安斯基;J·考博尔;D·穆迪盖雷;N·K·梅勒普迪;A·F·海奈克 申请(专利权)人: 英特尔公司
主分类号: G06T1/20 分类号: G06T1/20;G06N3/08
代理公司: 上海专利商标事务所有限公司 31100 代理人: 张欣;黄嵩泉
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 输入操作数 解码 单个指令 机器学习 计算设备 操作数 长度单元 获取单元 计算单元 解码单元 矩阵操作 优化计算 不相等 指令 输出
【说明书】:

一个实施例提供了用于执行机器学习操作的计算设备,该计算设备包括:获取单元,用于获取具有多个输入操作数的单个指令,其中,所述多个操作数具有不相等的位长度,具有第一位长度的第一输入和具有第二位长度的第二输入;解码单元,用于将单个指令解码成经解码的指令;操作数长度单元,用于确定第一位长度和第二位长度中的较小位长度;以及计算单元,用于对多个输入操作数执行矩阵操作以生成具有较小位长度的位长度的输出值。

交叉引用

本申请要求2017年5月5日提交的印度临时专利申请号201741015868的权益,该专利申请据此通过引用纳入本文。

技术领域

实施例大体上涉及数据处理,并且更具体地涉及经由通用图形处理单元的机器学习处理。

背景技术

当前的并行图形数据处理包括被开发用于对图形数据执行特定操作的系统和方法,这些特定操作如例如线性内插、曲面细分、栅格化、纹理映射、深度测试等。传统上,图形处理器使用固定功能计算单元来处理图形数据;然而,最近,图形处理器的多个部分已变得可编程,从而使得这样的处理器能够支持用于处理顶点和片段数据的更广泛种类的操作。

为了进一步提高性能,图形处理器通常实现诸如流水线操作之类的处理技术,这些处理技术尝试贯穿图形流水线的不同部分并行地处理尽可能多的图形数据。具有单指令多线程(SIMT)架构的并行图形处理器被设计成使图形流水线中的并行处理量最大化。在SIMT架构中,多组并行线程尝试尽可能经常地一起同步执行程序指令,以提高处理效率。用于SIMT架构的软件和硬件的一般性概述可以在Shane Cook的《CUDA编程(CUDAProgramming)》,第3章,第37到51页(2013年)和/或Nicholas Wilt的《CUDA手册,GPU编程的综合指南(CUDA Handbook,A Comprehensive Guide to GPU Programming)》,章节2.6.2到3.1.2(2013年6月)中找到。

附图说明

为使得可以详细地理解本发明的特征,可通过参考实施例来具有对本发明的更具体的描述,在附图中展示了这些实施例中的一些。然而,应注意的是,附图仅展示典型的实施例,且因此将不被视为限制所有实施例的范围。

图1是示出了被配置成实现本文所述的实施例的一个或多个方面的计算机系统的框图;

图2A至图2D示出了根据实施例的并行处理器部件;

图3A至图3B是根据实施例的图形多处理器的框图;

图4A至图4F示出了其中多个GPU通信地耦合至多个多核处理器的示例性架构;

图5示出了根据实施例的图形处理流水线;

图6A是根据实施例的数据处理系统的框图;

图6B示出了提供用于在操作数加载时对指令的零挤压(zerosquashing)的技术的逻辑;

图6C示出了用于经由零挤压的轮次(pass)减少的逻辑;

图6D示出了根据实施例的合成指令或多轮次指令的轮次压缩;在一个实施例中,

图6E示出了用于实现本文中所描述的零挤压技术的硬件逻辑;

图6F示出了根据实施例的计算单元内的用于零挤压的硬件;

图7A示出了根据实施例的提供用于低精度整数乘法的技术的逻辑;

图7B示出了根据实施例的用于低精度整数乘法以避免累加器寄存器溢出的逻辑单元;

图7C示出了根据实施例的用于实现不相等位长度并行处理的逻辑;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810427080.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top