[发明专利]使用低精度和高精度的混合推理在审
申请号: | 201910973729.X | 申请日: | 2018-04-23 |
公开(公告)号: | CN110543332A | 公开(公告)日: | 2019-12-06 |
发明(设计)人: | E·乌尔德-阿迈德-瓦尔;B·拉克舍玛南;T·史佩斯曼;J·雷;P·T·唐;M·斯特里克兰德;陈晓明;姚安邦;B·J·阿什博;L·L·赫德;马立伟 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38;G06F13/40;G06F13/42;G06N3/04;G06N3/063;G06N3/08;G06T1/20 |
代理公司: | 31100 上海专利商标事务所有限公司 | 代理人: | 陈依心;黄嵩泉<国际申请>=<国际公布> |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了使用低精度和高精度的混合推理。一个实施例提供了一种用于执行机器学习操作的计算设备,所述计算设备包括:指令解码逻辑,所述指令解码逻辑用于将包括多个操作数的单个指令解码成单个经解码指令,所述多个操作数具有不同的精度;以及包括第一逻辑单元和第二逻辑单元的通用图形计算单元,所述通用图形计算单元用于执行所述单个经解码指令,其中,执行所述单个经解码指令包括以第一精度对所述多个操作数中的第一组操作数执行第一指令操作,并且同时以第二精度对所述多个操作数中的第二组操作数执行第二指令操作。 | ||
搜索关键词: | 操作数 解码指令 图形计算单元 指令解码逻辑 计算设备 逻辑单元 指令操作 单个指令 机器学习 解码 通用 推理 申请 | ||
【主权项】:
1.一种通用图形处理单元,包括:/n流式多处理器,具有包括硬件多线程的单指令多线程(SIMT)架构,其中,所述流式多处理器包括:/n第一处理块,所述第一处理块包括具有第一浮点数据路径的第一处理核和具有第一整数数据路径的第二处理核,所述第一整数数据路径独立于所述第一浮点数据路径,其中所述第一整数数据路径用于启用第一指令的执行,并且所述第一浮点数据路径用于启用第二指令的同时执行;/n第二处理块,所述第二处理块包括具有第二浮点数据路径的第三处理核和具有第二整数数据路径的第四处理核,所述第二整数数据路径独立于所述第二浮点数据路径,其中所述第二整数数据路径用于启用第三指令的执行,并且所述第二浮点数据路径用于启用第四指令的同时执行;以及/n存储器,与所述第一处理块以及所述第二处理块耦合。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910973729.X/,转载请声明来源钻瓜专利网。