[发明专利]利用弹性浮点数的系统、方法和设备在审
| 申请号: | 201910272344.0 | 申请日: | 2019-04-04 |
| 公开(公告)号: | CN110457067A | 公开(公告)日: | 2019-11-15 |
| 发明(设计)人: | P·T·唐 | 申请(专利权)人: | 英特尔公司 |
| 主分类号: | G06F9/30 | 分类号: | G06F9/30 |
| 代理公司: | 31100 上海专利商标事务所有限公司 | 代理人: | 何焜;黄嵩泉<国际申请>=<国际公布>= |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 编码格式 浮点 存储 尾数 方法和设备 标识字段 操作数 非重叠 符号位 浮点数 指令 申请 | ||
本申请公开了利用弹性浮点数的系统、方法和设备。描述了利用弹性浮点编码格式的系统、设备和方法。具体地,指令的至少一个操作数是以弹性浮点编码格式将要存储或存储了数据。在一些实施方式中,浮点编码格式包括符号位、自标识字段、尾数以及非重叠指数范围。
技术领域
本发明的领域总体上涉及计算机处理器架构,并且更具体地,涉及使用浮点数,这些浮点数因为精度可以根据所使用的编码而变化所以是弹性的。
背景技术
当要在严格的功率预算内进行密集计算时,由于占用空间较小,因此经常使用降低精度的算术操作数。一个示例是深度学习,在其中,有时通过电气和电子工程师协会(IEEE)标准754/2008浮点(诸如FP16)算术指令或通过整数算术指令来进行训练和推断。
附图说明
本发明是通过示例说明的,并且不局限于各个附图的图示,在附图中,相同的参考标号指示类似的元件并且其中:
图1(A)和图1(B)展示了与IEEE FP16类似的16位EFP编码(EFP16)的实施例;
图2(A)和图2(B)展示了与IEEE FP16类似的16位EFP编码(EFP16)的实施例;
图3展示了用于处理诸如使用基于EFP的操作数的指令等指令的硬件的实施例;
图4展示了利用EFP数据来处理指令的执行电路系统的实施例;
图5展示了用于处理具有两个EFP源数据操作数(A和B)的乘法指令的详细执行电路系统的实施例;
图6展示了由处理器执行以用于使用EFP格式的数据来处理指令的方法的实施例;
图7展示了用于解码EFP值的方法的实施例;
图8A和图8B是框图,展示了根据本发明的实施例的通用向量友好指令格式及其指令模板;
图9A是框图,展示了根据本发明的实施例的示例性专用向量友好指令格式;
图9B是框图,展示了根据本发明的一个实施例的专用向量友好指令格式的构成完整操作码字段的字段;
图9C是框图,展示了根据本发明的一个实施例的专用向量友好指令格式的构成寄存器索引字段的字段;
图9D是框图,展示了根据本发明的一个实施例的专用向量友好指令格式900的构成扩充操作字段的字段;
图10是根据本发明一个实施例的寄存器架构的框图;
图11(A)是框图,展示了根据本发明的实施例的示例性有序流水线和示例性寄存器重命名、乱序发布/执行流水线两者;
图11(B)是框图,展示了将被包括在根据本发明的实施例的处理器中的有序架构核的示例性实施例和示例性寄存器重命名、乱序发布/执行架构核;
图12A至图12B展示更具体的示例性有序核架构的框图,所述核将是芯片中的若干逻辑块(包括相同类型和/或不同类型的其他核)中的一个逻辑块;
图13是根据本发明的实施例的可具有多于一个的核、可具有集成存储器控制器、以及可具有集成图形器件的处理器的框图;
图14至图17是示例性计算机架构的框图;以及
图18是对照根据本发明的实施例的用于将源指令集中的二进制指令转换为目标指令集中的二进制指令的软件指令转换器的使用的框图。
具体实施方式
在以下描述中,阐述了众多具体细节。然而,应当理解,可以在没有这些具体细节的情况下实践本发明的实施例。在其他实例中,没有详细示出众所周知的电路、结构和技术,以避免模糊对本说明书的理解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910272344.0/2.html,转载请声明来源钻瓜专利网。





