[发明专利]用于针对非对称执行单元高效调度的方法和装置有效
| 申请号: | 201480021706.4 | 申请日: | 2014-03-14 |
| 公开(公告)号: | CN105122211B | 公开(公告)日: | 2018-10-12 |
| 发明(设计)人: | 尼尔森·N·陈 | 申请(专利权)人: | 英特尔公司 |
| 主分类号: | G06F9/46 | 分类号: | G06F9/46 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 黄嵩泉 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 针对 对称 执行 单元 高效 调度 方法 装置 | ||
公开了用于实施乱序微处理器管线中的指令调度的方法。所述方法包括,选择指令的第一集合以从调度器分派到执行模块,其中所述执行模块包括两种类型的执行单元。第一类型执行单元执行第一类型指令和第二类型指令两者并且其中第二类型执行单元仅执行第二类型指令。接下来,方法包括,选择指令的第二集合以进行分派,所述第二集合是第一集合的子集并且仅包括第二类型指令。接下来,方法包括:确定指令的第三集合,所述第三集合包括没有选中作为第二集合的一部分的指令。最后,方法包括,分派第二集合用于使用第二类型执行单元执行,并且分派第三集合用于使用第一类型执行单元执行。
本申请是于2013年3月15日提交的、题为“METHOD AND APPARATUS FOR EFFICIENTSCHEDULING FOR ASYMMETRICAL EXECUTION UNITS”的、第NO.61/799,062号临时专利申请的转换,并要求其优先权和权益,其通过引用整体合并于本文中。
技术领域
根据本发明的实施例一般地涉及微处理器体系架构,并且更具体地,涉及用于乱序微处理器的体系架构。
背景技术
在乱序(OOO)微处理器中,允许指令不按照它们的程序顺序来发布和执行。OOO微处理器的调度器乱序选择和分派准备好的指令到执行单元。某些微处理器架构具有两种类型指令,A类型和E类型。A类型指令的示例是诸如加法和减法的整数运算,而E类型指令的示例是诸如浮点加法、浮点减法和浮点乘法的浮点运算。然而,应该注意,A类型和E类型指令都不仅限于上述示例。
然而,支持两种类型的指令的常规体系架构并没有可以支持两种类型的指令的执行单元。例如,常规处理器一般会有用于执行A类型指令的独有的执行单元,和用于执行E类型指令的独有的执行单元,其中两种类型的执行单元彼此相互排斥。
考虑到非统一的指令类型和非对称执行单元,在这样的体系架构中的调度器的目标一般是优化分派吞吐量。此外,调度器的另一个目标是优先于较新的指令先考虑较早的指令。以及最终,最后的目标在于在实施调度过程中保持有竞争力的延迟。
常规体系架构由于没有成功达成上述目标而因此有局限。例如,如上所述,常规架构可以采用选择A类型的指令仅在A类型执行单元中执行,并且挑选E类型指令仅在E类型执行单元中执行的原生策略。这允许为了更佳的延迟而并行实施执行,但是如果对于特定的执行单元类型没有足够的指令块,那么将导致没有使用的执行单元端口以及较小的整体分派吞吐量。
例如,在具有4个A类型执行单元和4个E类型执行单元的体系架构中存在5个A类型指令和3个E类型指令,那么至少1个E类型执行单元将空闲,因为A类型指令不能在E类型执行单元上执行。该方案的另一个问题在于其仅在单个分类(A或E)中是时间(age)优化的而没有针对整个时间优先顺序进行优化。在以上示例中,举例来说,只有7个指令将被分派。第5个A类型指令将不得不等待下一个周期。因此,常规体系架构是有局限的,并未设计为达到调度器的上述所有期望的目的。
发明内容
相应地,需要其中执行单元可以执行多种类型指令的方法和装置,例如A类型和E类型指令。此外,需要用于针对非对称执行单元更高效的调度的方法和装置,其优化分派吞吐量、优先于较新的指令先考虑较早的指令,并且维持有竞争力的延迟。
本发明的实施例支持非对称执行单元类型:A类型和E类型,其中A类型执行单元只支持A类型指令,但是E类型执行单元可以支持A和E类型指令。相应,A类型指令可以在A和E单元中执行,但是E类型指令只能在E单元中执行。相应,A类型执行单元可以是E类型执行单元的子集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480021706.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:瓜皮型金属屋面板
- 下一篇:GPU虚拟化的实现方法及相关装置和系统





