[发明专利]循环预测器指导的循环缓冲器有效
申请号: | 201410512577.0 | 申请日: | 2014-09-29 |
公开(公告)号: | CN104298488B | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 陈国华;杨梦晨;高新宇;巩凡工;黄振华 | 申请(专利权)人: | 上海兆芯集成电路有限公司 |
主分类号: | G06F9/32 | 分类号: | G06F9/32 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 钱大勇 |
地址: | 201203 上海市张*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 循环 预测 指导 缓冲器 | ||
1.一种处理器,包括:
指令高速缓存;
执行引擎;
指令缓冲器来缓存经一解码单元解码的循环指令;以及
循环预测器,其中:
训练分支指令来确定循环的经训练的循环计数,其中该循环包括以该分支指令的目标开始并且以该分支指令结束的指令序列;以及
判断该循环的尺寸是否不大于该指令缓冲器的尺寸;并且
其中,当该循环的尺寸不大于该指令缓冲器的尺寸时,处理器:
停止从该指令高速缓存取指;
将该循环指令从该指令缓冲器发送到该执行引擎而不从该指令高速缓存取指该循环指令;
维持一循环弹出计数,其指示将该分支指令从该指令缓冲器发送到该执行引擎而不从该指令高速缓存取指的次数;以及
当该循环弹出计数小于该经训练的循环计数时,预测该分支指令为被采用,否则,则预测该分支指令为不被采用。
2.如权利要求1所述的处理器,进一步包括:
其中,当该循环的尺寸大于该指令缓冲器的尺寸时,处理器:
从该指令高速缓存取指该循环指令,解码该循环指令并将其发送到该执行引擎;
维持一循环取指计数,其指示从该指令高速缓存取指该分支指令的次数;以及
当该循环取指计数小于该经训练的循环计数时,预测该分支指令为被采用,否则,则预测该分支指令为不被采用。
3.如权利要求2所述的处理器,进一步包括:
循环取指表,保存多个经训练的分支指令的每个的各自的循环取指计数。
4.如权利要求1所述的处理器,其中该循环弹出计数达到阈值,该处理器在该分支指令之后的顺序下一指令处恢复从该指令高速缓存取指;
其中该阈值是该经训练的循环计数减去((A*C)/B);
其中A是该处理器从该指令高速缓存获取指令、解码指令并将指令提供给该指令缓冲器所需要的处理器时钟周期的预定数量;
其中B是该循环指令的数量;以及
其中C是每个时钟周期该处理器能够从该指令缓冲器发送到该执行引擎的指令的数量。
5.如权利要求1所述的处理器,其中该指令缓冲器保存已经从该指令高速缓存取指然后被解码但是尚未发送到该执行引擎的指令。
6.如权利要求1所述的处理器,进一步包括:
循环弹出表,其保存多个经训练的分支指令的每个的各自的循环弹出计数。
7.如权利要求1所述的处理器,进一步包括:
经训练的循环计数表,其保存用于多个经训练的分支指令的每个的各自的经训练的循环计数。
8.如权利要求1所述的处理器,进一步包括:
分支高速缓存,包括多个条目,其中所述多个条目中的每个条目保存:
基于先前的该分支指令的运行的历史的该分支指令的预测;以及
标志,用以指示该分支指令是否是具有该经训练的循环计数的经训练的分支指令;并且
其中当所述标志指示分支指令是该经训练的分支指令时,处理器使用该经训练的循环计数来预测该分支指令,否则,则使用该分支高速缓存的预测。
9.如权利要求1所述的处理器,其中循环预测器进一步包括经训练的循环计数寄存器,该经训练的循环计数寄存器存储要与该循环弹出计数比较的该经训练的循环计数的经流水线向下输送的版本。
10.一种通过具有指令高速缓存、指令缓冲器和执行引擎的处理器执行的方法,该方法包括:
训练分支指令来确定循环的经训练的循环计数,其中该循环包括以该分支指令的目标开始并且以该分支指令结束的指令序列;
判断该循环的尺寸是否不大于该指令缓冲器的尺寸;以及
当该循环的尺寸不大于该指令缓冲器的尺寸时:
停止从该指令高速缓存取指;
将循环指令从该指令缓冲器发送到执行引擎而不从该指令高速缓存取指该循环指令,其中,经一解码单元解码后得到该循环指令;
维持一循环弹出计数,其指示该分支指令从该指令缓冲器被发送到该执行引擎而不从该指令高速缓存取指的次数;以及
当该循环弹出计数小于该经训练的循环计数时,预测该分支指令为被采用,否则,则预测该分支指令为不被采用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海兆芯集成电路有限公司,未经上海兆芯集成电路有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410512577.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:大规模非线性动态优化算法代码生成系统
- 下一篇:移动终端自动调整输出的方法