[发明专利]远程原子操作的空间和时间上的归并在审
申请号: | 201811444271.0 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109992302A | 公开(公告)日: | 2019-07-09 |
发明(设计)人: | C.J.休格斯;J.努茨曼;J.斯文尼布林;D.N.贾亚辛哈;S.S.苏里;D.A.库法蒂;N.D.麦克唐奈;刘彦呈;S.R.范多伦;S.J.鲁滨逊 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 郑瑾彤;闫小龙 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 指令 高速缓存行 匹配 优化电路 原子操作 指令队列 操作码 排队 归并 条目 检测 标识符 分组 队列条目 存储器 非重叠 入队列 源数据 偏移 响应 存储 扫描 | ||
1.一种用于以原子方式以弱排序来执行远程原子操作(RAO)指令的系统,所述系统包括:
RAO指令队列,其具有通过目的地高速缓存行进行分组的条目,每个条目要对包括操作码、目的地标识符和源数据的一个或多个RAO指令进行排队;
优化电路,其要接收正在进入的RAO指令、扫描所述RAO指令队列以检测标识了与所述正在进入的RAO指令相同的目的地高速缓存行的匹配的已排队RAO指令,所述优化电路还要:
响应于没有检测到匹配的已排队RAO指令,将所述正在进入的RAO指令排入所述RAO指令队列中;以及
响应于检测到匹配的已排队RAO指令,确定所述正在进入的RAO指令和匹配的RAO指令是否具有到非重叠的高速缓存行元素的相同的操作码,并且如果是这样,则通过将这两个RAO指令排入相同的目的地高速缓存行RAO指令分组中、在不同的高速缓存行偏移处来在空间上组合所述正在进入的RAO指令和匹配的RAO指令。
2.根据权利要求1所述的系统,其中,响应于由于所述正在进入的RAO指令和匹配的RAO指令具有相同的目的地标识符和不同但可兼容的操作码而确定了存在部分重叠,所述优化电路还要通过用新指令替换所述匹配的RAO指令来进行特殊处理,所述新指令在执行时产生与顺序地执行这两个指令相同的结果。
3.根据权利要求1所述的系统,其中,响应于确定了存在重叠,所述优化电路还要通过用新指令替换所述匹配的RAO指令来在时间上组合所述正在进入的RAO指令和匹配的RAO指令,所述新指令在执行时产生与顺序地执行这两个指令相同的结果。
4.根据权利要求1所述的系统,其中,响应于由于所述正在进入的RAO指令和匹配的RAO指令具有相同的目的地标识符但是不同的操作码而确定了存在部分重叠,所述优化电路还要通过以下方式来进行特殊处理:延迟所述正在进入的RAO指令直到所述匹配的RAO指令完成,并随后派遣所述正在进入的RAO指令以被执行。
5.根据权利要求1所述的系统,其中,所述正在进入的RAO指令和已排队的RAO指令各自还包括元素大小标识符,其中,响应于由于所述正在进入的RAO指令和匹配的RAO指令具有相同的目的地标识符和相同的操作码但是不同的所标识的元素大小而确定了存在部分重叠,所述优化电路还要通过以下方式来进行特殊处理:延迟所述正在进入的RAO指令直到所述匹配的RAO指令完成,并随后派遣所述正在进入的RAO指令以被执行。
6.根据权利要求1所述的系统,其中,响应于由于所述正在进入的RAO指令和匹配的RAO指令具有相同的目的地标识符但是不同的操作码而确定了存在部分重叠,所述优化电路还要通过以下方式来进行特殊处理:以待续信号被设置为TRUE的方式派遣所述匹配的RAO指令以被执行,并随后派遣所述正在进入的RAO指令以被执行。
7.根据权利要求1所述的系统,还包括有规律地递增的系统计数器,其中每个RAO指令队列条目还包括期满时间戳,并且其中,在将所述正在进入的RAO指令排入队列时,所述优化电路还要将所述期满时间戳初始化为在所述系统计数器之前的预定时间量,只要所述期满时间戳在所述系统计数器之前,所述已排队的RAO指令就可用于与其他指令组合。
8.根据权利要求7所述的系统,还包括多个核,每个核都并入了所述RAO指令队列的实例和所述优化电路的实例,每个核还包括:
提取电路,其要从代码存储提取RAO指令;
解码电路,其要解码所提取的指令并将所提取的指令提供给其优化电路的实例;以及
调度电路,其要扫描其RAO指令队列的实例,从其期满时间戳超过所述系统计数器的一个或多个已排队的RAO指令之中选择已排队的RAO指令,并派遣所选RAO指令以供从所述系统中的多个执行电路之中选择的执行电路来执行,其中所述调度电路相对于其他已排队的RAO指令无序地选择所述RAO指令,其中顺序被选择成优化时延、吞吐量、功率和性能中的至少一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811444271.0/1.html,转载请声明来源钻瓜专利网。