[发明专利]用于对于系统协处理器的直接I/O访问的方法和装置有效
| 申请号: | 201180075152.2 | 申请日: | 2011-09-30 |
| 公开(公告)号: | CN104094244B | 公开(公告)日: | 2017-05-31 |
| 发明(设计)人: | W·R·马戈;R·J·伍德拉夫;D·M·李;A·R·戴维斯;M·S·赫夫蒂;J·L·科夫曼 | 申请(专利权)人: | 英特尔公司 |
| 主分类号: | G06F13/14 | 分类号: | G06F13/14;G06F13/16 |
| 代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 王英,张立达 |
| 地址: | 美国加*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 对于 系统 处理器 直接 访问 | ||
技术领域
本发明的实施例通常涉及计算设备,并且更加具体地涉及对于外围设备的存储器访问管理。
背景技术
计算设备包括经由诸如网络或总线结构的互连性组织彼此连接的各种设备。这些设备典型地包含本地存储器,并且多个设备并行操作以便在该计算环境下提供处理速度和灵活性。
远程直接存储器访问(RDMA)是使计算设备能够访问另一计算设备的存储器内的信息的一种网络接口卡(NIC)特征。具体地说,经由RDMA技术,所述计算设备可以从另一计算设备的存储器读取信息,也可以向该另一计算设备的存储器写入信息,而不涉及主机操作系统(OS)。
图1说明了一种现有技术系统,该系统包括具有CPU和存储器复合体的外围设备。系统100包括系统CPU 110、系统存储器120、外围设备控制器130、外围设备140和RDMA设备150。外围设备140包括处理器141和存储器142。外围设备140和RDMA设备150可以被称为“对等”设备。
外围设备140可能需要访问存储在RDMA设备150内的数据,并且反之亦然。目前,诸如无限带宽规范或RDMA联盟规范等等的许多互连性组织标准的实现不能够使对等设备能够直接访问存储在另一对等设备的地址空间中的数据。
当前的解决方案要求对等设备将所请求的数据写入到由连接到互连性组织的任意外围设备可用的公共可用存储器,在这一说明中是系统存储器120;然而,使用公共系统存储器用于这样的数据传输是耗时的,并且增加了开销处理。而且,使用公共系统存储器减慢了外围设备的处理操作。
附图说明
下面的描述包括图示的讨论,所述图示具有通过本发明实施例的实现示例的方式给出的说明。图示应该被理解为示例而非限制。如本文使用的,对一个或多个“实施例”的提及应该被理解为描述包括在本发明的至少一个实现中的特定特征、结构或特性。因而,本文出现的诸如“在一个实施例中”或“在可选实施例中”的短语描述本发明的各种实施例和实现,并且不必全部指代相同的实施例。然而,它们也不必互相排斥。
图1说明了包括具有CPU和存储器复合体的外围设备的现有技术系统。
图2是根据本发明实施例的系统的框图。
图3是根据本发明实施例的系统部件的框图。
图4是根据本发明实施例的处理的流程图。
图5是根据本发明实施例的处理的流程图。
图6是根据本发明实施例的主机和处理器外接卡模块的框图。
图7是可以利用本发明实施例的系统的框图。
下面是某些细节和实现的描述,包括可以阐释下文描述的实施例中的一些或全部的图示的描述,并且讨论本文提出的创造性概念的其它潜在实施例或实现。下面提供本发明实施例的概况,之后是参照图示更详细的描述。
具体实施方式
本发明的实施例描述能够在主机和具有CPU及处理器复合体(可选地在本文被称为处理器外接卡)的外围设备之间共享远程直接存储器访问(RDMA)设备硬件的系统、装置和方法。本发明的实施例利用诸如外围部件互连快速(PCIe)硬件的互连硬件用于处理器外接卡和RDMA设备之间的对等数据传输。主机系统可以包括用于向和/或从RDMA设备映射存储器和寄存器的模块或逻辑,从而能够向和从处理器外接卡上的用户模式应用直接执行I/O,与主机系统I/O操作同时进行。
可以利用本发明实施例的处理器外接卡的示例包括具有图形处理器单元(GPU)的图形处理器子系统以及具有多个小型、低功率处理器核心或多核心处理器以便改善高度并行应用的性能的处理器外接卡。然而,在加速的异构计算环境中,提供一种通用的基于标准的编程和通信模型已经证明是困难的。这在集群中尤其如此,在群集中,期望具有来自所有处理器的高效通信机制,无论它们是主系统CPU还是外接卡中的协处理器核心。一种通用的基于标准的编程模型不仅简化应用的开发和维护,而且允许使用系统的较高灵活性以便充分利用其性能。
集群通常指代已经被链接或互连为共同邻近以便进行操作的一组计算机系统,以使得在许多方面它们形成单个计算机。与单个计算机相比较,集群通常提供极大改善的性能和/或可用性。与具有相当的速度或者可用性的单个计算机相比较,集群也典型地更加成本有效。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180075152.2/2.html,转载请声明来源钻瓜专利网。





