[发明专利]一种集成网络路由器的众核处理器系统及其集成方法和实现方法有效
申请号: | 201410302494.9 | 申请日: | 2014-06-27 |
公开(公告)号: | CN104077138B | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | 曹政;李强;刘小丽;刘小兵;安学军;张佩珩;孙凝晖;邵恩 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F9/44 | 分类号: | G06F9/44 |
代理公司: | 北京律诚同业知识产权代理有限公司11006 | 代理人: | 祁建国,李岩 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 集成 网络 路由器 处理器 系统 及其 方法 实现 | ||
技术领域
本发明涉及多核或众核处理器系统领域,特别是涉及处理器内集成网络路由器的系统。
背景技术
随着半导体工艺的进步,单芯片晶体管数目不断增加,芯片内可集成的处理器核数越来越多,多核/众核处理器成为当前处理器的主流。从平衡设计角度出发,处理器核数的增加大大提高了处理器对网络性能的需求。当前的网络设备带宽在快速提升:网络设备如Infiniband的HCA卡在2014年将推出最高300Gb/s带宽的产品,以太网的100Gb/s已有验证产品,400Gb/s的规范也在制定之中。当带宽达到300Gb/s时,就已经与当前的DDR3访存带宽相当,因此亟需对当前的网络I/O系统进行优化。
目前,将网络路由器集成在处理器内是提高网络I/O性能的重要解决方法。IBM Blue Gene系列高性能计算机将高性能网络路由器(Router)集成在了处理器之内,图1所示的是IBM Blue Gene/Q处理器集成网络路由器的方法:将一个网络路由器(Router)挂载于片上网络(交叉开关),路由器内部包括一个片上网络接口、若干片间网络接口、若干网络处理引擎和交叉开关,每个片上和片间网络接口都配有一个处理网络协议的网络处理引擎,集成的网络路由器仅通过一个片上网络接口与片上网络进行数据交换,片间网络接口仅用于跟其他处理器间的通信,交叉开关则实现Router内部的数据交换。在期刊名称为:“IEEE Micro,vol(32):2,March2012,Pages48-60”,文献名称为:“The IBM Blue Gene/Q Compute Chip”,作者为:Ruud Haring,Martin Ohmacht等的文献中公开了上述集成网络路由器的方法。
图1的结构存在三个问题:1.路由器仅与片上网络有唯一的接口,限制了网络接入带宽,无法有效服务于众核处理器中的大量处理器核;2.路由器需要实现两种网络接口(片间网络接口和片上网络接口),且端口数目为两类网络接口数目之和;3.路由器内部仍需要独立的交叉开关,使得路由器的扩展性受到限制,也增加了路由器的面积和布线复杂度。
发明内容
本发明所要解决的技术问题在于提供一种集成网络路由器的众核处理器系统及其集成方法和实现方法,以克服现有技术中存在的集中式网络路由器部署方式带来的网络接入带宽狭小,需要独立的交叉开关的问题。
为达上述目的,本发明一种众核处理器系统集成网络路由器的方法,应用于包含处理器、片上网络、片间网络和网络路由器的众核处理器系统,包括:
划分子网步骤:通过将所述片上网络划分为多个子网平衡片内的网络请求;
网络接口设备部署步骤:将至少一个网络接口设备分布式部署在所述子网中,以确保部署的所述网络接口设备与所述子网内的处理器核之间的连通度最优化,以实现所述片上网络或所述片间网络快速数据交换。
上述众核处理器系统集成网络路由器的方法,所述划分子网步骤还包括:
子网划分子步骤:基于带权值全网络扩散方法进行子网划分,获取最终划分成功的所述子网。
上述众核处理器系统集成网络路由器的方法,所述带权值全网络扩散方法包括:
步骤1:将所述片上网络作为对应的图G,所述处理器核对应图G的顶点,所述处理器核之间的连线对应图G的边,所述图G包含所述顶点集合V,所述边集合E和权值集合W;
步骤2:设置所述顶点集V中的顶点的初始扩散值;
步骤3:基于所述初始扩散值进行扩散值迭代更新,获取迭代过程中邻接的所述顶点的扩散值差的绝对值的最大值,并记录所述最大值对应的所述边,如果多次迭代中所述最大值对应所述边为同一条边,则删除所述最大值对应所述边,否则继续执行所述子网获取步骤;
步骤4:如果所述扩散值迭代更新步骤中,得到的子网数量没有增加,则执行所述扩散值迭代更新步骤,否则,计算所述模块度Q,如果所述模块度获取步骤的所述模块度Q值增加,则执行所述扩散值迭代更新步骤,否则,形成一个划分子网;
步骤5:如果所述划分子网直径大于所述子网直径,则所述划分子网需要继续划分,执行所述子网获取步骤,否则,根据所述子网规模阈值进行判断所述划分子网的规模;
步骤6:所述子网规模判断步骤中,所述划分子网规模小于所述子网规模阈值,则进行子网合并,输出最终划分所述子网;
步骤7:如果所有子网满足所述子网规模阈值和所述子网直径,则输出最终划分成功的子网。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410302494.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:小型基站系统参数属性配置方法和装置
- 下一篇:对应用程序进行处理的方法和装置