[发明专利]一种众核处理器结构上避免无关依赖的线程划分方法有效

申请号：	201410007139.9	申请日：	2014-01-07
公开（公告）号：	CN103699365A	公开（公告）日：	2014-04-02
发明（设计）人：	王耀彬;刘志勤;陈菲;彭莉娟;李凌;赵旭剑	申请（专利权）人：	西南科技大学
主分类号：	G06F9/38	分类号：	G06F9/38
代理公司：	北京众合诚成知识产权代理有限公司 11246	代理人：	龚燮英
地址：	621010 四川省绵***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种处理器结构避免无关依赖线程划分方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于微处理器体系结构设计领域，尤其涉及一种众核处理器结构上避免无关依赖的线程划分方法。

背景技术

众核处理器结构是对片上可扩展能力达到数千个核、计算能力达到万亿次级的微处理芯片体系结构发展道路的探索。其计算资源密度更高，片上通信开销显著降低，能够实现芯片结构和性能高度的可扩展性，很好地应对纳米工艺代芯片设计的功耗、线延迟和设计复杂性问题。

线程划分是指将串行程序划分成若干线程（线程是程序中一些相关指令的离散序列，它与其他指令序列的执行彼此独立）,在片上多个处理器核心上并行执行来提高性能。众核结构上的线程划分是众核体系结构能否发挥效率的关键。

目前在学术界采用众核设计思想的研究项目主要有麻省理工的Raw,斯坦福大学的SmartMemories,康奈尔大学的CoreFusion，得克萨斯大学奥斯汀分校的TRIPS和TFLEX，以及华盛顿大学的WaveScalar等。工业界的开发项目主要有IBM、Sony和Toshiba合作开发的Cell，Intel的Polaris和Larrabee，IBM的Cyclops-64，NVIDIA的CUDA等。

在线程划分的原理上，当前这些方案基本采用了通过循环展开、尾部复制和谓词执行等技术将指令基本块合并为更大的超块作为线程，通过将这些线程推测执行以提高程序的并行性。所述的超块是指利用谓词执行等技术将若干个基本块集合在一起形成的一段指令序列，仅有唯一的控制流入口，可有多个出口。而所述的推测执行是指通过放松线程间的依赖关系对程序并行执行的限制，将线程放到多个不同的处理器核上推测地并行执行，从而充分挖掘程序的并行潜力。

他们的共同特点都是由编译软件做数据依赖剖析，并根据指令间的依赖关系将计算映射到硬件上，使得在并行性开发和负载平衡两方面取得折衷。所述的剖析是一种记录程序过去的执行来搜集信息，从而分析得到程序运行时特征的方法。它提供的信息能够指导编译器或者程序员去执行那些带有预见性的优化。通过软件手段确定程序动态执行特征，从而实现更加合理有效的线程划分。

但是当前的众核线程划分方案都带来了代码膨胀和线程同步开销过大的问题。其原因在于这些方案基本采用循环迭代和超块等粒度作为线程划分的基本单位，其线程划分方法均以指令基本块为最小单位，对基本块内自身的无关依赖未作分离。由此带来的推测线程间不必要依赖引入了大量无关开销。

发明内容

本发明的目的在于提供一种众核处理器结构上避免无关依赖的线程划分方法，旨在解决目前众核线程划分机制都采用循环迭代和超块等粒度作为线程划分的基本单位，其线程划分方法均以指令基本块为最小单位，对基本块内自身的无关依赖未作分离，由此带来的推测线程间不必要依赖引入了大量无关开销的问题。

本发明是这样实现的，一种众核处理器结构上避免无关依赖的线程划分方法包括如下步骤：

步骤一、程序剖析，确定具有并行潜力的循环结构；

步骤二、确定该循环迭代体的控制流图；

步骤三、确定该循环迭代体的数据流图；

步骤四、确定派生推测线程的数目；

步骤五、通过依赖分离，进行线程划分；

步骤六、进行线程封装。

进一步，所述的步骤一通过程序剖析技术选择出占据程序运行时间较多的一个或者多个循环结构，将其迭代体作为进一步划分的备选。

进一步，所述的步骤二确定并保存备选迭代体内指令间的控制流方向。