[发明专利]面向可重构阵列的多参数融合性能建模方法有效
| 申请号: | 201310156766.4 | 申请日: | 2013-04-28 |
| 公开(公告)号: | CN103218347A | 公开(公告)日: | 2013-07-24 |
| 发明(设计)人: | 尹首一;刘大江;刘雷波;魏少军 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06F15/80 | 分类号: | G06F15/80 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
| 地址: | 100084 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 面向 可重构 阵列 参数 融合 性能 建模 方法 | ||
技术领域
本发明涉及计算机处理器技术领域,具体涉及一种面向可重构阵列的多参数融合性能建模方法。
背景技术
可重构计算阵列Processing Element Array(PEA)是可重构处理器的重要组成部分,很多计算密集型运算都被映射到PEA上进行加速。为了更好的挖掘可重构计算阵列的计算潜能,我们需要要去优化算法在阵列上面的映射。虽然通过算法仿真可以得到时钟精确的阵列执行结果,但是由于算法映射的方法千差万别以及庞大复杂的算法任务,使得仿真过程需要大量的时间以至于我们的开发周期不能容忍。另外,可重构处理器拥有自己独特的硬件结构和运行机制,传统的性能评估模型不能直接应用。例如:阵列计算时间,阵列重构时间,阵列通信时间等参数都是影响阵列执行性能的重要参数。因此,为可重构计算阵列建立一个多参数融合的性能解析模型,并以此为度量去指导我们的算法映射将具有重要的意义。
百分之九十的执行时间花费百分之十的程序代码上,循环是典型的计算密集型运算。因此,前人有很多映射工作都集中在循环映射上。可重构计算阵列上的循环的映射主要分为以下几个主要的子问题:a)算子调度,即把一个算子放在哪一个时间控制步上面去执行。b)布局,即把一个算子放在阵列中的哪一个处理单元Processing Element(PE)上面去执行。c)布线,即怎么样去连接不同PE之间的数据通道。
很多前人的工作都把循环启动间隔Initial Interval(II)作为算法映射的度量,通过独立地或者联合地解决这三个子问题来寻求最小的II,从而获得最优的映射方式。这种寻求最小II的模调度方法是起源于多核处理器上面的软件流水方法。它通过重叠不同循环实例之间的算子,形成循环内核,从而获得并行性,缩短程序执行时间。然而可重构处理器不同于传统的通用多核处理器,影响其程序执行性能的参数不只是算子执行的并行性,还有包括阵列的不同运行实例之间的通信代价,以及改变阵列功能的重构代价。因此传统的以II为尺度的循环映射方法在可重构计算阵列上面不再精确和完备。
现有技术中缺乏一种专门面向可重构计算阵列的精确的,统一的性能评估模型。
发明内容
本发明旨在至少在一定程度上解决上述技术问题之一或至少提供一种有用的商业选择。为此,本发明的目的在于提出一种完备精确的面向可重构阵列的多参数融合性能建模方法。
根据本发明实施例的面向可重构阵列的多参数融合性能建模方法,将一个任务分解成一系列连续的阵列操作p=[1,P],则任务总体执行时间等于多次阵列操作的重构周期数,数据载入周期数,阵列计算周期数以及数据存储周期数的总和再乘以阵列工作频率,即:
其中,TET表示任务的总体执行时间,f表示阵列工作的频率,其中CFC表示重构周期,LDC表示数据载入周期,CPC表示阵列计算周期,STC表示数据存储周期。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310156766.4/2.html,转载请声明来源钻瓜专利网。





