[发明专利]一种执行循环任务的方法及装置有效
| 申请号: | 200910090402.4 | 申请日: | 2009-07-31 |
| 公开(公告)号: | CN101625636A | 公开(公告)日: | 2010-01-13 |
| 发明(设计)人: | 刘雷波;王延升;尹首一;于苏东;魏少军 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06F9/38 | 分类号: | G06F9/38;G06F15/76 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 | 代理人: | 何文彬 |
| 地址: | 10008*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 执行 循环 任务 方法 装置 | ||
技术领域
本发明涉及嵌入式系统领域,特别涉及一种执行循环任务的方法及装置。
背景技术
在程序中,某些关键算法以函数的形式体现,在运行程序过程中,这些函 数被连续的调用并执行,这些被连续调用并执行的函数称之为循环任务。其中, 循环任务被连续的调用并执行,占用了大量的计算时间。例如H.264解码程序 中的IDCT(Inverse Discrete Cosine Transform,反离散余弦变换)算法,该算法 处理对象是规模为4×4像素块。利用H.264解码程序处理规模为352×288的图 像时,需要循环调用并执行6336次IDCT算法,将占用大量的计算时间。
RCA(Reconfigurable Cell Array,可重构阵列)协处理器是一种能够对循环 任务进行加速执行的有效硬件结构。如图1所示是一个典型的RCA协处理器的 结构,具体结构如下:
第一、RCA协处理器由RC(Reconfigurable Cell,可重构单元)构成,每 个RC可实现绝大多数算术运算,例如,加法、减法、乘法和逻辑运算;
第二、RCA协处理器以行为单位,每行由多个RC构成,行内的RC之间 不能通信;
第三、RCA协处理器的行与行之间通过路由模块隔开,其中,路由模块的 输入除了来自于上一行RC的输出,还来自于RCA协处理器以外的数据。第一 个路由模块的输入来自最后一行RC的输出。
RCA协处理器的结构非常适合分多步执行循环任务。首先,循环任务被分 为多步;其次,一次将循环任务的每步对应的运算功能配置到RCA协处理器的 RC行上;最后,将循环任务的每步所需要的数据输入到RCA协处理器中,执 行循环任务。
理想情况下,RCA协处理器的行数是足够大的,不小于循环任务中的步数。 此时,可以一次将循环任务的每步的运算功能都配置到RCA协处理器上,但是, 在实际情况中,将循环任务的每步运算功能配置到RCA协处理器上并没有这么 简单。循环任务一般比较复杂,步数较多,同时,出于面积的考虑,RCA协处 理器的规模不可能做的很大。在这种情况下,循环任务包含的步数往往大于RCA 协处理器的行数,通过一次配置就将循环任务中的所有步的运算功能都配置在 RCA协处理器上已经无法实现,以致于RCA协处理器无法执行步数多于自身行 数的循环任务。
发明内容
为了能够执行步数多于RCA协处理器的行数的循环任务,本发明实施例提 供了一种执行循环任务的方法及装置。所述技术方案如下:
一种执行循环任务的方法,当循环任务的步数多于可重构阵列RCA协处理 器的可重构单元RC行数时,所述方法包括:
设置第一指针指向所述循环任务的第一行配置信息,设置第二指针指向所 述RCA协处理器的第一行RC;
将数据和所述第一指针指向的配置信息输入到所述第二指针指向的RC行, 利用所述配置信息使所述RC行对所述输入的数据进行运算;
设置所述第一指针指向所述循环任务的另一行配置信息,设置所述第二指 针指向所述RCA协处理器的另一行RC。
所述设置所述第一指针指向所述循环任务的另一行配置信息,具体包括:
当所述第一指针指向的配置信息为最后一行时,设置所述第一指针指向第 一行配置信息;
当所述第一指针指向的配置信息不是最后一行时,设置所述第一指针指向 下一行配置信息。
所述设置所述第二指针指向所述RCA协处理器的另一行RC,具体包括:
当所述第二指针指向所述RCA协处理器的最后一行RC时,设置所述第二 指针指向所述RCA协处理器的第一行RC;
当所述第二指针指向的RC行不是最后一行时,设置所述第二指针指向下一 行RC。
所述利用所述配置信息使所述RC行对所述输入的数据进行运算,具体包 括:
利用所述第一指针指向的配置信息配置所述第二指针指向的RC行的运算 功能,使所述第二指针指向的RC行根据配置的运算功能,对所述输入的数据进 行运算。
一种执行循环任务的装置,当循环任务的步数多于可重构阵列RCA协处理 器的可重构单元RC行数时,所述装置包括:
第一设置模块,用于设置第一指针指向所述循环任务的第一行配置信息, 设置第二指针指向所述RCA协处理器的第一行RC;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910090402.4/2.html,转载请声明来源钻瓜专利网。





