[发明专利]运算控制装置、运算控制方法、存储有程序的非瞬时计算机可读介质以及OpenCL设备有效
申请号: | 201510069844.6 | 申请日: | 2015-02-10 |
公开(公告)号: | CN104834630B | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 京昭伦 | 申请(专利权)人: | 瑞萨电子株式会社 |
主分类号: | G06F15/80 | 分类号: | G06F15/80 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运算 控制 装置 方法 存储 程序 瞬时 计算机 可读 介质 以及 opencl 设备 | ||
本发明涉及运算控制装置、运算控制方法、存储有程序的非瞬时计算机可读介质以及OPEN CL设备。当由运算单元执行彼此相关的第一内核和第二内核时,如果第一内核的连续写入块的分配属性和第二内核的对应于连续写入块的连续读取块的分配属性相同,则场景确定单元以流水线通过使用连续写入块执行第一内核和第二内核,以便通过专用存储器或局部存储器执行第二内核而不将其传送给全局存储器。此时,场景确定单元按逻辑地将第二内核的连续读取块的裕度属性和依赖性属性分别加到第一内核的每个读取块的为读取块设置的裕度属性和依赖性属性。
相关申请的交叉引用
本申请基于并且要求于2014年2月10日提交的日本专利申请No.2014-23044的优先权利益,其公开内容通过引用整体被包含在此。
技术领域
本发明涉及一种并行处理器,更具体涉及一种OpenCL设备的运算控制技术。
背景技术
近来,由于防止处理器过热的需求,通过增加执行并行处理的处理器核(下文简称为“核”)的数量而不是增加处理器的工作频率来改进性能的趋势已经变得很显著。具有多个核的处理器被称为多核处理器,具有大量核的多核处理器尤其被称为众核处理器(many-core processor)。在此说明书中,多核处理器和众核处理器并不特别彼此区分,包括执行并行处理的多个核的处理器通常被称为“并行处理器”。
并行处理器用在各种领域作为加速器。但是,因为各种类型的加速器是各种制造商制造的且处于各种领域并且开发了用于加速器的进一步的各种语言和框架,在加速器之间共享程序代码较为困难。
为了解决这一问题,OpenCL(开放计算语言)被定义为用于并行处理器的标准框架(非专利文献1:The OpenCL Specication,Ver:1.0,Document Revision:43,KhronosOpenCL Working Group(2009))。在下面描述了OpenCL的概述。
图17是在上述非专利文献1的图3.1中添加附图标记的图,其示出了典型OpenCL系统的平台模型。
如图17中所示,OpenCL系统10包括主机12和一个或多个计算设备(下文中被称为“OpenCL设备”)14。OpenCL设备14对应于上述的加速器。
每个OpenCL设备14包括一个或多个计算单元(下文中被缩写为“CU”)16,并且每个CU 16包括一个或多个处理元件(下文中被缩写为“PE”)18。注意:处理元件PE 18对应于上述的核。
OpenCL应用由在主机12上运行的程序代码和在作为加速器的OpenCL设备14上运行的程序代码组成。在主机12上运行的程序代码被称为“主机代码”,并且在OpenCL设备14上运行的程序代码被称为“内核”。
主机12调用API(应用程序接口)并且指示运算处理。OpenCL设备14执行所指示的运算处理。主机12生成用于管理资源的环境并进一步生成命令队列用于通过OpenCL调停设备操作。“设备操作”包括执行运算处理、操作存储器、获取同步等。
在OpenCL中,内核在N(1≤N≤3)维索引空间中执行作为工作项目(其被简称为“项目”)。例如,如果(4,6)被规定为二维索引空间,总共24(4×6)项目被执行。
为了执行一个项目,使用一个PE。相应地,在并行执行的项目的数目和现有PE的数目相同的情况下,内核在四行乘六列的总共24个PE上执行。
注意:在现有PE的数目小于并行执行的项目的数目的情况下,项目的并行执行在现有PE上重复。例如,在规定上述(4,6)索引空间的情况下,当只有两行乘三列的总共六个PE时,六个项目的并行执行需要由六个PE重复四次。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞萨电子株式会社,未经瑞萨电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510069844.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种云翻译输入法及系统
- 下一篇:一种I2C总线电路、实现方法以及电子设备