[发明专利]运算控制装置、运算控制方法、存储有程序的非瞬时计算机可读介质以及OpenCL设备有效
申请号: | 201510069844.6 | 申请日: | 2015-02-10 |
公开(公告)号: | CN104834630B | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 京昭伦 | 申请(专利权)人: | 瑞萨电子株式会社 |
主分类号: | G06F15/80 | 分类号: | G06F15/80 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及运算控制装置、运算控制方法、存储有程序的非瞬时计算机可读介质以及OPEN CL设备。当由运算单元执行彼此相关的第一内核和第二内核时,如果第一内核的连续写入块的分配属性和第二内核的对应于连续写入块的连续读取块的分配属性相同,则场景确定单元以流水线通过使用连续写入块执行第一内核和第二内核,以便通过专用存储器或局部存储器执行第二内核而不将其传送给全局存储器。此时,场景确定单元按逻辑地将第二内核的连续读取块的裕度属性和依赖性属性分别加到第一内核的每个读取块的为读取块设置的裕度属性和依赖性属性。 | ||
搜索关键词: | 运算 控制 装置 方法 存储 程序 瞬时 计算机 可读 介质 以及 opencl 设备 | ||
【主权项】:
1.一种运算控制装置,所述运算控制装置控制OpenCL(开放计算语言)设备的多个处理元件的并行处理,所述OpenCL设备包括所述多个处理元件和对于所述多个处理元件提供的不同层级的多个存储器,所述运算控制装置包括:属性组存储单元,所述属性组存储单元获取并存储为读取块和写入块中的每个所设置的属性组,所述读取块是在所述多个存储器中的最低层级的存储器中存储的一个或多个数据块并且具有用于并行处理的被传送到不同层级的存储器的数据,所述写入块是在所述并行处理后作为对所述一个或多个读取块进行并行处理的结果而从所述不同层级的存储器传送到所述最低层级的存储器的一个或多个数据块;以及场景确定单元,所述场景确定单元基于在所述属性组存储单元中存储的每个属性组和用于指示所述OpenCL设备的配置的配置参数来确定所述读取块和写入块中的每个的传送方法,并且执行根据所确定的传送方法来对所述读取块和写入块的传送,以及执行与所述传送相对应的对所述并行处理的控制,其中,所述属性组包括对于确定所述传送方法所需的且不取决于所述OpenCL设备的配置的多个属性,包括:分配属性,所述分配属性用于指示是否将所述数据块分段为多个子块并且将所述子块进行传送,以及指示当对所述数据块进行分段时的分段方法,裕度属性,所述裕度属性用于指示:当将所述数据块分段成多个子块并且传送所述子块时,与所述子块一起传送的相邻于所述子块的数据的大小,以及依赖性属性,所述依赖性属性用于指示当将所述数据块分段成多个子块并且传送所述子块时所述子块是否具有与其它相邻子块的依赖性,并且指示当存在所述依赖性时的全部的依赖方向,基于这样的假设来设置所述写入块的属性组,所述假设是指:所述写入块已经存在于所述不同层级的存储器中且传送到所述最低层级的存储器,当在所述OpenCL设备中接连地执行第一内核和第二内核、并且对应于所述第一内核的并行处理的写入块包括被用作对应于所述第二内核的并行处理的读取块的连续写入块、并且针对所述第一内核所设置的所述连续写入块的所述分配属性与针对所述第二内核所设置的对应于所述连续写入块的读取块的所述分配属性是相同的时,所述场景确定单元通过使用所述连续写入块以经由所述不同层级的存储器来执行所述第二内核而不将所述连续写入块传送到最低层级,来进行以流水线执行所述第一内核和所述第二内核的流水线控制,以及在所述流水线控制中,对于与所述第一内核相对应的读取块中的每个读取块,在针对该读取块所设置的所述裕度属性和所述依赖性属性上,所述场景确定单元分别按逻辑地添加针对所述第二内核所设置的对应于所述连续写入块的读取块的所述裕度属性和所述依赖性属性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞萨电子株式会社,未经瑞萨电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510069844.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种云翻译输入法及系统
- 下一篇:一种I2C总线电路、实现方法以及电子设备