[发明专利]基于主辅数据结构的CPU-GPU合作计算方法无效

专利信息
申请号: 201010244535.5 申请日: 2010-07-29
公开(公告)号: CN101894051A 公开(公告)日: 2010-11-24
发明(设计)人: 安虹;姚平;刘谷;徐光;许牧;李小强;韩文廷;张倩;徐恒阳 申请(专利权)人: 中国科学技术大学
主分类号: G06F9/50 分类号: G06F9/50;G06F15/16
代理公司: 北京市立方律师事务所 11330 代理人: 马佑平
地址: 230026*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 数据结构 cpu gpu 合作 计算方法
【说明书】:

技术领域

发明涉及计算机领域,具体而言,本发明涉及基于主辅数据结构的CPU-GPU合作计算方法。

背景技术

高效能运算领域要达到极高效率的输出,通常必须透过大量CPU进行连结,CPU(Central Processing Unit,中央处理器)是控制电脑运行的核心,利用平行分散处理进行运算,但这种结构不仅程序开发难度高,硬件体积大,功耗更是惊人。GPGPU  (General-Purpose Computing on Graphics Processing Units,通用计算图形处理器)概念的兴起,也是为了弥补这些传统CPU架构上的弱点。

一般单颗GPU(Graphics Processing Unit,图形处理器)通常会内建数十到数百个可程序化处理单元,只要透过正确的方法利用这些专精于平行运算的处理单元,便可在某些应用层面取得非常大的运算效能增长。也因为这样的特性,未来GPGPU也被视为云端运算,甚至是人工智能的可能解决方案。

截至目前为止,GPGPU在服务器应用方面要比一般消费性运算更受使用者肯定,如在生物医学、气象模拟、电影工业、专业图形处理等应用领域中,由GPGPU运算即能节省许多运算时间,但在消费性应用方面,GPGPU所带来的好处相较于专业应用则较不明显。

GPGPU的特点是:CPU作为主控者,运行操作系统、处理输入输出、控制程序流程;GPU作为协处理器,运行需要大量计算的核心函数。

GPGPU面临两个问题:1)GPU上线程负载平衡问题。由于各线程使用相同的代码,造成了每个线程的实际工作量都一样,均为最大有效计算工作量。而实际上,每个线程有效的工作量可能并不一样,因此会造成GPU负载不平衡。2)CPU和GPU的利用率问题。CPU和GPU间的合作计算方式将直接影响它们的利用率。在同步调用模式下,CPU调用GPU后必须等待其计算完毕才能进行下一步工作,使得CPU的利用率比较低;在异步调用模式下,CPU虽然能够在调用GPU后立即返回,在GPU进行计算的同时进行并行计算,但是此并行计算量的大小很难确定。如果CPU并行计算量过小,CPU的利用率仍然很低;如果CPU并行计算量过大,以至于GPU计算完成后需要等待CPU给其分配新的计算任务,就会导致GPU的利用率低;只有CPU并行计算量所需的时间恰好和GPU计算时间相同时,才能同时得到较高的CPU和GPU利用率,但要精确的确定此CPU并行计算量是非常困难的。

因此,有必要提出一种有效的技术方案,以解决CPU-GPU合作计算的问题。

发明内容

本发明的目的旨在至少解决上述技术缺陷之一,特别是提出一种有效的CPU-GPU合作计算方案,以提高计算机的高效能运算。

为了达到上述目的,本发明的实施例提出了一种主辅数据结构的CPU-GPU合作计算方法,包括以下步骤:

根据处理的对象,确定主辅数据结构并进行初始化;

读入待处理的数据,直到没有数据为止,并向CPU计算线程和GPU计算线程发出数据读入结束信号RF;

所述CPU计算线程和所述GPU计算线程对读入的数据进行处理。

根据本发明的实施例,读入待处理的数据包括:

读入一个单位数据,将其预处理为主数据和辅助数据,分别存储至相应的主数据管理区间和辅助数据结构中,并保持映射关系。

根据本发明的实施例,所述主数据为所述处理的对象的单位数据的实体内容,所述辅助数据为描叙主数据的信息。

根据本发明的实施例,所述CPU计算线程对读入的数据进行处理包括以下步骤:

步骤A:判断是否获得RF信号,如果获得,则设置标记FL为真,否则设置为假;

步骤B:依次扫描主数据管理区间,对满足CPU处理条件的区间,调用CPU进行处理,同时维护辅助数据结构;

步骤C:判断标记FL的值,如果为真,则结束,否则继续执行步骤A。

根据本发明的实施例,所述GPU计算线程对读入的数据进行处理包括以下步骤:

步骤D:判断是否获得RF信号,如果获得,则设置标记FL为真,否则设置为假;

步骤E:依次扫描主数据管理区间,对满足CPU处理条件的区间,调用CPU进行处理,同时维护辅助数据结构;

步骤F:判断标记FL的值,如果为真,则结束,否则继续执行步骤D。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010244535.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top