[发明专利]数据处理方法、装置及设备有效
| 申请号: | 201810700318.9 | 申请日: | 2018-06-29 |
| 公开(公告)号: | CN108958938B | 公开(公告)日: | 2020-01-14 |
| 发明(设计)人: | 付鹏;王奎澎;寇浩锋;范彦文;周强;包英泽;方阳华;何声一 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/54 |
| 代理公司: | 11205 北京同立钧成知识产权代理有限公司 | 代理人: | 柴海平;刘芳 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 深度模型 装置及设备 数据处理 两组 空闲 并行 多帧数据 空闲等待 两帧数据 整体处理 数据帧 帧数据 单核 帧率 芯片 | ||
本发明提供一种数据处理方法、装置及设备。本发明的方法,通过将所有计算核分为至少两组,每组计算核用于共同执行一个数据帧的深度模型计算任务;CPU调度所述至少两组计算核并行地执行至少两帧数据的深度模型计算任务,实现了在进行一次深度模型计算的过程中,多组计算核并行地执行多帧数据的深度模型计算任务;对于每一组计算核,在对深度模型中不适于多个计算核完成该层计算的层进行计算时,该组内一个计算核负责该层的计算,该组内其他计算核空闲,而其他组的计算核同时在对其他帧数据进行深度模型计算,而不是空闲等待,减少了空闲计算核的数量,提高了计算核的单核利用率,从而提高了AI芯片的整体处理帧率。
技术领域
本发明涉及人工智能芯片技术领域,尤其涉及一种数据处理方法、装置及设备。
背景技术
人工智能(Artificial Intelligence,简称AI)芯片包括中央处理器(CentralProcessing Unit,简称CPU)和用于深度模型计算的多个计算核,通常用于基于视觉的深度模型的处理。通常深度模型包括多个需计算的层,对于输入深度模型的任意一帧数据,均需要经过逐层地计算。
目前,AI芯片中的全部计算核均参与深度模型的每一层的计算。在进行每一层的计算时,CPU将当前层的计算任务划分为多个子任务,由全部计算核并行地完成分配到的子任务,目的是为了提高深度模型计算的效率。
但是,深度模型中通常存在若干特殊层的计算任务不适合划分为多个子任务,这种特殊层的计算任务需由一个计算核执行,在该计算核执行其中一特殊层的计算任务期间,其他计算核空闲;需等待该计算核完成该特殊层的计算任务之后,才有可能参与下一个层的计算,造成AI芯片中计算核的单核利用率低,导致AI芯片的深度模型的处理效率低。
发明内容
本发明提供一种数据处理方法、装置及设备,用以解决现有AI芯片中计算核的单核利用率低,导致AI芯片的深度模型的处理效率低的问题。
本发明的一个方面是提供一种数据处理方法,包括:
将所有计算核分为至少两组,每组计算核用于共同执行一个数据帧的深度模型计算任务;
调度所述至少两组计算核并行地执行至少两帧数据的深度模型计算任务。
本发明的另一个方面是提供一种数据处理装置,包括:
分组模块,用于将所有计算核分为至少两组,每组计算核用于共同执行一个数据帧的深度模型计算任务;
调度模块,用于调度所述至少两组计算核并行地执行至少两帧数据的深度模型计算任务。
本发明的另一个方面是提供一种AI芯片,包括:CPU,多个用于深度模型计算的计算核,存储器,以及存储在所述存储器上并可所述CPU运行的计算机程序,
所述CPU运行所述计算机程序时实现上述所述的数据处理方法。
本发明的另一个方面是提供一种计算机可读存储介质,存储有计算机程序,
所述计算机程序被处理器执行时实现上述所述的数据处理方法。
本发明提供的数据处理方法、装置及设备,通过将所有计算核分为至少两组,每组计算核用于共同执行一个数据帧的深度模型计算任务;CPU调度所述至少两组计算核并行地执行至少两帧数据的深度模型计算任务,实现了在进行一次深度模型计算的过程中,多组计算核并行地执行多帧数据的深度模型计算任务;对于每一组计算核,在对深度模型中不适于多个计算核完成该层计算的层进行计算时,该组内一个计算核负责该层的计算,该组内其他计算核空闲,而其他组的计算核同时在对其他帧数据进行深度模型计算,而不是空闲等待,减少了空闲计算核的数量,提高了计算核的单核利用率,从而提高了AI芯片的整体处理帧率。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810700318.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种模板化计算环境配置方法
- 下一篇:服务资源的分配方法、装置及服务器





