[发明专利]一种FPGA异构加速方法、装置及系统有效
申请号: | 201810635674.7 | 申请日: | 2018-06-20 |
公开(公告)号: | CN108921289B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 张新;李龙;赵雅倩;陈继承 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06N3/06 | 分类号: | G06N3/06;G06N3/04;G06F15/78 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 fpga 加速 方法 装置 系统 | ||
本发明公开了一种FPGA异构加速方法、装置及系统;在本方案中,在主机端提供了面向不同机器学习平台的接口,从而获取不同网络的网络描述文件及数据,通过该网络描述文件可对FPGA端底层库中不同执行单元进行配置,从而实现对数据的计算;通过这种加速方式,可以使FPGA异构加速系统在针对新网络时,无需进行二次开发,避免对FPGA异构加速系统及源码重新编译,从而节省了人力资源和时间资源。
技术领域
本发明涉及异构加速技术领域,更具体地说,涉及一种FPGA异构加速方法、装置及系统。
背景技术
卷积神经网络(Convolutional Neural Network,CNN)是近年发展起来,并引起广泛重视的一种高效识别方法。Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性,继而提出了卷积神经网络,它包括卷积层、激活层、池化层、全连接层。现在,CNN已经成为众多科学领域的研究热点之一,特别是在模式分类领域,由于该网络避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了更为广泛的应用。FPGA在数据中心的加速有很多的研究,而且取得了很好的效果,成为主流的异构加速平台之一。FPGA用于CNN加速中也有很多的研究,相对于CPU/GPU起到了很好的加速效果。而且FPGA还有低延迟、低功耗等特点,所以在深度学习领域受到越来越多的关注。
目前,虽然GPU大范围用了做CNN的异构加速,但是GPU的功耗较大。越来越多的研究发现FPGA可以在高性能计算领域发挥着巨大作用,在处理卷积问题的速度完全可以和GPU媲美,目前虽然已经有FPGA用于CNN加速,但是大多都是对某一特定的网络进行加速,例如对alexnet,resnet50,resnet101等进行加速,如果换一个新的网络则需要做较大的改动,进行二次开发和调试,需要浪费大量人力和时间资源。
因此,如何避免FPGA异构加速系统对不同网络进行加速时,需要对原加速系统进行二次开发及调试,是本领域技术人员需要解决的问题。
发明内容
本发明的目的在于提供一种FPGA异构加速方法、装置及系统,以实现对不同网络进行加速,避免对FPGA异构加速平台的二次开发及调试。
为实现上述目的,本发明实施例提供了如下技术方案:
一种FPGA异构加速方法,基于FPGA端,包括:
从主机端获取数据及控制指令;所述控制指令为所述主机端对网络描述文件解析后生成的FPGA可识别的控制指令;所述主机端提供不同机器学习平台的接口,所述数据及网络描述文件为所述主机端通过目标机器学习平台的接口获取的;
通过所述控制指令调度底层库中不同的执行单元对所述数据进行计算,并将计算结果发送至所述主机端,以通过所述主机端对计算结果进行后续数据处理。
其中,所述从主机端获取数据及控制指令,包括:
FPGA端的一级调度单元解析所述控制指令,并在每个时钟周期计算feature数据和filter数据的访存地址;
利用feature数据的访存地址从所述主机端获取feature数据,并将所述feature数据和控制指令发送至所述FPGA端的二级调度单元;利用filter数据的访存地址从所述主机端获取feature数据,并缓存至所述一级调度单元。
其中,所述一级调度单元从主机端获取的feature数据和filter数据,为所述主机端将原始feature数据和原始filter数据进行封装后生成FPGA可读取数据。
其中,通过所述控制指令调度底层库中不同的执行单元对所述数据进行计算,包括:
所述二级调度单元利用硬件描述文件对底层库中的执行单元进行资源配置;所述执行单元包括卷积单元、激活单元、norm单元、池化单元中的至少一个执行单元;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810635674.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电力转换装置及其制造方法
- 下一篇:一种控制方法、机器人及计算机存储介质