[发明专利]一种面向深度神经网络的双FPGA协同工作方法在审
申请号: | 201711306456.0 | 申请日: | 2017-12-07 |
公开(公告)号: | CN108228969A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 程陶然;白林亭;文鹏程;郭锋;李亚晖;刘作龙 | 申请(专利权)人: | 中国航空工业集团公司西安航空计算技术研究所 |
主分类号: | G06F17/50 | 分类号: | G06F17/50 |
代理公司: | 中国航空专利中心 11008 | 代理人: | 杜永保 |
地址: | 710000 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 协同 并行 嵌入式计算环境 神经网络模型 硬件资源 智能计算 有效地 网络 分析 | ||
1.一种面向深度神经网络的双FPGA协同工作方法,该方法通过对深度神经网络模型进行分析,根据深度神经网络由多个子层构成这一特征,划分计算任务,实现双FPGA芯片协同工作;其特征在于:所述划分计算任务的方法包括串行划分、并行划分两种。
2.根据权利要求1所述一种面向深度神经网络的双FPGA协同工作方法,其特征在于:所述串行划分方法:通过评估神经网络各子层的计算复杂度,依据网络对计算资源的需求,将其划分为前后两部分,均衡两部分的计算量;其中,前部分包括子层1到子层i的计算,由第一个FPGA芯片完成,子层i的计算结果传入第二个FPGA芯片,完成芯片间的数据传输;后部分包括子层i+1到子层N及最后分类层的计算,由第二个FPGA芯片完成,并输出最终计算结果。
3.根据权利要求1所述一种面向深度神经网络的双FPGA协同工作方法,其特征在于:所述并行划分方法:从第一子层开始,将神经网络的每一层都划分成两部分,分别布置在两个FPGA芯片上,原始图像同时传入两个芯片开始并行计算;在子层i-1(1<i<N)计算完成后,根据需要交换中间计算结果,完成芯片间数据传输,继续并行执行子层i的计算;最后考虑到分类层数据关联度较大,不进行划分,在一个FPGA芯片内完成计算,并输出最终结果。
4.根据权利要求2、3任意一项所述一种面向深度神经网络的双FPGA协同工作方法,其特征在于:芯片间数据传输使用吉比特串行收发器(GTX)实现,其通信协议可自定义。
5.根据权利要求1所述的一种面向深度神经网络的双FPGA协同工作方法,其特征在于:所述划分计算任务的方法可扩展为三片甚至四片FPGA的协同工作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航空工业集团公司西安航空计算技术研究所,未经中国航空工业集团公司西安航空计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711306456.0/1.html,转载请声明来源钻瓜专利网。