[发明专利]用于根据高级程序进行脉动阵列设计的系统及方法在审
申请号: | 201810391781.X | 申请日: | 2018-04-27 |
公开(公告)号: | CN108805262A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 张鹏;俞浩;魏学超;潘培琛 | 申请(专利权)人: | 美国飞通计算解决方案有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 陆建萍;杨明钊 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理元件 脉动阵列 可重新配置 映射 二维阵列 高级程序 输入特征 配置 缓冲器 相邻处理元件 自动化系统 互连系统 神经网络 数据传递 双缓冲器 调度器 列排列 支持卷 存储 关联 | ||
公开了用于根据高级程序进行脉动阵列设计的系统及方法,该脉动阵列设计是自动的。支持卷积神经网络的脉动阵列设计的一种实现方式包括以行和列排列的可重新配置的处理元件的二维阵列。每个处理元件具有相关联的SIMD向量并且通过本地连接被连接至至少一个其他处理元件。具有双缓冲器的输入特征映射缓冲器被配置为存储输入特征映射,并且互连系统被配置为根据处理元件调度器将数据传递到相邻处理元件。使用被配置为确定合适的可重新配置的处理元件参数的自动化系统来将CNN计算映射到可重新配置的处理元件的二维阵列上。
技术领域
本公开涉及用于在诸如现场可编程门阵列(FPGA)的可重配置处理平台上进行脉动阵列设计和实现的自动化系统和方法。
背景和概述
卷积神经网络(CNN)是在深度学习应用中常用的计算结构,包括图像/视频分类和分析、自然语言理解和自主式车辆或机器人控制系统。许多这些实现都是在使用脉动阵列计算架构的FPGA上实现的。然而,使脉动阵列架构适于在大规模CNN实现中起作用是具有挑战性的设计问题,这需要考虑计算和通信两方面。因此,存在了对使自动化设计流程能够在合适的计算设备上实现高效的脉动阵列架构的方法的需要。
在一个实施例中,支持卷积神经网络(CNN)的脉动阵列可以包括以行和列排列的可重配置处理元件的二维阵列,其中每个处理元件具有相关联的SIMD向量并且通过本地连接连接到至少一个其他处理元件。具有双缓冲器的输入特征映射缓冲器可以用于存储输入特征映射。互连系统可以将数据传递到相邻的处理元件(例如在处理元件调度器中使用),并且使用被配置为确定合适的可重配置处理元件参数的自动化系统来将CNN计算映射到可重配置处理元件的二维阵列上。
在另一个实施例中,用于定义具有细粒度数据重用的计算系统的方法包括定义迭代器向量,该迭代器向量列出在循环嵌套中从最外循环到内循环的循环迭代器。定义循环迭代器的范围的迭代域D被设置,并且访问函数计算如何将循环迭代器映射到阵列r的访问索引,其中间循环l上的每个阵列r要求在不同循环l迭代中的阵列r上访问的数据是相同的。
在另一个实施例中,用于定义计算系统的方法包括找到用于用作机器学习系统的嵌套循环的一组可行的脉动阵列配置。鉴于可行的脉动阵列配置,确定多个中间循环的各个边界以提高设计吞吐量依赖于至少部分地基于DSP和BRAM利用来修剪可行的脉动阵列配置候选者。
附图说明
参考以下附图描述了本公开的非限制性和非穷尽的实施例,其中,除非以其它方式说明,在所有各个附图中相似的参考数字指代相似的部分。
图1是描绘由CNN计算映射生成的脉动架构的实施例的框图。
图2是描绘由CNN计算映射生成的脉动阵列架构的实施例的框图。
图3是描绘在脉动阵列中使用的处理元件的实施例的框图。
图4是描绘在脉动阵列中使用的输入特征映射缓冲器的实施例的框图。
图5是描绘与脉动阵列的实施例相关联的周期级调度的框图。
图6是描绘与脉动阵列的实施例相关联的周期级调度的示例的示意图。
图7是描绘被用作与脉动阵列的实施例相关联的循环分块(tiling)表示的基础的一组嵌套循环的示意图。
图8是描绘包括循环分块的脉动阵列的实施例的框图。
图9是描绘用于定义计算系统进行机器学习的方法的实施例的流程图。
图10是描绘用于定义具有细粒度数据重用的计算系统进行机器学习的方法的实施例的流程图。
图11是描绘用于定义用于机器学习的计算系统的方法的实施例的流程图。
图12是描绘服务器中的主机/加速器模型的实施例的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美国飞通计算解决方案有限公司,未经美国飞通计算解决方案有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810391781.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于八叉树的卷积神经网络
- 下一篇:网络中的多个层的可变精度和混合类型表示