[发明专利]卷积神经网络数据流设计空间分析工具的构建方法和装置在审
申请号: | 202111171756.9 | 申请日: | 2021-10-08 |
公开(公告)号: | CN113821981A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 景乃锋;胡令矿;霍洋洋;张子涵;蒋剑飞;王琴;绳伟光;毛志刚 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F9/48;G06F9/50;G06F8/30;G06N3/04;G06N3/08 |
代理公司: | 上海思微知识产权代理事务所(普通合伙) 31237 | 代理人: | 田婷 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 神经网络 数据流 设计 空间 分析 工具 构建 方法 装置 | ||
本发明公开了一种卷积神经网络数据流设计空间分析工具的构建方法和装置,结合硬件特征与计算资源和存储资源的限制,构建面向阵列处理结构的卷积网络数据流设计空间探索方法,为在空间式阵列处理结构上映射卷积神经网络算法提供指导方向。
技术领域
本发明涉及阵列处理结构设计和神经网络数据调度领域,尤其是涉及一种卷积神经网络数据流设计空间分析工具的构建方法和装置。
背景技术
卷积神经网络(Convolutional Neural Networks,CNN)作为一种深度学习框架已经在图像、医疗等各个领域方向上得到了广泛的应用。伴随着人们对卷积神经网络研究的不断深入发展,神经网络结构变得愈发复杂,卷积规模也不断扩大。为此人们提出了多种卷积神经网络加速器设计,采用大量处理单元的阵列化结构加速卷积操作的处理。然而,由于硬件平台有限的片上计算资源和存储容量的限制以及架构硬件参数的多样性,使得卷积神经网络框架在平台上的最优化部署变得困难,而目前缺乏一种全面有效的针对神经网络在不同平台部署的解决方案。因此,面向通用硬件下卷积神经网络设计空间探索有其实际意义和必要性。
需要说明的是,公开于该发明背景技术部分的信息仅仅旨在加深对本发明一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
本发明的目的在于提供一种卷积神经网络数据流设计空间分析工具的构建方法和装置,用于解决现有技术中缺乏一种全面有效的针对神经网络在不同平台部署的解决方案。
为了解决以上技术问题,本发明提出一种卷积神经网络数据流设计空间分析工具的构建方法,所述构建方法包括:
针对阵列结构加速器进行硬件建模,获取所述阵列结构加速器的硬件参数;
对卷积七层循环结构的数据流调度方式进行分析,通过建立数据流与循环顺序的映射关系,获取描述循环交换的优化策略;
基于所述硬件参数和所述优化策略进行卷积延时的量化计算,在设计空间内获取卷积延时最低的优化参数,构建设计空间分析工具。
可选地,述构建方法还包括:
接入TVM图编译器Relay,以支持基于不同深度学习框架的不同神经网络结构。
可选地,所述硬件参数包括计算资源参数以及存储资源参数。
可选地,所述计算资源参数包括可独立的物理Slice数量、Slice连通粒度、单个Slice上用于核心计算的乘加单元数量、单个Slice上的LSE数量。
可选地,所述存储资源参数包括DRAM带宽、每个独立Slice的SRAM总容量、SRAM带宽、SRAM的划分粒度。
可选地,所述对卷积七层循环结构的数据流调度方式进行分析,通过建立数据流与循环顺序的映射关系,获取描述循环交换的优化策略,包括:
基于分块参数描述循环的分块优化策略,基于展开参数描述循环的展开优化策略,通过建立数据流与循环顺序的映射关系,获取循环交换的优化策略。
可选地,所述硬件模型包括阵列切片、存储模块和控制模块。
可选地,所述在设计空间内获取卷积延时最低的优化参数,包括:
通过遍历Slice的连通数量、内外层次的数据流、循环展开参数、循环分块参数计算所有的延时,并获取延时最低的参数组合作为所述优化参数。
基于同一发明构思,本发明提出一种卷积神经网络数据流设计空间分析工具的构建装置,所述构建装置包括:
硬件参数获取模块,其被配置为针对阵列结构加速器进行硬件建模,获取所述阵列结构加速器的硬件参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111171756.9/2.html,转载请声明来源钻瓜专利网。