[发明专利]一种用于卷积神经网络CNN的硬件加速系统及控制方法在审

申请号：	202011081151.6	申请日：	2020-10-12
公开（公告）号：	CN111931926A	公开（公告）日：	2020-11-13
发明（设计）人：	杨东天;王中风;孟明;杨灿	申请（专利权）人：	南京风兴科技有限公司
主分类号：	G06N3/063	分类号：	G06N3/063
代理公司：	北京弘权知识产权代理事务所(普通合伙) 11363	代理人：	逯长明;许伟群
地址：	210032 江苏省南京市***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种用于卷积神经网络 cnn 硬件加速系统控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明示出一种用于卷积神经网络CNN的硬件加速系统及控制方法。硬件加速系统包括：CNN网络模型服务器和CNN硬件加速器。硬件加速系统的控制方法为：设计人员根据应用需求选择合适的网络模型，CNN网络模型服务器接收网络模型，预先生成控制指令和网络参数的文件，CNN硬件加速器预先存储控制指令和网络参数的文件。在实际应用场景中，CNN硬件加速器被部署在应用系统里，用以当应用系统运行时，接收特征数据，并基于上述控制指令对网络参数和特征数据进行CNN计算，最终将计算结果输出给应用系统的控制单元。本发明示出的硬件加速系统可以预先生成控制指令，解决了因软硬件实时交互消耗一定时间造成的加速器性能下降的问题。

技术领域

本发明涉及硬件加速领域，具体涉及一种用于卷积神经网络CNN的硬件加速系统及控制方法。

背景技术

卷积神经网络（convolutional neural network，CNN）是人工智能的主流解决方案，通过CNN诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用或不好用”到“可以用”的技术突破。但是，目前的CNN网络模型都比较大，需要海量的计算来完成任务。因此我们在实际应用中通过部署CNN硬件加速器来提高数据处理能力。

现有技术中，CNN硬件加速器通常采用在中央处理器（central processing unit，CPU）或数字信号处理器（Advanced RISC Machine，ARM）等处理器上运行软件，和CNN硬件加速器实时交互实现控制的方法，协同完成CNN硬件加速处理。软件和CNN硬件加速器配合一起实现CNN硬件加速，这种方案虽然便于灵活部署，但是部署时要求必须有CPU或者ARM等处理器来运行软件，对基础硬件的需求较高。

然而，现有技术存在如下问题：由于软件介入，软硬件交互需要消耗一定时间，导致加速系统性能的下降。

发明内容

针对现有技术存在的上述技术问题，本发明目的在于提供一种用于卷积神经网络的硬件加速系统及控制方法，解决CNN硬件加速器在使用时因软硬件交互导致系统性能下降的问题。

本发明第一方面示出一种用于卷积神经网络CNN的硬件加速系统，包括CNN网络模型服务器和CNN硬件加速器，

CNN网络模型服务器被配置为：接收网络模型；以及，根据网络模型预先生成控制指令和网络参数文件，控制指令用于当应用系统运行时控制CNN硬件加速器完成CNN计算；

CNN硬件加速器被配置为：预先接收和存储CNN网络模型服务器输出的控制指令和网络参数文件；以及，当应用系统运行时，接收采集到的特征数据；以及，基于控制指令对网络参数文件和特征数据进行CNN计算，直到完成CNN计算，得到CNN计算结果。

设计人员根据应用需求选择合适的网络模型，CNN网络模型服务器接收网络模型，预先生成控制指令和网络参数的文件，CNN硬件加速器预先存储控制指令和网络参数的文件。在实际应用场景中，CNN硬件加速器被部署在应用系统里，用以当应用系统运行时，接收特征数据，并基于上述控制指令对网络参数和特征数据进行CNN计算，将CNN计算结果输出至应用系统。

进一步，CNN网络模型服务器包括：网络模型训练模块和CNN加速工具链模块，

网络模型训练模块被配置为：接收网络模型，基于网络模型得到训练后的网络参数；

CNN加速工具链模块被配置为：读取网络模型和网络参数，生成控制指令和网络参数文件。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京风兴科技有限公司，未经南京风兴科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011081151.6/2.html，转载请声明来源钻瓜专利网。

上一篇：用于核心筒内筒体的可折叠模板系统
下一篇：一种基于区块链的多方交易信息一致性维护方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种用于卷积神经网络CNN的硬件加速系统及控制方法在审

专利文献下载