[发明专利]一种用于卷积神经网络CNN的硬件加速系统及控制方法在审
| 申请号: | 202011081151.6 | 申请日: | 2020-10-12 |
| 公开(公告)号: | CN111931926A | 公开(公告)日: | 2020-11-13 |
| 发明(设计)人: | 杨东天;王中风;孟明;杨灿 | 申请(专利权)人: | 南京风兴科技有限公司 |
| 主分类号: | G06N3/063 | 分类号: | G06N3/063 |
| 代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
| 地址: | 210032 江苏省南京市*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 卷积 神经网络 cnn 硬件加速 系统 控制 方法 | ||
本发明示出一种用于卷积神经网络CNN的硬件加速系统及控制方法。硬件加速系统包括:CNN网络模型服务器和CNN硬件加速器。硬件加速系统的控制方法为:设计人员根据应用需求选择合适的网络模型,CNN网络模型服务器接收网络模型,预先生成控制指令和网络参数的文件,CNN硬件加速器预先存储控制指令和网络参数的文件。在实际应用场景中,CNN硬件加速器被部署在应用系统里,用以当应用系统运行时,接收特征数据,并基于上述控制指令对网络参数和特征数据进行CNN计算,最终将计算结果输出给应用系统的控制单元。本发明示出的硬件加速系统可以预先生成控制指令,解决了因软硬件实时交互消耗一定时间造成的加速器性能下降的问题。
技术领域
本发明涉及硬件加速领域,具体涉及一种用于卷积神经网络CNN的硬件加速系统及控制方法。
背景技术
卷积神经网络(convolutional neural network,CNN)是人工智能的主流解决方案,通过CNN诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用或不好用”到“可以用”的技术突破。但是,目前的CNN网络模型都比较大,需要海量的计算来完成任务。因此我们在实际应用中通过部署CNN硬件加速器来提高数据处理能力。
现有技术中,CNN硬件加速器通常采用在中央处理器(central processing unit,CPU)或数字信号处理器(Advanced RISC Machine,ARM)等处理器上运行软件,和CNN硬件加速器实时交互实现控制的方法,协同完成CNN硬件加速处理。软件和CNN硬件加速器配合一起实现CNN硬件加速,这种方案虽然便于灵活部署,但是部署时要求必须有CPU或者ARM等处理器来运行软件,对基础硬件的需求较高。
然而,现有技术存在如下问题:由于软件介入,软硬件交互需要消耗一定时间,导致加速系统性能的下降。
发明内容
针对现有技术存在的上述技术问题,本发明目的在于提供一种用于卷积神经网络的硬件加速系统及控制方法,解决CNN硬件加速器在使用时因软硬件交互导致系统性能下降的问题。
本发明第一方面示出一种用于卷积神经网络CNN的硬件加速系统,包括CNN网络模型服务器和CNN硬件加速器,
CNN网络模型服务器被配置为:接收网络模型;以及,根据网络模型预先生成控制指令和网络参数文件,控制指令用于当应用系统运行时控制CNN硬件加速器完成CNN计算;
CNN硬件加速器被配置为:预先接收和存储CNN网络模型服务器输出的控制指令和网络参数文件;以及,当应用系统运行时,接收采集到的特征数据;以及,基于控制指令对网络参数文件和特征数据进行CNN计算,直到完成CNN计算,得到CNN计算结果。
设计人员根据应用需求选择合适的网络模型,CNN网络模型服务器接收网络模型,预先生成控制指令和网络参数的文件,CNN硬件加速器预先存储控制指令和网络参数的文件。在实际应用场景中,CNN硬件加速器被部署在应用系统里,用以当应用系统运行时,接收特征数据,并基于上述控制指令对网络参数和特征数据进行CNN计算,将CNN计算结果输出至应用系统。
进一步,CNN网络模型服务器包括:网络模型训练模块和CNN加速工具链模块,
网络模型训练模块被配置为:接收网络模型,基于网络模型得到训练后的网络参数;
CNN加速工具链模块被配置为:读取网络模型和网络参数,生成控制指令和网络参数文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京风兴科技有限公司,未经南京风兴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011081151.6/2.html,转载请声明来源钻瓜专利网。





