[发明专利]一种卷积神经网络加速装置和方法有效
| 申请号: | 201810181302.1 | 申请日: | 2018-03-06 |
| 公开(公告)号: | CN108388537B | 公开(公告)日: | 2020-06-16 |
| 发明(设计)人: | 刘明润;陈亮;李晓鹏 | 申请(专利权)人: | 上海熠知电子科技有限公司 |
| 主分类号: | G06F15/78 | 分类号: | G06F15/78;G06N3/063 |
| 代理公司: | 上海智晟知识产权代理事务所(特殊普通合伙) 31313 | 代理人: | 张东梅;李镝的 |
| 地址: | 200063 上海市普陀区*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 卷积 神经网络 加速 装置 方法 | ||
本发明的实施例提供一种卷积神经网络加速装置和方法。该卷积神经网络加速装置包括:调度单元,所述调度单元根据输入数据的尺寸/维度及滤波器的尺寸/步长产生控制命令,控制数据搬移单元和行数据扩展单元的行为;数据搬移单元,根据所述调度单元的命令,主动从系统存储空间中读取原始输入数据;行数据缓存单元,所述行数据缓存单元用于存储读入的原始输入数据;以及行数据扩展单元,所述行数据扩展单元每次从所述行数据缓存单元中读出一行原始数据,然后按照滤波窗口的尺寸将行数据扩展为不同滤波窗口中的一行数据。
技术领域
本发明涉及卷积神经网络领域,尤其涉及一种卷积神经网络加速装置和方法。
背景技术
卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,与传统的BP神经网络相比,具有识别效率高、旋转缩放不变性好等优点,已在数字图像处理及人脸识别等各个领域得到了广泛的应用。
传统卷积神经网络一般由多个交替的卷积层、池化层以及最后的全连接层组成。卷积神经网络可通过反向传播方法将网络损失传递到网络的所有层。参数更新学习过程通过随机梯度下降算法来实现。卷积神经网络与传统神经网络最大的区别在于,其卷积层采用了一种权值共享局部连接网络,而不是传统的权值独立全连接网络,这使得在层数相同的情况下,卷积神经网络的连接数目要远少于传统神经网络。卷积层的二维数据结构使得卷积神经网络非常适合于处理图像数据信息。此外,池化层的加入使得卷积神经网络对输入数据的几何变化(平移、缩放、旋转等)具有一定程度的稳健性。卷积神经网络由于其强大的数据特征提取能力和非线性学习能力,在性能上超越了大多数传统的机器视觉算法。目前在图像分类、目标识别等研究和应用领域,卷积神经网络已经成为主流方法。
然而,基于卷积神经网络的图像处理技术,如图像识别技术,为了从复杂场景中分开并识别出每个物体,需要使用大量的模板对图像进行遍历卷积计算,其数据搬运量大,计算量大导致计算时间长,因此很难实现实时物体识别。
异构计算系统是由主处理器和加速器两种体系结构处理器搭建而成的计算机系统。通过协调地使用性能、结构各异的处理单元,能够满足不同的计算需求,以获取最大总体性能方式完成加速计算。因此,异构计算对以上卷积神经网络计算问题的解决提供了较好的思路。
现有常见的异构计算系统有CPU+GPU和CPU+MIC(超多核心)组成异构计算系统等。异构计算系统能够有效地获取高性能计算能力,具有可扩展性好、计算资源利用率高、发展潜力巨大等优点,目前已成为并行/分布计算领域中的研究热点之一。
中国专利申请CN201710641599.0公开了一种异构计算平台与基于异构计算平台的加速方法。在该专利申请中,异构计算平台可包括主机与多个可编程器件,主机与各个可编程器件分别相连。主机用于初始化可编程器件、各个可编程器件的并行调度、为各个所述可编程器件发送计算数据以及获得计算结果。各个可编程器件并行处理分配给自身的计算数据。
主机在完成所述可编程器件的初始化之后,为完成初始化的各个可编程器件发送计算数据;各个可编程器件在收到所述主机发送的计算数据之后,分别结合发送给自身的计算数据进行并行计算,得到计算结果;最后,主机从各个可编程器件获得上述计算结果并进行保存。
在现有卷积神经网络计算中,由于主机和加速器(如可编程器件)的设计目标和计算性能的不同,计算数据的发送和搬运都需要主机来执行,通过大量的寄存器配置为加速器计算进行准备,然后启动加速器,通过中断方式告知主机加速完成,需要花费大量的主机时间和等待时间。此外,完成计算后主机从加速器系统内部存储中获得计算结果,并进行保存也会带来大量的系统时间损耗,从而严重影响了整个异构系统的计算效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海熠知电子科技有限公司,未经上海熠知电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810181302.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种现代物流查询系统
- 下一篇:一种生成书包减重建议的系统及方法





