[发明专利]卷积运算装置及卷积运算方法有效
| 申请号: | 201611002218.6 | 申请日: | 2016-11-14 |
| 公开(公告)号: | CN108073548B | 公开(公告)日: | 2021-09-10 |
| 发明(设计)人: | 杜力;杜源;李一雷;管延城;刘峻诚 | 申请(专利权)人: | 耐能股份有限公司 |
| 主分类号: | G06F17/15 | 分类号: | G06F17/15 |
| 代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 赵志刚;赵蓉民 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 卷积 运算 装置 方法 | ||
本发明的题目是卷积运算装置及卷积运算方法。卷积运算装置包括一卷积运算模块、一内存以及一缓冲装置。卷积运算模块具有多个卷积单元,各卷积单元基于一滤波器以及多个当前数据进行一卷积运算,并于卷积运算后保留部分的当前数据;缓冲装置耦接内存以及卷积运算模块,从内存取得多个新数据,并将新数据输入至卷积单元,新数据不与当前数据重复。
技术领域
本发明系关于一种卷积运算装置,尤指一种适于数据串流的卷积运算装置。
背景技术
深度学习(deep learning)已是开展人工智能(Artificial intelligence,AI)的重要应用技术之一。其中,卷积神经网络(Convolutional Neural Network,CNN)则是近年来,引起广泛重视的一种深度学习高效识别技术。与其它深度学习架构相比,特别是在模式分类领域的应用,例如图像和语音识别方面,卷积神经网络避免了复杂的前期预处理,且可以直接输入原始图像或原始数据,因而得到了更为广泛的应用并可取得较佳的识别结果。
然而,卷积运算是一种很耗费效能的运算,在卷积神经网络的应用中,特别是卷积运算及连续平行运算,将占据大部分处理器的效能。另一方面,因特网的多媒体应用例如串流媒体也越来越广泛,因此,有必要提出一种卷积运算装置,当用于卷积运算及连续地平行运算的处理数据时,可具有优异的运算性能和低功耗表现,并且能够处理数据串流,实为当前重要的课题之一。
发明内容
有鉴于上述课题,本发明提出一种能够处理数据串流的卷积运算装置以及方法。
一种卷积运算装置包括一卷积运算模块、一内存以及一缓冲装置。卷积运算模块具有多个卷积单元,各卷积单元基于一滤波器以及多个当前数据进行一卷积运算,并于卷积运算后保留部分的当前数据;缓冲装置耦接内存以及卷积运算模块,从内存取得多个新数据,并将新数据输入至卷积单元,新数据不与当前数据重复。
在一实施例中,卷积单元基于滤波器、保留的当前数据以及新数据进行次轮卷积运算。
在一实施例中,滤波器移动的步幅小于滤波器的最短宽度。
在一实施例中,卷积运算装置进一步包括一加总单元,其耦接卷积运算模块,依据卷积运算的结果产生一特征输出结果。
在一实施例中,卷积运算装置包括多个卷积运算模块,卷积单元以及加总单元系能够选择性地操作在一低规模卷积模式以及一高规模卷积模式;其中,在低规模卷积模式中,加总单元配置来对卷积运算模块中对应顺序的各卷积运算的结果交错加总以各别输出一加总结果;其中,在高规模卷积模式中,加总单元将各卷积单元的各卷积运算的结果交错加总作为输出。
在一实施例中,卷积运算装置进一步包括一加总缓冲单元,其耦接加总单元与缓冲装置,暂存特征输出结果;其中,当指定范围的卷积运算完成后,缓冲装置从加总缓冲单元将暂存的全部数据写入到内存。
在一实施例中,加总缓冲单元包括一部分加总区块以及一池化区块。部分加总区块暂存加总单元输出的数据;池化区块对暂存于部分加总区块的数据进行池化运算。
在一实施例中,池化运算为最大值池化或平均池化。
在一实施例中,卷积运算装置进一步包括一数据读取控制器以及一指令译码器,指令译码器从数据读取控制器得到一控制指令并将控制指令译码,藉以得到目前从内存输入数据的大小、输入数据的行数、输入数据的列数、输入数据的特征编号以及输入数据在内存中的起始地址。
在一实施例中,各卷积单元包括多个低规模卷积输出以及一高规模卷积输出,低规模卷积输出时各卷积单元进行低规模卷积运算以输出低规模卷积结果,高规模卷积输出时各卷积单元进行高规模卷积运算以输出高规模卷积结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于耐能股份有限公司,未经耐能股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611002218.6/2.html,转载请声明来源钻瓜专利网。





