[发明专利]卷积处理单元、神经网络处理器、电子设备及卷积运算方法有效
申请号: | 201911253109.5 | 申请日: | 2019-12-09 |
公开(公告)号: | CN111091181B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 方攀;陈岩 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/063;G06N3/084 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 李汉亮 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 处理 单元 神经网络 处理器 电子设备 运算 方法 | ||
本申请实施例提供一种卷积处理单元、神经网络处理器、电子设备及卷积运算方法,所述卷积处理单元用于:根据卷积核对输入数据进行一次取窗操作,得到第一窗体区域,所述第一窗体区域沿深度方向包括第一数量层的第一深度数据;获取多个卷积核,所述多个卷积核沿深度方向包括第一数量层的第二深度数据;以及将一层的所述第一深度数据与所述多个卷积核同一层的所述第二深度数据进行乘累加运算,得到第一运算数据。得到的目标运算数据的格式与输入数据的格式相同,不需要变形,可以直接作为下一运算层(如卷积层或池化层)的输入,省去了格式变化步骤,提高了卷积运算的整体效率。
技术领域
本申请涉及电子技术领域,特别涉及一种卷积处理单元、神经网络处理器、电子设备及卷积运算方法。
背景技术
卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deeplearning)的代表算法之一。在卷积神经网络中,卷积运算是卷积神经网络中最主要的计算,卷积运算的效率直接影响卷积神经网络的效率。相关技术中,卷积神经网络中的卷积运算效率不够高。
发明内容
本申请实施例提供一种卷积处理单元、神经网络处理器、电子设备及卷积运算方法,可以提高卷积神经网络中卷积运算的效率。
本申请实施例公开一种卷积处理单元,所述卷积处理单元用于:
根据卷积核对输入数据进行一次取窗操作,得到第一窗体区域,所述第一窗体区域沿深度方向包括第一数量层的第一深度数据;
获取多个卷积核,所述多个卷积核沿深度方向包括第一数量层的第二深度数据;以及
将一层的所述第一深度数据与所述多个卷积核同一层的所述第二深度数据进行乘累加运算,得到第一运算数据。
本申请实施例还公开一种神经网络处理器,其包括:
数据缓存单元,存储输入数据;
卷积处理单元,所述卷积处理单元通过所述数据缓存单元获取输入数据,所述卷积处理单元为上述所述的卷积处理单元。
本申请实施例还公开一种电子设备,其包括:
系统总线;以及
神经网络处理器,所述神经网络处理器为上述所述的神经网络处理器,所述神经网络处理器与所述系统总线连接。
本申请实施例还公开一种卷积运算方法,其包括:
根据卷积核对输入数据进行一次取窗操作,得到第一窗体区域,所述第一窗体区域沿深度方向包括第一数量层的第一深度数据;
获取多个卷积核,所述多个卷积核沿深度方向包括第一数量层的第二深度数据;
将一层的所述第一深度数据与所述多个卷积核同一层的所述第二深度数据进行乘累加运算,得到第一运算数据。
将多层的所述第一深度数据对应的多个所述第一运算数据累加得到目标运算数据。
本申请实施例中,卷积处理单元对输入数据的卷积运算中,可以将输入数据的第一窗体区域和多个卷积核乘累加运算,具体将第一窗体区域的一层第一深度数据和多个卷积核同一层的第二深度数据进行乘累加运算,得到第一运算数据,得到的目标运算数据的格式与输入数据的格式相同,不需要变形,可以直接作为下一运算层(如卷积层或池化层)的输入,省去了格式变化步骤,提高了卷积运算的整体效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的神经网络处理器的第一种结构示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911253109.5/2.html,转载请声明来源钻瓜专利网。