[发明专利]流水线结构神经网络矩阵运算架构及方法在审
| 申请号: | 201810813920.3 | 申请日: | 2018-07-23 |
| 公开(公告)号: | CN109144469A | 公开(公告)日: | 2019-01-04 |
| 发明(设计)人: | 王照钢;毛劲松;徐栋麟 | 申请(专利权)人: | 上海亮牛半导体科技有限公司 |
| 主分类号: | G06F7/498 | 分类号: | G06F7/498;G06F17/16;G06N3/06 |
| 代理公司: | 上海元好知识产权代理有限公司 31323 | 代理人: | 包姝晴 |
| 地址: | 201203 上海市浦东新区中国*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 输入矩阵 输入向量 累加 流水线结构 乘加操作 矩阵运算 流水线式 神经网络 输出 维度 架构 数字电路实现 反复迭代 继续执行 输出结果 相乘结果 向量矩阵 加速器 列向量 | ||
1.一种流水线结构神经网络矩阵运算架构,其特征在于,包含:
加速器,通过数字电路实现,用于对输入向量A和输入矩阵B执行流水线式乘加操作以得到A*B=D的结果,其中,A为一个维度1*m的列向量,B的维度为m*n,D为1行n列的向量矩阵输出结果;所述的流水线式乘加操作指,将输入矩阵B分为多个不同列块,将输入向量A与输入矩阵B 的第一列块进行乘和累加并将结果输出,再继续执行输入向量A与输入矩阵B中下一列块的乘和累加并将结果输出,如此反复迭代,直至输入向量A与输入矩阵B中最后一列块也完成了乘和累加并且结果也输出之后,即得到输入向量A与输入矩阵B的相乘结果D。
2.如权利要求1所述的流水线结构神经网络矩阵运算架构,其特征在于,所述的加速器包含:
定点乘累加模块,用于对输入向量A与输入矩阵B执行流水式乘加操作;该定点乘累加模块包含若干并行运行的定点乘加器,每个定点乘累加器的两个输入端依次输入向量A的1行m列的各个元素以及输入矩阵B对应列块中对应列里的各个元素,以分别同步地执行对输入向量A与输入矩阵B的对应列块中各对应列的乘和累加,并且计算完成后在计数器reset脉冲对每个定点乘加器的RC复位脉冲使能端的控制下进行乘累加结果的输出和归零,再执行输入向量A与输入矩阵B中下一个对应列块的乘和累加;
计数器,用于在定点乘加器每执行完一次输入向量A和输入矩阵B的对应列块的乘和累加后输出一个reset脉冲,该脉冲经过第一寄存器链产生流水线复位信号给每个定点乘加器的RC复位脉冲使能端,在定点乘累加模块每完成一次输入向量A与输入矩阵B的流水式乘加操作以后控制自身脉冲的清零;
移位器,用于控制输入向量A列数的移位深度;
第一寄存器链,计数器通过该第一寄存器链对每个定点乘加器的RC复位脉冲使能端进行脉冲控制;
第二寄存器链,输入向量A的1行m列元素连续地通过该第二寄存器链输入至每个定点乘加器;
若干第三寄存器链,输入矩阵B对应列块中的对应列元素连续地通过对应的第三寄存器链输入至对应的定点乘加器。
3.如权利要求2所述的流水线结构神经网络矩阵运算架构,其特征在于,还包含:
控制器,连接加速器,用于动态配置输入向量A的列数和输入矩阵B的行数m、输入矩阵B的列数n、以及加速器中计数器脉冲的数量,以便移位器控制对输入向量A列数的移位深度,和在完成一次输入向量A与输入矩阵B的对应列块的乘加操作以后计数器对RC复位脉冲使能端的控制,以及在完成一次输入向量A与输入矩阵B的流水式乘加操作以后计数器控制其脉冲的清零。
4.如权利要求1所述的流水线结构神经网络矩阵运算架构,其特征在于:
所述的控制器通过CPU实现。
5.如权利要求2所述的流水线结构神经网络矩阵运算架构,其特征在于:
定点乘加器以及第三寄存器链的数量分别与输入矩阵B每个列块所包含的列数相同。
6.一种数字电路实现的流水线结构神经网络矩阵运算的方法,其特征在于,包含:
通过数字电路实现对输入向量A和输入矩阵B执行流水线式乘加操作以得到A*B=D的结果,其中,A为一个维度1*m的列向量,B的维度为m*n,D为1行n列的向量矩阵输出结果;
所述的流水线式乘加操作指,将输入矩阵B分为多个不同列块,将输入向量A与输入矩阵B 的第一列块进行乘和累加并将结果输出,再继续执行输入向量A与输入矩阵B中下一列块的乘和累加并将结果输出,如此反复迭代,直至输入向量A与输入矩阵B中最后一列块也完成了乘和累加并且结果也输出之后,即得到输入向量A与输入矩阵B的相乘结果D。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海亮牛半导体科技有限公司,未经上海亮牛半导体科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810813920.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于心率监测耳机来调整播放终端音量的方法
- 下一篇:一种计算装置及方法





