[发明专利]浮点数矩阵的处理方法、装置、设备及计算机可读存储介质有效
| 申请号: | 201710165155.4 | 申请日: | 2017-03-20 |
| 公开(公告)号: | CN108628807B | 公开(公告)日: | 2022-11-25 |
| 发明(设计)人: | 欧阳剑;周妮;王勇;漆维 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F17/16 | 分类号: | G06F17/16 |
| 代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 浮点 矩阵 处理 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种浮点数矩阵的处理方法,其特征在于,包括:
采用深度学习加速器内的极值单元,根据所述深度学习加速器内的直接内存存取DMA单元输出的待压缩的浮点数模型矩阵,获取所述浮点数模型矩阵的最小值和所述浮点数模型矩阵的最大值;
采用所述深度学习加速器内的压缩单元,根据数位宽度、所述极值单元输出的所述浮点数模型矩阵的最小值和所述浮点数模型矩阵的最大值,对所述浮点数模型矩阵进行压缩处理,以获得定点数模型矩阵;
采用所述深度学习加速器内的静态随机存取存储器SRAM,存储所述压缩单元输出的所述定点数模型矩阵;
采用所述深度学习加速器内的运算单元,从所述SRAM中获取所述定点数模型矩阵,对所述定点数模型矩阵的列向量以及所述压缩单元输出的定点数输入矩阵的行向量进行点乘运算,以获得定点数输出矩阵,所述定点数输入矩阵基于浮点数输入矩阵获得;
采用所述深度学习加速器内的解压缩单元,根据预先计算的参数以及所述运算单元输出的所述定点数输出矩阵进行解压缩处理,以获得浮点数输出矩阵,其中,所述预先计算的参数是基于所述极值单元输出的所述浮点数输入矩阵的最小值和所述浮点数输入矩阵的最大值,以及所述浮点数模型矩阵的最小值和所述浮点数模型矩阵的最大值确定的;
其中,所述根据预先计算的参数以及所述运算单元输出的所述定点数输出矩阵进行解压缩处理,以获得浮点数输出矩阵,包括:
利用公式Xvec*Yvec=α*β*Xvecint*Yvecint+Ymin*ΣXint+Xmin*ΣYint+N*XMin*YMin,对所述定点数输出矩阵进行解压缩处理,以获得所述浮点数输出矩阵;其中,
Xvec为所述浮点数模型矩阵的列向量;
Yvec为所述浮点数输入矩阵的行向量;
Xvec*Yvec为所述浮点数输出矩阵;
Xvecint*Yvecint为所述定点数输出矩阵;
所述预先计算的参数包括:α、β、ΣXint和ΣYint及N*XMin*YMin;
N为所述浮点数模型矩阵的列向量中元素的个数,或者所述浮点数输入矩阵的行向量中元素的个数;
α=(XMax-XMin)/2k,K为所述数位宽度,XMin为所述浮点数模型矩阵的最小值,XMax为所述浮点数模型矩阵的最大值;
β=(YMax-YMin)/2k,YMin为所述浮点数输入矩阵的最小值,YMax为所述浮点数输入矩阵的最大值;
Xvecint为所述定点数模型矩阵的列向量;
Yvecint为所述定点数输入矩阵的行向量;
ΣXint为所述定点数模型矩阵的行向量中每个元素之和;以及
ΣYint为所述定点数输入矩阵的列向量中每个元素之和。
2.根据权利要求1所述的方法,其特征在于,所述根据所述深度学习加速器内的直接内存存取DMA单元输出的待压缩的浮点数模型矩阵,获取所述浮点数模型矩阵的最小值和所述浮点数模型矩阵的最大值,包括:
对所述浮点数模型矩阵的全部元素进行极值求解处理,以获得所述浮点数模型矩阵的最小值和所述浮点数模型矩阵的最大值;或者
对所述浮点数模型矩阵的每列元素进行极值求解处理,以获得该列元素的最小值和该列元素的最大值;将所述浮点数模型矩阵的每列元素的最小值组成最小值向量,以作为所述浮点数模型矩阵的最小值,将所述浮点数模型矩阵的每列元素的最大值组成最大值向量,以作为所述浮点数模型矩阵的最大值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710165155.4/1.html,转载请声明来源钻瓜专利网。





