[发明专利]向量处理器的低位宽数据矩阵向量化列裁剪方法及系统有效

申请号：	202111510660.0	申请日：	2021-12-10
公开（公告）号：	CN114138692B	公开（公告）日：	2023-06-20
发明（设计）人：	苏华友;陈抗抗;刘朝润;姜晶菲;王庆林;许金伟;高蕾;窦勇	申请（专利权）人：	中国人民解放军国防科技大学
主分类号：	G06F13/28	分类号：	G06F13/28;G06F15/80
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	刘源
地址：	410073 湖***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	向量处理器低位数据矩阵量化裁剪方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种向量处理器的低位宽数据矩阵向量化列裁剪方法，其特征在于，包括：

将低位宽数据矩阵存储在双倍速率同步动态随机存储器中；

调用直接存储器访问操作，将所述低位宽数据矩阵从所述双倍速率同步动态随机存储器加载到片上阵列存储器AM空间；

在AM空间中，对加载到片上AM空间后的矩阵进行列裁剪处理，得到列裁剪后的矩阵；

在所述AM空间中，对加载到所述片上AM空间后的矩阵进行列裁剪处理，得到列裁剪后的矩阵，包括：

步骤1、令offset0＝2，offset1＝0，令AM0为AM上半空间起始地址，AM1为AM下半空间起始地址，AM2与AM3为AM0偏移0个低位宽数据后的地址，矩阵A的子矩阵为A’，矩阵B的子矩阵为B’；

步骤2、判断N是否超过预设阈值，其中，所述预设阈值需小于空间大小，如果超过，则跳转至步骤19，否则，跳转到步骤3；

步骤3、基于直接存储器访问，将子矩阵A’中的前N-2个数据传输到子矩阵B’；

步骤4、基于直接存储器访问，将子矩阵A’从第N-2数据开始从双倍速率同步动态随机存储器加载到片上空间AM0；

步骤5、使用向量加载指令，从AM2开始，将低位宽1xL的数据按照半字向量加载到向量寄存器VR0，从第AM2+L-2开始，将低位宽1xL的数据按照半字向量加载到向量寄存器VR1，从AM2+offset0开始，按照半字向量加载到向量寄存器VR10，AM2自增2×(L-2)个低位宽数据，其中，L表示向量处理单元中向量处理部件的数量；

步骤6、使用扩展指令，对向量寄存器VR0数据进行低位低位宽扩展操作，并加载到向量寄存器VR32；

步骤7、使用扩展指令，对向量寄存器VR10数据进行低位低位宽扩展操作，并加载到向量寄存器VR33；

步骤8、使用向量存储指令，将向量寄存器VR32中数据按照字向量存回片上空间AM1；

步骤9、使用向量存储指令，将向量寄存器VR33中数据按照字向量存回片上空间AM1+offset0；

步骤10、使用向量加载指令，将存储回AM1+offset1的数据按照字向量加载到向量寄存器VR0；

步骤11、使用向量存储指令，将向量寄存器VR0中数据按照半字向量存回片上空间AM3，AM3自增L-2个低位宽数据大小；

步骤12、将向量寄存器VR1中的数据加载到向量寄存器VR0中；

步骤13、使用向量加载指令，从AM2开始，将低位宽1xL的数据按照半字向量加载到向量寄存器VR1，AM2自增L-2个低位宽数据；

步骤14、使用扩展指令，对向量寄存器VR0数据进行低位低位宽扩展操作，并加载到向量寄存器VR32；

步骤15、使用向量存储指令，将向量寄存器VR32中数据按照字向量存回片上空间AM1；

步骤16、使用向量加载指令，将存储回AM1的数据偏移2个低位宽数据，按照字向量加载到向量寄存器VR0；

步骤17、使用向量存储指令，将向量寄存器VR0中数据按照半字向量存回片上空间AM3，AM3自增L-2个低位宽数据大小；

步骤18、一直循环步骤12-17，直至完成数据的裁剪或者所占AM空间已经超过阈值，如果停止条件为完成数据的裁剪，则跳转至步骤24，否则，跳转至步骤22；

步骤19、基于直接存储器访问，根据AM空间大小，将子矩阵A’中的前N-2个数据分批次传输到子矩阵B’；

步骤20、令offset0＝2，offset1＝0，令AM0为AM上半空间起始地址，AM1为AM下半空间起始地址，AM2与AM3为AM0偏移0个低位宽数据后的地址，矩阵A的子矩阵为A’，矩阵B的子矩阵为B’，基于直接存储器访问，将子矩阵A’中从N-11个数据分批次传输到AM0中；

步骤21、执行步骤4-16，计算剩余需要传输的数据下标X；

步骤22、令offset0＝0，offset1＝1，令AM0为AM上半空间起始地址，AM1为AM下半空间起始地址，AM2与AM3为AM0偏移0个低位宽数据后的地址，矩阵A的子矩阵为A’，矩阵B的子矩阵为B’，基于直接存储器访问，将子矩阵A’中从N-11个数据分批次传输到AM0中，基于直接存储器访问，将子矩阵A’中从下标为X的数据开始，将数据分批次传输到AM0中；

步骤23、执行步骤5-16，计算剩余需要传输的数据下标X，如果剩余的数据大于0，跳转至步骤22，否则，跳转至步骤24；

步骤24、基于直接存储器访问，将矩阵存储回双倍速率同步动态随机存储器中，完成子矩阵列裁剪操作；

步骤25、当M为偶数时，按照上述方法，对各个子矩阵进行列裁剪，最终可完成整个矩阵[M×N]的列裁剪；当M是奇数时，对各个子矩阵进行列裁剪，可完成将对矩阵[(M-1)×N]的列裁剪，并且基于直接存储器访问，将第M行的数据进行对应传输，最终可完成整个矩阵[M×N]的列裁剪。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学，未经中国人民解放军国防科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111510660.0/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F13-00 信息或其他信号在存储器、输入/输出设备或者中央处理机之间的互连或传送
G06F13-10 .对外部设备的程序控制
G06F13-14 .对互连或传送请求的处理
G06F13-38 .信息传送，例如，在总线上进行的
G06F13-40 ..总线结构
G06F13-42 ..总线传送协议，例如，信号的交接过程；同步

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]向量处理器的低位宽数据矩阵向量化列裁剪方法及系统有效

专利文献下载