[发明专利]SLAM运算装置和方法有效
| 申请号: | 201811529500.9 | 申请日: | 2016-11-03 |
| 公开(公告)号: | CN109697184B | 公开(公告)日: | 2021-04-09 |
| 发明(设计)人: | 陈云霁;杜子东;张磊;陈天石 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
| 主分类号: | G06F15/16 | 分类号: | G06F15/16 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
| 地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | slam 运算 装置 方法 | ||
1.一种运算装置,其特征在于,所述装置包括:
存储部分,用于存储输入数据、临时运算结果数据、最终运算结果数据、运算过程所需的指令集和/或算法参数数据;
运算部分,与所述存储部分连接,用于完成对SLAM相关算法和应用的计算;
所述运算部分包括矩阵操作单元,所述矩阵操作单元包括m*n个矩阵运算部件,所述矩阵运算部件包括运算器和寄存器,其中,m、n为正整数;
所述寄存器包括行缓冲器和列缓冲器;
矩阵操作单元,用于读取一条卷积操作的宏指令,所述宏指令包括操作编码和操作数;
矩阵操作单元,用于根据所述宏指令,将输入的图像数据从静态随机存取存储器读取到寄存器中对应的位置;
所述寄存器,用于向所述矩阵操作单元中的每个矩阵运算部件中输入相应的图像数据,以及将卷积核广播给每个矩阵运算部件;
每个矩阵运算部件,用于将输入的图像数据与卷积核进行乘积运算,得到第一乘积运算结果,将所述乘积运算结果存储到对应的运算部件的寄存器;
矩阵运算单元用于将所述矩阵操作单元中的数据依次向左传递,所述寄存器用于在最右边的矩阵运算部件输入新的图像数据;
所述每个矩阵运算部件用于将新的图像数据与对应的卷积核进行乘法运算,得到第二乘积结果,将所述第二乘积结果与对应的运算部件的寄存器中的第一乘积运算结果进行累加,得到累加结果,将所述累加结果存储到所述对应的运算部件的寄存器;
所述矩阵运算部件,用于重复执行上述乘法运算,直至所有卷积核与对应的图像数据运算完成,得到输出结果,将所述输出结果保存至所述宏指令中指定的目的地址,所述输出结果为输出图像的1个像素点,直至输出图像所有像素点计算完成,得到最终结果;
所述操作数包括:DA、SA1、SA2、IX、IY、KX、KY,其中,所述DA为输出结果的存储地址,所述SA1为待运算的图像的起始地址,SA2为待运算的卷积核的起始地址,IX表示图像X方向上的大小,IY表示图像Y方向上的大小,KX和KY分别表示卷积核的大小。
2.根据权利要求1所述的运算装置,其特征在于,还包括:
控制部分,连接所述存储部分和运算部分,用于控制和协调存储部分和运算部分。
3.根据权利要求1所述的运算装置,其特征在于,所述存储部分包括:
输入存储模块:用于存储输入/输出数据;
中间结果存储模块:用于存储临时运算结果数据;
最终结果存储模块:用于存储最终运算结果数据;
指令存储模块:用于存储运算过程所需的指令集;和/或
缓冲存储模块:用于各种数据的缓冲存储。
4.根据权利要求1所述的运算装置,其特征在于,所述运算部分包括:
针对SLAM相关算法和应用而设计的加速和处理SLAM运算的加速运算装置;
其他运算的其他运算装置。
5.根据权利要求4所述的运算装置,其特征在于,所述加速运算装置包含向量运算单元和矩阵运算单元。
6.根据权利要求4所述的运算装置,其特征在于,
所述其他运算装置用于完成在算法和应用中使用但又不由加速运算装置完成的运算。
7.根据权利要求4所述的运算装置,其特征在于,所述运算部分通过硬件电路实现。
8.根据权利要求2所述的运算装置,其特征在于,所述控制部分连接存储部分的每个模块和运算部分,控制部分包括一个先进先出队列和一个控制处理器,先进先出队列用于存储控制信号,控制处理器用于取出待执行的控制信号,对控制逻辑进行分析后,对存储部分和运算部分进行控制和协调。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811529500.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种施工过程中实测实量的管理方法
- 下一篇:多瓦片处理阵列中的同步





