[发明专利]运算装置以及相关产品在审
申请号: | 202010301181.7 | 申请日: | 2020-04-16 |
公开(公告)号: | CN113537476A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N20/00 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运算 装置 以及 相关 产品 | ||
1.一种运算装置,其特征在于,所述运算装置包括:
处理单元、第一存储单元和第二存储单元;
所述运算装置接收外部输入的输入数据以及二进制可执行文件,
其中,所述输入数据包括激活表和待处理的输入张量,所述运算装置将激活表存储至第一存储单元,将输入张量存储至第二存储单元;
所述处理单元运行所述二进制可执行文件时,从第二存储单元中读取输入张量,对所述输入张量进行缩放处理得到缩放输入张量,查找第一存储单元中的激活表对缩放输入张量进行激活得到中间激活结果,对中间激活结果进行缩放恢复处理得到激活结果,并将激活结果输出到第二存储单元。
2.根据权利要求1所述的运算装置,其特征在于,所述缩放处理包括:
所述处理单元根据所述输入张量、激活区间、缩放系数计算第一缩放张量,将第一缩放张量与输入张量进行对位乘得到缩放输入张量;
所述缩放恢复处理包括:所述处理单元根据所述输入张量、激活区间和恢复系数第一恢复张量,采用第一恢复张量对中间激活结果进行恢复处理得到输入张量的激活结果;
其中,所述激活区间用于表示激活表能够覆盖的数值范围,所述缩放系数用于表示对输入张量中的数据进行缩放的倍数,所述恢复系数用于表示对中间激活结果进行缩放恢复的倍数。
3.根据权利要求2所述的运算装置,其特征在于,
所述处理单元用于:
根据输入张量与激活区间确定第一索引张量以及第二索引张量;
根据第二索引张量和缩放系数计算第二缩放张量,根据第二索引张量和恢复系数计算第二恢复张量;
根据第一索引张量和第二缩放张量计算第一缩放张量,根据第一索引张量和第二恢复张量计算第一恢复张量。
4.根据权利要求2或3所述的运算装置,其特征在于,所述第一索引张量、第二索引张量的形状和输入张量的形状相同,
如果输入张量中的任一元素在激活区间内,则在第一索引张量中与该元素对应位置的元素为1,在第二索引张量中与该元素对应位置的元素为0;
如果输入张量中的任一元素不在激活区间内,则在第一索引张量中与该元素对应位置的元素为0,在第二索引张量中与该元素对应位置的元素为1。
5.根据权利要求3所述的运算装置,其特征在于,所述处理单元用于,将第二索引张量中的元素乘以所述缩放系数得到第二缩放张量,将第二索引张量中的元素乘以所述恢复系数得到第二恢复张量。
6.根据权利要求3-5任意一项所述的运算装置,其特征在于,所述第一缩放张量为第一索引张量和第二缩放张量的和,所述第一恢复张量为第一索引张量和第二恢复张量的和。
7.根据权利要求1-6任意一项所述的运算装置,其特征在于,所述输入张量为从图像、音频或者视频提取的张量数据。
8.根据权利要求1-6任意一项所述的运算装置,其特征在于,
所述第一存储单元为片上的静态随机存取存储器SRAM,所述第二存储单元为片外的双倍数据速率DDR存储器。
9.一种人工智能芯片,其特征在于,所述芯片包括如权利要求1-8中任意一项所述的运算装置。
10.一种电子设备,其特征在于,所述电子设备包括如权利要求9所述的人工智能芯片。
11.一种板卡,其特征在于,所述板卡包括:存储器件、接口装置和控制器件以及如权利要求9所述的人工智能芯片;
其中,所述人工智能芯片与所述存储器件、所述控制器件以及所述接口装置分别连接;
所述存储器件,用于存储数据;
所述接口装置,用于实现所述人工智能芯片与外部设备之间的数据传输;
所述控制器件,用于对所述人工智能芯片的状态进行监控。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010301181.7/1.html,转载请声明来源钻瓜专利网。