[发明专利]运算装置以及相关产品在审
申请号: | 202010301181.7 | 申请日: | 2020-04-16 |
公开(公告)号: | CN113537476A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N20/00 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运算 装置 以及 相关 产品 | ||
本公开涉及一种运算装置以及相关产品。运算装置可以包括处理器,处理器可以包括多个处理单元以及存储单元,多个处理单元用于执行指令序列,存储单元用于存储数据,可包括随机存储器和寄存器堆。处理器中的多个处理单元既可共用部分存储空间,例如共用部分RAM存储空间和寄存器堆,又可同时拥有各自的存储空间。本公开的运算装置可以提高进行神经网络模型的运算时的运算性能。
技术领域
本公开涉及人工智能技术领域,特别是涉及一种运算装置以及相关产品。
背景技术
在人工智能技术领域,神经网络算法是最近非常流行的一种机器学习算法,在各种领域中都取得了非常好的效果,比如图像识别,语音识别,自然语言处理等。
发明内容
基于此,有必要针对上述技术问题,提供一种运算装置以及相关产品。
根据本公开的一方面,提供了一种运算装置,所述运算装置包括:
处理单元、第一存储单元和第二存储单元;
所述运算装置接收外部输入的输入数据以及二进制可执行文件,
其中,所述输入数据包括激活表和待处理的输入张量,所述运算装置将激活表存储至第一存储单元,将输入张量存储至第二存储单元;
所述处理单元运行所述二进制可执行文件时,从第二存储单元中读取输入张量,对所述输入张量进行缩放处理得到缩放输入张量,查找第一存储单元中的激活表对缩放输入张量进行激活得到中间激活结果,对中间激活结果进行缩放恢复处理得到激活结果,并将激活结果输出到第二存储单元。
根据本公开的另一方面,提供了一种人工智能芯片,所述芯片包括如上所述的运算装置。
根据本公开的另一方面,提供了一种电子设备,所述电子设备包括如上所述的人工智能芯片。
根据本公开的另一方面,提供了一种板卡,所述板卡包括:存储器件、接口装置和控制器件以及如上所述的人工智能芯片;
其中,所述人工智能芯片与所述存储器件、所述控制器件以及所述接口装置分别连接;
所述存储器件,用于存储数据;
所述接口装置,用于实现所述人工智能芯片与外部设备之间的数据传输;
所述控制器件,用于对所述人工智能芯片的状态进行监控。
根据本公开的实施例,能够对输入激活算子的输入张量进行缩放,这样,使得缩放后的输入张量中的元素的大小缩放到合适的范围,在通过查找激活表对缩放后的输入张量进行激活之后得到中间激活结果,再对中间激活结果进行恢复即可得到最终的激活结果。通过本公开的实施例,对输入张量进行缩放,将输入张量中的元素缩放到已有激活表能够覆盖的范围,不需要根据输入张量中元素的实际范围设置大量的激活表,从而可以避免由于遍历大量激活表导致的算子性能降低,提高激活算子的性能。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
图1示出根据本公开实施例的处理器的示意图。
图2示出根据本公开实施例的运算装置的框图。
图3示出根据本公开一实施例的激活过程的流程图。
图4示出根据本公开实施例的板卡的结构框图。
图5示出根据本公开实施例的一种电子设备800的框图。
图6示出根据本公开实施例的一种电子设备1900的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010301181.7/2.html,转载请声明来源钻瓜专利网。