[发明专利]执行神经网络模型的计算装置、方法及相关产品在审

专利信息
申请号: 202111109101.9 申请日: 2021-09-22
公开(公告)号: CN113850376A 公开(公告)日: 2021-12-28
发明(设计)人: 不公告发明人 申请(专利权)人: 安徽寒武纪信息科技有限公司
主分类号: G06N3/063 分类号: G06N3/063;G06N3/04;G06N3/08
代理公司: 北京维昊知识产权代理事务所(普通合伙) 11804 代理人: 陈姗姗
地址: 231283 安徽省合肥市高新区习友路3333*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 执行 神经网络 模型 计算 装置 方法 相关 产品
【说明书】:

本披露公开了一种执行神经网络模型的计算装置、利用计算装置执行神经网络模型的方法及相关产品。该计算装置可以包括在组合处理装置中,该组合处理装置还可以包括接口装置和其他处理装置。该计算装置与其他处理装置进行交互,共同完成用户指定的计算操作。组合处理装置还可以包括存储装置,该存储装置分别与计算装置和其他处理装置连接,用于存储该计算装置和其他处理装置的数据。本披露的方案利用多核架构来有效地融合神经网络输出层的运算,减少与外部存储电路的交互次数和输入输出数据量,从而提高机器的处理效率。

技术领域

本披露一般地涉及神经网络模型领域。更具体地,本披露涉及执行神经网络模型的计算装置、利用计算装置执行神经网络模型的方法、芯片和板卡。

背景技术

随着人工智能领域的高速发展,神经网络模型广泛用于语言建模,例如机器翻译和语音识别等。这些模型在考虑已生成部分序列的情况下计算单词的概率。

图1示出了神经网络语言模型的输出层的简化示意图。如图所示,这些单词的概率通常由投影层110(也称为全连接层,一般是一个大规模矩阵乘)投影到词典空间计算得到,随后经过Softmax层120和TopK层130的Softmax函数和TopK函数候选出出现概率最大的K个词。可以理解,在一些神经网络模型中,Softmax层和TopK层的处理顺序可以调换。此处以更为通用的先Softmax层再TopK层的场景为例。目前投影层的词典都比较大,单独计算投影层、Softmax和TopK都会带来巨大的访存开销。

随着硬件技术的发展,现代智能处理器多采用多核并行的框架。如何在多核并行框架中高效地解决大规模数据的TopK问题,有效地降低外部存储电路的访存开销,最大限度地提高数据的并行度,是目前神经网络语言模型急需解决的问题。

发明内容

为了至少部分地解决背景技术中提到的一个或多个技术问题,本披露实施例提供一种面向神经网络模型的输出层深度融合计算方法、装置及计算机可读存储介质。

在第一方面中,本披露公开一种执行神经网络模型的计算装置,所述计算装置包括多个处理核以及支持核间相互通信的片上网络,所述神经网络模型的输出层包括投影层、softmax层和TopK层,其中所述计算装置用于:从片外存储电路加载所述投影层的输入数据;在所述多个处理核上针对所述输入数据执行所述投影层、softmax层和TopK层的融合运算;利用所述片上网络对所述多个处理核的融合运算结果进行规约处理,以得到最终结果;以及向片外存储电路输出所述最终结果。

在第二方面中,本披露提供一种芯片,包括前述第一方面的计算装置。

在第三方面中,本披露提供一种板卡,包括前述第二方面的芯片。

在第四方面中,本披露提供一种利用前述第一方面的计算装置执行神经网络模型的计算方法。

通过如上所提供的面向神经网络模型的输出层深度融合计算方法、装置及计算机可读存储介质,本披露实施例能够高效融合投影层、Softmax层与TopK层,有效地降低外部存储电路的访存开销,极大地提高输出层,尤其是TopK层的计算效率。

附图说明

通过参考附图阅读下文的详细描述,本披露示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本披露的若干实施方式,并且相同或对应的标号表示相同或对应的部分,其中:

图1示出神经网络语言模型的输出层的简化示意图;

图2a示出本披露实施例的板卡的结构图;

图2b示出本披露实施例的组合处理装置的结构图;

图3示出本披露实施例的多核计算装置的内部结构示意图;

图4示例性示出CDMA的工作原理;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽寒武纪信息科技有限公司,未经安徽寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111109101.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top