[发明专利]运算方法、装置及相关产品在审
申请号: | 202110515866.6 | 申请日: | 2019-07-24 |
公开(公告)号: | CN113204373A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06F9/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运算 方法 装置 相关 产品 | ||
本公开涉及运算方法、装置及相关产品,所述产品包括控制器单元,所述控制器单元包括:指令缓存单元、指令处理单元和存储队列单元;所述指令缓存单元,用于存储所述人工神经网络运算关联的计算指令;所述指令处理单元,用于对所述计算指令解析得到多个运算指令;所述存储队列单元,用于存储指令队列,该指令队列包括:按该队列的前后顺序待执行的多个运算指令或计算指令。通过以上方法,本公开可以提高相关产品在进行神经网络模型的运算时的运算效率。
技术领域
本公开涉及信息处理技术领域,尤其涉及一种运算方法、装置及相关产品。
背景技术
在人工智能技术领域,神经网络算法是最近非常流行的一种机器学习算法,在各种领域中都取得了非常好的效果,比如图像识别,语音识别,自然语言处理等。随着神经网络算法的发展,算法的复杂度也越来越高,为了提高识别度,模型的规模也在逐渐增大。
发明内容
根据本公开的第一方面,提供了一种指令生成方法,所述方法包括:
接收计算图;
统计所述计算图中的调度节点,得到第一调度集合;
将所述第一调度集合中的并行节点合并为并行调度单元,得到包括并行调度单元的第二调度集合,其中,所述并行节点为符合并行执行条件的调度节点;
根据所述第二调度集合,生成指令。
根据本公开的第二方面,提供了一种指令生成装置,包括:
接收单元,用于接收计算图;
统计单元,用于统计所述计算图中的调度节点,得到第一调度集合;
合并单元,用于将所述第一调度集合中的并行节点合并为并行调度单元,得到包括并行调度单元的第二调度集合,其中,所述并行节点为符合并行执行条件的调度节点;
指令生成单元,用于根据所述第二调度集合,生成指令。
根据本公开的第三方面,提供了一种运算装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述第一方面所述的方法。
根据本公开的第四方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述第一方面所述的方法。
通过将第一调度集合中的并行节点合并为并行调度单元,从而得到包括并行调度单元的第二调度集合,并根据第二调度集合生成指令,根据本公开的各方面实施例的指令生成方法、装置及相关产品,能够生成可以并行执行的并行指令,从而便于对不存在依赖关系的数据段进行并行处理和计算,提升数据处理和计算的效率。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
图1示出根据本公开一实施例的指令生成方法的流程图。
图2示出根据本公开一实施例的指令生成方法的流程图。
图3示出根据本公开一实施例的计算图。
图4示出根据本公开一实施例的指令生成方法的流程图。
图5示出根据本公开一应用示例的示意图。
图6示出根据本公开一实施例的指令生成装置的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110515866.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种滑轮导轨固定件
- 下一篇:一种保持ISR激活的方法、移动终端及MSC