[发明专利]一种函数计算的专用处理器微架构在审

专利信息
申请号: 202110272309.6 申请日: 2021-03-12
公开(公告)号: CN113095025A 公开(公告)日: 2021-07-09
发明(设计)人: 杨旭光 申请(专利权)人: 苏州芯启微电子科技有限公司
主分类号: G06F30/373 分类号: G06F30/373
代理公司: 暂无信息 代理人: 暂无信息
地址: 215024 江苏省苏州市苏州*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 函数 计算 专用 处理器 架构
【说明书】:

发明提供一种函数计算的专用处理器微架构,及其设计方法。设计包括:指令译码电路(DECODER),公式迭代器(ITERATOR),计算合并单元(MERGE)。译码电路译码迭代指令和合并指令,输出迭代公式类型,迭代次数,合并操作类型等,迭代器与合并单元并行执行,完成指定迭代次数后输出结果。

技术领域

本发明属于计算机硬件、处理器设计、人工智能领域,数字集成电路设计领域。

背景技术

深度卷积神经网络算法由多层具体的神经元算法层、隐藏层组成,主要包含有卷积层,激活函数,池化层等。其中激活函数有多种,要求硬件加速具有一定的灵活性。在这个特定领域中,许多发明通过高性能CPU来提供一般性、通用性的数学计算,或通过GPU来加速更具有规律的卷积计算,以及通过FPGA来定制加速某些计算过程。其中寒武纪的芯片采用在微架构上叠加特定执行装置的方法来增加所支持的数学算子。但还没有针对神经网络知识领域内的计算任务本身进行抽象、提取融合算子内共同的本质操作,而只有这样的设计才能开发出更有知识领域针对性的、高效强大的处理器。

发明内容

本发明提供一种函数计算的专用处理器微架构及其指令集组合应用方法,原理是参考函数的泰勒展开,由公式迭代器和结果合并单元共同构成函数求解电路,迭代指令指导公式迭代器生成通项部分,合并指令指导合并单元将通项部分按指定公式合并。达到迭代次数后输出结果。

结合常见的泰勒展开式本发明的一种实例

迭代指令指定迭代变量的来源寄存器号(X1、X2),以及各自的迭代公式类型(TYPE1、TYPE2)。迭代公式类型有:

公式 备注

n 1 2 3 4 5 ……

n! 1 2 6 24 120 ……

(2n+1)!*(-1)^n 1 -6 120 -5040 ……

(2n)!*(-1)^n 1 -2 24 -720 ……。

合并公式指定用于合并的运算类型(OP1、OP2),以及迭代次数N,迭代公式类型有:

加ADD

减SUB

乘MUL

除DIV

幂POW

……。

附图说明

图1为本发明迭代器与合并单元及其连接示意图;

图2为本发明迭代指令格式示意图;

图3为本发明合并指令格式示意图;

图4为本发明应用于指数函数求解指令组合例子;

图5为本发明应用于指数函数求解执行流程示意图;

图6为本发明应用于指数函数求解效率对比;

图7一套对数学计算任务的自动编译器实现方法。

具体实施方式

下面通过一个具体的实施例,对本发明做进一步的详细描述。

比如要求e^x函数,其泰勒展开式如下:

则所用公式组合是:

系数用阶乘迭代 FAC

变量用幂运算 POW

合并操作是先除后加 DIV_ADD

即An=n!, Xn=X^n, Y=ADD( DIV(X1,A1), DIV(X2,A2),…… )

如图4所示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州芯启微电子科技有限公司,未经苏州芯启微电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110272309.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top