[发明专利]一种函数计算的专用处理器微架构在审
申请号: | 202110272309.6 | 申请日: | 2021-03-12 |
公开(公告)号: | CN113095025A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 杨旭光 | 申请(专利权)人: | 苏州芯启微电子科技有限公司 |
主分类号: | G06F30/373 | 分类号: | G06F30/373 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 215024 江苏省苏州市苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 函数 计算 专用 处理器 架构 | ||
本发明提供一种函数计算的专用处理器微架构,及其设计方法。设计包括:指令译码电路(DECODER),公式迭代器(ITERATOR),计算合并单元(MERGE)。译码电路译码迭代指令和合并指令,输出迭代公式类型,迭代次数,合并操作类型等,迭代器与合并单元并行执行,完成指定迭代次数后输出结果。
技术领域
本发明属于计算机硬件、处理器设计、人工智能领域,数字集成电路设计领域。
背景技术
深度卷积神经网络算法由多层具体的神经元算法层、隐藏层组成,主要包含有卷积层,激活函数,池化层等。其中激活函数有多种,要求硬件加速具有一定的灵活性。在这个特定领域中,许多发明通过高性能CPU来提供一般性、通用性的数学计算,或通过GPU来加速更具有规律的卷积计算,以及通过FPGA来定制加速某些计算过程。其中寒武纪的芯片采用在微架构上叠加特定执行装置的方法来增加所支持的数学算子。但还没有针对神经网络知识领域内的计算任务本身进行抽象、提取融合算子内共同的本质操作,而只有这样的设计才能开发出更有知识领域针对性的、高效强大的处理器。
发明内容
本发明提供一种函数计算的专用处理器微架构及其指令集组合应用方法,原理是参考函数的泰勒展开,由公式迭代器和结果合并单元共同构成函数求解电路,迭代指令指导公式迭代器生成通项部分,合并指令指导合并单元将通项部分按指定公式合并。达到迭代次数后输出结果。
结合常见的泰勒展开式本发明的一种实例
迭代指令指定迭代变量的来源寄存器号(X1、X2),以及各自的迭代公式类型(TYPE1、TYPE2)。迭代公式类型有:
公式 备注
n 1 2 3 4 5 ……
n! 1 2 6 24 120 ……
(2n+1)!*(-1)^n 1 -6 120 -5040 ……
(2n)!*(-1)^n 1 -2 24 -720 ……。
合并公式指定用于合并的运算类型(OP1、OP2),以及迭代次数N,迭代公式类型有:
加ADD
减SUB
乘MUL
除DIV
幂POW
……。
附图说明
图1为本发明迭代器与合并单元及其连接示意图;
图2为本发明迭代指令格式示意图;
图3为本发明合并指令格式示意图;
图4为本发明应用于指数函数求解指令组合例子;
图5为本发明应用于指数函数求解执行流程示意图;
图6为本发明应用于指数函数求解效率对比;
图7一套对数学计算任务的自动编译器实现方法。
具体实施方式
下面通过一个具体的实施例,对本发明做进一步的详细描述。
比如要求e^x函数,其泰勒展开式如下:
则所用公式组合是:
系数用阶乘迭代 FAC
变量用幂运算 POW
合并操作是先除后加 DIV_ADD
即An=n!, Xn=X^n, Y=ADD( DIV(X1,A1), DIV(X2,A2),…… )
如图4所示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州芯启微电子科技有限公司,未经苏州芯启微电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110272309.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种张量数据的区域化并行载入装置及方法
- 下一篇:一种处理器数据存取微架构