[发明专利]基于RISC-V指令集进行数据处理的方法、系统、设备及介质在审
申请号: | 202110175746.6 | 申请日: | 2021-02-09 |
公开(公告)号: | CN112860320A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 贾兆荣 | 申请(专利权)人: | 山东英信计算机技术有限公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 张涛;张元 |
地址: | 250101 山东省济南市高新区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 risc 指令 进行 数据处理 方法 系统 设备 介质 | ||
本发明公开了一种基于RISC‑V指令集进行数据处理的方法、系统、设备和存储介质,方法包括:从RISC‑V指令空间中获取指令缓存到缓存中,并判断指令的类型;响应于指令为分支跳转指令,重新生成指令地址,并根据指令地址跳转到对应的分支;响应于跳转到AIPU分支,通过第一级输入特征缓存和第一级系数缓存存储用于当前卷积运算的特征数据和系数数据,并通过第二级输入特征缓存和第二级系数缓存存储下一步卷积运算的特征数据和系数数据;以及根据对应的特征数据和系数数据进行卷积运算,并对运算得到的结果进行激活、归一化和池化。本发明根据RISC‑V指令集,设计了三条指令分支的处理器架构,实现了通用控制、向量运算、卷积和矩阵加速计算,适用于终端AI推理芯片。
技术领域
本发明涉及数据处理领域,更具体地,特别是指一种基于RISC-V指令集进行数据处理的方法、系统、计算机设备及可读介质。
背景技术
数据的价值在于分析利用,而非简单存储。数据量在不断在增长,不可能把所有数据都通过网络传到云端,带宽增长的速度是慢于数据增长的速度。对于实时性要求较高的应用场景,我们需要在边缘对数据进行判断,比如自动驾驶、无人驾驶等领域。对于隐私保护要求比较高的场景,比如医疗信息或者用户不愿意进行云端分享的数据,需要在本地进行存储。比如安防设备所产生的数据大部分是没有用或没有挖掘潜力的数据,全部传送到云端是对带宽一种浪费,若在边缘端做智能分析,只向云端传送有用或有潜力的数据,会大大节省网络带宽。因此数据处理从云端转移到边缘端是一种必然趋势,因此,边缘端AI(artificial intelligence,人工智能)芯片也是大势所趋。
在边缘端做人工智能处理需要AI芯片,AI芯片面临的挑战主要为计算算力和计算效率。AI芯片的算力由片上计算单元的数量决定的。由于AI计算涉及的数据量非常大,理论上AI芯片的算力越大越好,但实际上AI芯片的算力受多种因素制约:
1.片上存储带宽及总线带宽:AI芯片的主要矛盾为存储带宽和计算算力之间的矛盾。算力越大,输入数据、中间结果、输出数据量越大,要求的存储带宽越高,但目前存储带宽远远不能满足算力的需求,如果不能合理布置计算单元与存储单元,就会导致出现算力大但效率不高的结果。
2.AI计算涉及到的算子多种多样,如卷积计算、矩阵计算、归一化、激活、池化等多种线性及非线性计算。深度神经网络模型通常由多层组成,前一层的输出是下一层的输入;同一层中,乘加运算的结果往往是激活、池化、归一化的输入。因此,如果不能合理的实现多线程/并行计算/计算流水,上一步的计算会阻碍下一步的运算,造成资源浪费,降低计算效率。
3.如2所述,AI涉及到的算子多种多样,但AI芯片是固定不变的,如何使不变的硬件高效的处理多变的算子,这就需要软件能够根据硬件架构合理分配硬件资源,编译出高效的机器码。同时还要求AI芯片具备高效的控制能力。
发明内容
有鉴于此,本发明实施例的目的在于提出一种基于RISC-V指令集进行数据处理的方法、系统、计算机设备及计算机可读存储介质,通过AIPU(AI process unit,人工智能处理单元)和CPU共享内存,使计算与存储相邻,提高内存访问带宽,方便AIPU与CPU的数据交互,减少了与外部总线的数据交互量,减少了对总线带宽的需求。同时AIPU和CPU内部各有一个小的buffer(缓存)用于缓存输入数据、中间结果、输出数据以及CPU的预读取的指令,允许在数据计算的同时进行数据加载,延长数据读写时间,进一步减少对总线带宽的需求。
基于上述目的,本发明实施例的一方面提供了一种基于RISC-V指令集进行数据处理的方法,包括如下步骤:从RISC-V指令空间中获取指令缓存到缓存中,并判断所述指令的类型;响应于所述指令为分支跳转指令,重新生成指令地址,并根据所述指令地址跳转到对应的分支;响应于跳转到AIPU分支,通过第一级输入特征缓存和第一级系数缓存存储用于当前卷积运算的特征数据和系数数据,并通过第二级输入特征缓存和第二级系数缓存存储下一步卷积运算的特征数据和系数数据;以及根据对应的特征数据和系数数据进行卷积运算,并对运算得到的结果进行激活、归一化和池化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东英信计算机技术有限公司,未经山东英信计算机技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110175746.6/2.html,转载请声明来源钻瓜专利网。