[发明专利]通过人工智能处理器处理一维复数数组的方法和设备在审
申请号: | 201911349795.6 | 申请日: | 2019-12-24 |
公开(公告)号: | CN111124996A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
主分类号: | G06F15/173 | 分类号: | G06F15/173;G06F15/167;G06F9/302;G06F9/30;G06F17/14;G06F17/16 |
代理公司: | 北京维昊知识产权代理事务所(普通合伙) 11804 | 代理人: | 李波;孙新国 |
地址: | 201306 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 人工智能 处理器 处理 复数 数组 方法 设备 | ||
本公开记载了一种通过人工智能处理器处理一维复数数组的方法、电子设备和计算装置,其中计算装置可以包括在组合处理装置中,该组合处理装置还可以包括通用互联接口和其他处理装置。所述计算装置与其他处理装置进行交互,共同完成用户指定的计算操作。组合处理装置还可以包括存储装置,该存储装置分别与计算装置和其他处理装置连接,用于计算装置和其他处理装置的数据。
技术领域
本发明涉及数据处理领域,更具体地,涉及人工智能处理器上的矩阵运算领域。
背景技术
离散傅里叶变换和离散傅里叶逆变换在雷达、数字通信、数字图像处理和计算机视觉等领域中有着很广泛的作用,这使得离散傅里叶变换的快速工程实现具有十分重要的意义。但是随着人工智能技术的发展,及更前沿领域的需要,图像处理、雷达信号处理和视频处理等应用系统中对大规模数据的离散傅里叶变换需求越来越高。在雷达领域,随着高分辨大测绘带宽的合成孔径雷达的飞速发展,对大规模数据的离散傅里叶快速实现提出了更高的要求。然而,针对大规模数据的离散傅里叶快速实现对资源的消耗随着数据长度的增加而增加,且对大规模数据的离散傅里叶快速实现的优化效率往往和单个处理器的计算资源开销的程度直接相关,使得单个处理器的计算资源成为实现针对大规模的离散傅里叶变换快速实现的瓶颈。因此,充分应用处理器的计算资源,以及多处理器并行执行时很有必要的。不管是CPU、GPU还是MLU,它们的片内RAM资源都是有限的,不足以缓存这样的大规模的数据。同时,由于在片内存储进行运算的速度远高于在片外存储,而且对片外存储访问进行大量的标量操作,会影响算法的性能,导致整个算法的效率很低。
此外,在CPU上只能进行标量的计算,随着数据规模的增加,计算时间呈指数级增加,所以如果可以直接进行一组数据的计算,即张量的计算,那么计算性能可以显著提升。之前常用快速傅里叶变换进行离散傅里叶变换的计算,通常也是进行的标量的计算。虽然这也可以减少算法复杂度,但是执行快速傅里叶变换的计算量很大,并且和系统的性能有很大关系。
发明内容
本公开的目的在于克服现有技术中无法进行张量计算的缺陷,提供种通过人工智能处理器处理一维复数数组的方法。
根据本公开的第一方面,提供一种通过人工智能处理器处理一维复数数组的方法,其中,所述一维复数数组的长度为M,与所述一维复数数组对应的系数矩阵的尺寸为M×M,所述方法包括:根据人工智能处理器上的片上存储单元的第一存储区的容量,将所述一维复数数组拆分为多个长度为N的子复数数组;将所述子复数数组加载至所述第一存储区;根据所述子复数数组,将所述系数矩阵拆分为多个与所述子复数数组对应的子系数矩阵,其中所述子系数矩阵的尺寸为N×N;将所述子系数矩阵加载至所述人工智能处理器上的片上存储单元的第二存储区;所述人工智能处理器利用所述子复数数组和相应的所述子系数矩阵进行傅里叶变换,以得到运算结果;以及所述人工智能处理器将所述运算结果传送至所述片外存储单元以进行存储。
根据本公开的第二方面,提供一种通过人工智能处理器处理一维复数数组的方法,其中,所述一维复数数组的长度为M,与所述一维复数数组对应的系数矩阵的尺寸为M×M,所述方法包括:根据人工智能处理器上的片上存储单元的第二存储区的容量,将所述系数矩阵拆分为多个尺寸为N×N的子系数矩阵;将所述子系数矩阵加载至所述第二存储区;根据所述子系数矩阵,将所述复数数组拆分为多个与所述子系数矩阵对应的子复数数组,其中所述子复数数组的长度为N;将所述子复数数组加载至所述人工智能处理器上的片上存储单元的第一存储区;所述人工智能处理器利用所述子复数数组和相应的所述子系数矩阵进行傅里叶变换,以得到运算结果;以及所述人工智能处理器将所述运算结果传送至所述片外存储单元以进行存储。
根据本公开的第三方面,提供一种电子设备,包括:一个或多个处理器;以及存储器,所述存储器中存储有计算机可执行指令,当所述计算机可执行指令由所述一个或多个处理器运行时,使得所述电子设备执行如上所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911349795.6/2.html,转载请声明来源钻瓜专利网。