[发明专利]一种基于CSR格式的高性能稀疏矩阵向量乘法计算方法在审

专利信息
申请号: 202110636177.0 申请日: 2021-06-08
公开(公告)号: CN113377534A 公开(公告)日: 2021-09-10
发明(设计)人: 王超;张加浩;左岳;王寅初;周亦非 申请(专利权)人: 东南大学
主分类号: G06F9/50 分类号: G06F9/50;G06F9/52
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 孙峰
地址: 211189 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 csr 格式 性能 稀疏 矩阵 向量 乘法 计算方法
【说明书】:

发明公开了一种基于CSR格式的高性能稀疏矩阵向量乘法计算方法,该方法首先根据现有的方法进行空间局部性优化,循环效率优化与访存效率优化;根据现有硬件资源的配置与仿真情况,自适应的开辟合理数目的线程,优化加锁解锁方式使线程池更高效;针对cache missing问题与硬件条件完成适应性的亲和性设置。本发明基于传统的CSR格式的稀疏矩阵向量乘法,充分考虑硬件资源对计算性能的限制,以及算法对计算效率与访存效率的影响;在改进原有算法基础上,模型可以资源配置与任务数目,自适应的通过基于矩阵索引的线程池与亲和性设置完成仿真加速。

技术领域

本发明涉及稀疏矩阵向量乘法计算的技术领域,特别是涉及一种基于CSR格式的高性能稀疏矩阵向量乘法计算方法。

背景技术

目前工艺的不断进步,结点的尺寸在不断缩小,导致集成电路的密集程度不断增加。尤其针对大型的存储电路(动态随机存取存储器,静态随机存取存储器,快闪存储器等),矩阵向量运算会在整个仿真中占据很大规模的时间,仿真所运算的矩阵与向量与电路规模成正比,矩阵的规模甚至会达到千万维以上。但是电路中不同的结点之间并不是全连接关系,用简单的二维数组去表示会有大量的0值,存储空间有着极大的消耗。而采用CSR格式的压缩矩阵去存储并计算这些稀疏矩阵向量乘法,虽然可以减少大量的零元素的乘法,但是依旧会存在以下问题。

要计算的矩阵中,每行非零值数目不确定,非零值位置未知,甚至要仿真的行都是要变化的,因此在不考虑并发的条件下,如何在CSR格式下调度数据并选取合理的计算方式,保证各非零值找到的同时并完成加速。

通过CSR格式压缩稀疏矩阵,顺序访问压缩矩阵元素即可完成对矩阵所有元素的访问,同时,通过对应的横坐标值,可以访问与该矩阵元素进行乘法运算的向量元素。

利用多线程是实现加速的一个重要途径,但是选取独立的计算单元保证线程之间不冲突,与如何处理多个矩阵之间运算顺序保证各个矩阵都完成仿真都是要考虑的问题,在保证这两个条件下,如何做到更快的仿真依旧是重点与难点。

矩阵数据以CSR格式在内存中进行存储,可以保证每次缓存访问都可以从内存中拿到相当比例的非零元素。在CPU对缓存中的数据访问时,在L1,L2,L3cache每次向上传递时,也都可以保证缓存命中。但是向量由内存向缓存在向CPU传递时,依旧会存在cachemissing现象。简单的利用多线程会使线程在不同core上反复调度,每个CPU core都要求对数据的重新搬运,会造成更严重的cache missing,甚至是DRAM从磁盘中调用所需数据,数据搬运所消耗的时间变得越来越重要,已不再是简单的计算密集型仿真任务,更是访存类型的问题。

发明内容

有鉴于此,本发明的目的在于提供一种基于CSR格式的高性能稀疏矩阵向量乘法计算方法,针对现有技术存在的仿真速度慢,读取内存中CSR格式的数据时造成不规则访问导致cache missing,带宽利用率低,多线程加速不理想以及带来的cache missing等问题。本发明为针对超大规模集成电路仿真中CSR格式的稀疏矩阵向量乘法,提供一种能优化计算结构与多线程调度方式,能够充分利用硬件CPU并行资源,自适应完成亲和性设置来实现SPMV(稀疏矩阵向量乘法)优化的方法。

为解决上述技术问题,本发明采用的技术方案为:

一种基于CSR格式的高性能稀疏矩阵向量乘法计算方法,包括如下步骤:

步骤S1、采用最简高效循环结构,进行空间局部性优化,循环效率优化与访存效率优化;

步骤S2、引入局部变量减少冗余访存和冗余计算;

步骤S3、在利用多线程加快仿真结果方面,借鉴线程池的基本思想并对线程池进行改进;

步骤S4、采用适应性的亲和性设置。

进一步的,所述采用最简高效循环结构具体包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110636177.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top