[发明专利]一种用于图计算加速器的图数据压缩方法及图计算加速器有效
| 申请号: | 201910107925.9 | 申请日: | 2019-02-02 |
| 公开(公告)号: | CN109919826B | 公开(公告)日: | 2023-02-17 |
| 发明(设计)人: | 邓军勇;莉兹·K·约翰;宋爽;邬沁哲;杨博文;田璞;赵一迪 | 申请(专利权)人: | 西安邮电大学;得克萨斯大学奥斯汀分校 |
| 主分类号: | G06T1/20 | 分类号: | G06T1/20;G06T1/60;G06F16/51 |
| 代理公司: | 北京易捷胜知识产权代理有限公司 11613 | 代理人: | 齐胜杰 |
| 地址: | 710121 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 计算 加速器 数据压缩 方法 | ||
1.一种图计算加速器,其特征在于,包括预处理电路和存储器;
所述预处理电路根据图计算加速器的图数据压缩方法对邻接稀疏矩阵数据进行转换处理;
具体地,图计算加速器的预处理电路将待处理的以邻接稀疏矩阵表示的图数据转换成独立稀疏列压缩CSCI格式的图数据,每列独立压缩后的图数据包括列标识数据对和非零元素数据对,每个数据对都包括索引index和数值value,由索引index的最高两位指示index其余位与数值value的含义,图计算加速器的预处理电路将转换后的CSCI格式的图数据存储在所述图计算加速器的存储器中;
以及,图计算加速器还包括:
控制电路、数据访问单元、调度器、混合粒度处理单元和结果产生单元;
其中,所述预处理电路,还用于将CSCI中列标识副本存入所述存储器;
所述控制电路,用于接收所述预处理电路在存储器中存储完毕之后发送的转换就绪指示信号,根据主机发送的图计算应用类型控制所述数据访问单元、混合粒度处理单元、结果产生单元的操作,以及将主机发送的应用类型一的根顶点索引或应用类型二的源顶点索引发送所述数据访问单元;
所述数据访问单元,用于从所述存储器中读取所述CSCI的图数据和列标识,并根据所述根顶点索引、源顶点索引或结果产生单元传送的活跃顶点索引计算指定顶点在存储器中的物理地址以进行数据访问,以及将读取的数据传输到调度器;
所述调度器,用于将CISI中列标识指示的非零元素个数暂存,并根据所述混合粒度处理单元内处理元的状态信号,将暂存的数据分配到混合粒度处理单元内的处理元进行处理;
所述混合粒度处理单元,用于根据控制电路内的应用类型和结果产生单元的活跃顶点数据对调度器内暂存的数据进行并行处理,并将处理后的中间数据传输结果产生单元;
所述结果产生单元,用于根据控制电路内的应用类型对中间数据进行处理,以及将处理过程的活跃顶点索引发送数据访问单元,将处理后的最终结果存储。
2.根据权利要求1所述的图计算加速器,其特征在于,所述控制电路包括:主机接口组件和控制逻辑组件;
所述主机接口组件,用于接收主机发送的应用类型、应用类型一的根顶点索引和应用类型二的源顶点索引;
所述控制逻辑组件,用于接收所述预处理电路发送的转换就绪指示信号,将所述根顶点索引或源顶点索引发送所述数据访问单元,将应用类型发送混合粒度处理单元和结果产生单元,并启动图计算加速器内各模块开始工作;
其中应用类型一是广度优先搜索应用BFS类型,应用类型二是单源最短路径应用SSSP类型。
3.根据权利要求2所述的图计算加速器,其特征在于,所述数据访问单元包括:用户逻辑组件、地址计算模块和列标识暂存器;
所述列标识暂存器,用于存储CSCI中图数据的列标识;
所述地址计算模块,用于根据所述控制电路发送的和结果产生单元输入的顶点索引,结合所述列标识暂存器中各列非零元素数据、每行存储数据的数目计算当前活跃顶点i对应数据在存储器中的物理地址;
所述用户逻辑组件,用于从所述存储器中读取所述列标识暂存在所述列标识暂存器中;根据所述地址计算模块计算的地址从所述存储器中读取相应的活跃顶点对应的数据,并向所述调度器发送读取的数据;
以及,再接收调度器发送的暂停读取信号后,停止从所述存储器中读取数据;
所述用户逻辑组件,还用于在所述调度器发送的暂停读取信号失效后再次读取数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学;得克萨斯大学奥斯汀分校,未经西安邮电大学;得克萨斯大学奥斯汀分校许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910107925.9/1.html,转载请声明来源钻瓜专利网。





