[发明专利]一种加速实现Cholesky分解的嵌入式片上系统有效
| 申请号: | 201510245953.9 | 申请日: | 2015-05-14 |
| 公开(公告)号: | CN104794102B | 公开(公告)日: | 2018-09-07 |
| 发明(设计)人: | 王少军;王晓璐;马宁;刘大同;彭宇;彭喜元 | 申请(专利权)人: | 哈尔滨工业大学 |
| 主分类号: | G06F17/11 | 分类号: | G06F17/11 |
| 代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 杨立超 |
| 地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 一种加速实现Cholesky分解的嵌入式片上系统,涉及一种加速实现Cholesky分解的系统。本发明为了解决目前现有的基于Cholesky分解方法实现线性方程组求解的硬件加速系统存在计算时间比较长的问题。本发明包括用于对整个计算过程的任务调度的ARM处理器模块、用于控制外部DDR存储器的数据读写的DDR控制模块、用于可编程逻辑Programmable Logic模块与ARM处理器模块之间的信息传输AXI总线模块以及用于对正定对称矩阵进行Cholesky分解的可编程逻辑Programmable Logic模块。可编程逻辑Programmable Logic模块基于Submatrix‑Cholesky分解(块分解)方式实现线性方程组系数的求解存在大量的并行更新操作,可以实现数据更规律的访存,读写控制更简单,运算时间大幅缩短;本发明适用于加速实现线性方程组的求解。 | ||
| 搜索关键词: | 一种 加速 实现 cholesky 分解 嵌入式 系统 | ||
【主权项】:
1.一种加速实现Cholesky分解的嵌入式片上系统,其特征在于包括下述模块:ARM处理器模块,用于对整个计算过程的任务调度;DDR控制模块,用于控制外部DDR存储器的数据读写;可编程逻辑Programmable Logic模块,简称PL模块,用于从外部存储读取正定对称矩阵的值,进行Cholesky分解,得到下三角阵并将其存储在外部存储器中;AXI总线模块,用于PL模块与ARM处理器模块之间的信息传输;所述的PL模块包括:Control Logic子模块,用于接收ARM处理器模块的控制信息,协调计算单元和更新单元的计算工作以及控制内部RAM存储子模块数据读写工作;DMA子模块,用于控制PL模块与外部存储器之间进行数据传输;Cholesky分解子模块,用于对正定对称矩阵的Submatrix‑Cholesky分解并实现内部数据的缓存;Cholesky分解子模块对正定对称矩阵进行Submatrix‑Cholesky分解时,计算单元完成第一列数据的计算操作;更新单元对第一列数据后面的所有列进行更新;所述的Cholesky分解子模块包括:计算单元,用于正定对称矩阵进行Submatrix‑Cholesky分解时对列的计算操作;所述的计算单元设定为一个,仅用于执行对对角线上值进行开方计算以及每列中对角线元素下方的元素与开方值的除法计算;内部RAM缓存单元,用于对计算单元计算后的结果数据进行存储,方便更新单元从中直接调用;更新单元,用于正定对称矩阵进行Submatrix‑Cholesky分解时对列的更新操作,完成计算列之后的所有列的更新过程;所述的更新单元设置为多个,通过一个选择器连接到内部RAM缓存单元,进而连接到同一个计算单元;所述的更新单元对所有列进行更新时为多个更新单元并行进行;FIFO单元,用于对Cholesky分解子模块的初始数据及更新单元计算结果进行缓存,便于实现数据传输的流模式。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510245953.9/,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法及装置
- 下一篇:一种基于任务分解的并行任务处理方法





