[发明专利]一种加速实现Cholesky分解的嵌入式片上系统有效
| 申请号: | 201510245953.9 | 申请日: | 2015-05-14 |
| 公开(公告)号: | CN104794102B | 公开(公告)日: | 2018-09-07 |
| 发明(设计)人: | 王少军;王晓璐;马宁;刘大同;彭宇;彭喜元 | 申请(专利权)人: | 哈尔滨工业大学 |
| 主分类号: | G06F17/11 | 分类号: | G06F17/11 |
| 代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 杨立超 |
| 地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 加速 实现 cholesky 分解 嵌入式 系统 | ||
一种加速实现Cholesky分解的嵌入式片上系统,涉及一种加速实现Cholesky分解的系统。本发明为了解决目前现有的基于Cholesky分解方法实现线性方程组求解的硬件加速系统存在计算时间比较长的问题。本发明包括用于对整个计算过程的任务调度的ARM处理器模块、用于控制外部DDR存储器的数据读写的DDR控制模块、用于可编程逻辑Programmable Logic模块与ARM处理器模块之间的信息传输AXI总线模块以及用于对正定对称矩阵进行Cholesky分解的可编程逻辑Programmable Logic模块。可编程逻辑Programmable Logic模块基于Submatrix‑Cholesky分解(块分解)方式实现线性方程组系数的求解存在大量的并行更新操作,可以实现数据更规律的访存,读写控制更简单,运算时间大幅缩短;本发明适用于加速实现线性方程组的求解。
技术领域
本发明涉及一种加速实现Cholesky分解的系统。
背景技术
机器学习算法LS-SVM在嵌入式高性能计算领域得到了广泛应用,其计算过程包含线性方程组的求解,目前,关于线性方程组的求解方法有多种,乔里斯基(Cholesky)分解、高斯消元法、LU分解和共轭梯度法等,考虑算法本身特性以及在嵌入式SoC平台上的加速计算特点,需要一种计算量较小、计算复杂度较低,且含有大量并行计算的求解方法,Cholesky分解方法成为最好的选择。
根据Cholesky分解线性方程组的计算次序和编程方式,可将计算过程分为Row_Cholesky分解(行分解)、Column_Cholesky分解(列分解)和Submatrix_Cholesky(块分解)三种方式,这三种分解方式对数据的依赖性、需求量以及规律访存等存在不同,对于不同的硬件开发平台需要选择的具体的分解方式设计合理的数据通路结构。关于Cholesky分解在嵌入式硬件平台上的加速实现方法较多,针对不同开发平台具有的不同特点,可以设计不同的加速实现系统。但是,现有的Cholesky分解系统实现线性方程组的求解还存在着计算时间比较长的问题。
发明内容
本发明为了解决目前现有的基于Cholesky分解方法实现线性方程组求解的硬件加速系统存在计算时间比较长的问题。
一种加速实现Cholesky分解的嵌入式片上系统,主要包括下述模块:
ARM处理器模块,用于对整个计算过程的任务调度;
DDR控制模块,用于控制外部DDR存储器的数据读写;
可编程逻辑Programmable Logic模块,简称PL模块,用于从外部存储读取正定对称矩阵的值,进行Cholesky分解,得到下三角阵并将其存储在外部存储器中;
AXI总线模块,用于PL模块与ARM处理器模块之间的信息传输。
本发明充分发挥Zynq开发平台异构的优势,采用Choleksy分解方法实现对线性方程组求解的加速计算,采用软硬件协同设计技术,主要解决异构SoC平台上的处理任务划分问题以及片上系统中的数据通路问题,设计基于Zynq ZC702开发平台,将分解过程中的任务调度由ARM处理器模块实现,从而减少设计的复杂度;将线性方程组系数的求解由可编程逻辑Programmable Logic模块实现;可编程逻辑Programmable Logic模块基于Submatrix-Cholesky分解(块分解)方式实现线性方程组系数的求解;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510245953.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法及装置
- 下一篇:一种基于任务分解的并行任务处理方法





