[发明专利]在多处理器系统上对矩阵进行QR分解的方法和装置无效
| 申请号: | 200810086073.1 | 申请日: | 2008-03-14 |
| 公开(公告)号: | CN101533386A | 公开(公告)日: | 2009-09-16 |
| 发明(设计)人: | 李晖;王佰玲 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06F17/16 | 分类号: | G06F17/16 |
| 代理公司: | 北京市中咨律师事务所 | 代理人: | 李 峥;周春燕 |
| 地址: | 美国*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 处理器 系统 矩阵 进行 qr 分解 方法 装置 | ||
技术领域
本发明涉及数据处理领域,具体地,涉及在多处理器系统上对矩阵进行QR分解的方法和装置。
背景技术
LAPACK(Linear Algebra PACKage,线性代数包)是Oak Ridge国家实验室、加州大学Davis分校和Illinois大学等联合开发的非常有效、强大且广泛使用的线性代数函数库,用于在不同高性能计算环境上高效求解数值线性代数问题,其已经有效地为HPC(High Performance Computing,高性能计算)和计算科学组织工作了20多年的时间。关于LAPACK的详细内容,可参见http://netlib.amss.ac.cn/lapack/index.html。
作为专业的线性代数库,LAPACK提供了各种线性代数的子程序,其中包括实现矩阵的QR分解的例程。
矩阵的QR分解的含义是:对于给定的M×N矩阵A,找出分解
A=Q*R,
其中,Q是M×M正交矩阵,R是M×N上三角矩阵。
现有的LAPACK中的QR分解例程是采用条带(panel)QR分解方案来实现的,其是一种分块的分解方案。
图1是现有的条带QR分解方案的图示说明,其中,图1(a)和(b)分别是现有的条带QR分解方案中第k次迭代运算的总体和分步图示说明,图1(c)是现有的条带QR分解方案的算法描述。图2是现有的条带QR分解方案的流程图。
总体来说,如图1(a)所示,现有的条带QR分解方案的思路是:对于给定的M×N矩阵A,通过迭代地每次在矩阵的一个条带上进行分解运算来最终将该矩阵A分解为M×M正交矩阵Q和M×N上三角矩阵R的积。本发明为了简便起见,在图中的矩阵A都采用方阵作为图例,实际上,图中矩阵A可以不是方阵,而是任意M×N矩阵,其中,M和N为不相等的正整数。以其中一次迭代为例,如图1(a)的左侧所示,浅灰色的矩阵部分V、R是通过第1~k-1次迭代运算已经分解了的矩阵部分,而深灰色的矩阵部分A1(k)和A2(k)结合起来的矩阵部分则是未分解的部分,也是第k(k=1,2,3...)次迭代运算的对象。进而,在第k次迭代运算中,将该深灰色矩阵部分划分为两个条带A1(k)和A2(k),其中A1(k)作为当前工作条带;然后,在当前工作条带A1(k)上进行QR分解计算,并利用其分解计算的结果更新A2(k),从而得到图1(a)右侧的矩阵。其中,在该图1(a)右侧的矩阵中,深灰色矩阵部分成为第k+1次迭代运算的分解对象。
具体地,如图1(b)、(c)和图2所示,在现有的条带QR分解方案中,对于给定的M×N矩阵A,首先将其划分为m×n块,其中每一个块的大小为Nb×Nb,例如32×32,然后根据
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810086073.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种ETL流程中异常数据检测方法
- 下一篇:提取气象数据的方法和装置





