《并行计算》 线性方程组并行直接法 (基于MPI) 选主元LU分解 三角矩阵求解
http://math.ecnu.edu.cn/~jypan 1 线性方程组并行直接法 (基于 MPI) 《并行计算》 —— 选主元 LU 分解 —— 三角矩阵求解
线性方程组求解 Linear algebra-in particular,the solution of linear systems of equations-lies at the heart of most calculations in scientific computing. 一Dongarra&Eijkhout J.J.Dongarra and V.Eijkhout,Numerical linear algebra algorithms and software,/CAM,123(2000),489-514 口线性方程组是许多重要问题的核心,有效地求解线性方程组在科学与工程计算中非常重要 口并行计算机的问世,使求解问题的速度和规模大幅提高,同时也使计算方法产生了变化 口软件包:Lapack,ScaLapack http://math.ecnu.edu.cn/~jypan
http://math.ecnu.edu.cn/~jypan 线性方程组求解 Linear algebra — in particular, the solution of linear systems of equations — lies at the heart of most calculations in scientific computing. — Dongarra & Eijkhout J. J. Dongarra and V. Eijkhout, Numerical linear algebra algorithms and software, JCAM, 123 (2000), 489–514 线性方程组是许多重要问题的核心,有效地求解线性方程组在科学与工程计算中非常重要 并行计算机的问世,使求解问题的速度和规模大幅提高,同时也使计算方法产生了变化 软件包:Lapack,ScaLapack
华东师范大学数学科学学院 目录页 School of Mathematical Sciences,ECNU Contents 案 LU分解 PA=LU http://math.ecnu.edu.cn/~jypan
http://math.ecnu.edu.cn/~jypan 目录页 Contents 华东师范大学 数学科学学院 School of Mathematical Sciences, ECNU LU 分解 𝑷𝑷𝑷𝑷 = 𝑳𝑳𝑳𝑳
数据存储方式 ▣1 U分解的主要计算量是更新矩阵A。 ▣ 根据算法计算过程可知,如果是按列(或按行)连续分块存储在各个结点,则会出 现越往后计算越多结点空闲的情况,因此建议采用卷帘方式存储。 u12u13u14u15u16u17u18 u12u13u14u15u16u17u18 u1zu13u14u15u16u17u18 u12u13u14u15u16u17u18 21 22 u23u24u25426u27u28 l22u23u24u2su26u27u28 31l32 131132 u34u35u36u37u38 l332 u34u35u36u3u38 4 4l42 l41l42l43 L4l4243 151152 L51l52l53 151152 153 l61l62 l61l62l63 161162163 l71l2 1l22l23 1l23 L81182 181 182 183 la1 l82 l83 http://math.ecnu.edu.cn/~jypan
http://math.ecnu.edu.cn/~jypan 数据存储方式 LU 分解的主要计算量是更新矩阵 A。 根据算法计算过程可知,如果是按列(或按行)连续分块存储在各个结点,则会出 现越往后计算越多结点空闲的情况,因此建议采用卷帘方式存储。 ...
数据存储方式 口可以采用一维划分,也可以采用二维划分。在实际应用中,通常采用二维划分,即 在两个方向上都进行循环划分,然后存储到按二维排列的结点上。 A00 A01 A02 A A A2 A10 Au A12 A20 A21 A22 为简单起见,这里介绍一维列循环划分的并行算法 http://math.ecnu.edu.cn/~jypan
http://math.ecnu.edu.cn/~jypan 数据存储方式 可以采用一维划分,也可以采用二维划分。在实际应用中,通常采用二维划分,即 在两个方向上都进行循环划分,然后存储到按二维排列的结点上。 ► 为简单起见,这里介绍一维列循环划分的并行算法 A00 A01 A02 A10 A11 A12 A20 A21 A22 A0 A1 A2