6.1.2并行处理机的算法 1. ILLIACⅣ的处理单元阵列结构 >阵列的构成 PU的组成、功能及操作特点 PU之间的连接通路 结构:闭合螺线( Closed spira)结构 特点PU间的最短路径不超过7步 般情况:当N=N·N时,任意两个处理 单元之间的最短距离不会超过N-
6.1.2 并行处理机的算法 1.ILLIAC Ⅳ的处理单元阵列结构 ➢ 阵列的构成 ➢ PU的组成、功能及操作特点 ➢ PU之间的连接通路 结构:闭合螺线(Closed Spiral)结构 特点: PU间的最短路径不超过7步 一般情况: 当N=N½•N½时, 任意两个处理 单元之间的最短距离不会超过N½-1步
PU56 PU57 PU63 PU63 PU8 PUO PUI PUT PUZ PU16 PUb PU9 PU15 PU47 PU56 PU48 PU49 PUS PU55 PUO PU56 PU57 PU63 PUO PUl PUt
PU0 PU8 PU9 PU15 PU7 PU56 PU57 PU63 PU1 PU48 PU49 PU55 PU56 PU57 PU63 PU63 PU7 PU47 PU55 PU8 PU16 PU56 PU0 PU0 PU1 PU7
6.1.2并行处理机的算法 2并行处理机的算法 有限差分问题 矩阵加 矩阵乘 累加和
6.1.2 并行处理机的算法 2.并行处理机的算法 ➢ 有限差分问题 ➢ 矩阵加 ➢ 矩阵乘 ➢ 累加和
有限差分问题描述与解决 中的二阶偏导数表示为差分形式: aU. U(x +h, y)-20(x, y)+U(x-h, y) aU U(, y+h)=2U(x, y)+U(r, y-h 并代入原方程,即可得有限差分计算公式 U(x,v=U(+h, y)+U(, y+h)+U(r-h,y)+U(x,y-h) 4 式中,(x,y)为网格点坐标,h为网格点的间距
有限差分问题描述与解决
矩阵加 LDA ALPHA ;全部(a)由PEM送PE的累加器RGA ADRN ALPHA+1;全部(a+1)与(RGA)进行浮点规舍加,结果送RGA STA ALPHA+2;全部(RGA)由PE送PEM的a+2单元 这里,0≤63。 aA(0,0) A(0,1) A(7,7) a+1B(0,0) (0,)1 B(7,7) a+2c(0,0) C(0,1) c(,) PEMo PEM 图64矩阵相加的存贮器分配举例)1 PEM
矩阵加