阵列式多处理机适应的算法 维调和函数的求解 二维调和函数的求解U(x,y):满足二维拉普拉斯方程的函 数,即 au au ax a uu(x+h, y)-2xu(x,y)+u(x-h, y) ax o2u u(x, y+h)-2x u(x,y)+u(x, y-h) 所以u(x,y) u(x +h,y)+u(x,y+h)+u(x-h,y)+u(x, y-h 其中:h是网格点的间距,(x,y)为网格点坐标 利用此法计算,又称为平滑或滤波,目的是消除偶然干扰
二、阵列式多处理机适应的算法 1. 二维调和函数的求解 二维调和函数的求解U(x,y):满足二维拉普拉斯方程的函 数,即 其中:h是网格点的间距,(x,y)为网格点坐标。 利用此法计算,又称为平滑或滤波,目的是消除偶然干扰。 4 u x h y u x y h u x h y u x y h u x y h u x y h 2 u x y u x y h y u h u x h y 2 u x y u x h y x u 0 y u x u 2 2 2 2 2 2 2 2 2 2 ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) 所以
2矩阵加 1)有如下两个矩阵 a b a a A 15 9 B a 56 a 57 63 56 57 b6r 计算C=A+B 则:co=ad+bc1=a1+b1 8 15 +b 63 C 56 57 63
2 矩阵加 1)有如下两个矩阵 56 57 63 8 9 15 0 1 7 a a a a a a a a a A … … … … … … … 56 57 63 8 9 15 0 1 7 b b b b b b b b b B … … … … … … … 56 57 63 8 9 15 0 1 7 c c c c c c c c c C … … … … … … … 计算C=A+B 则:c0=a0+b0 c1=a1+b1 … c63=a63+b63
2)阵列存储器分配 每个局部存储器占用三个单元 3)完成矩阵的加运算 PEMO PEMI PEM63 CU向各PU发出有关命令 ①公共地址K+0和(取操 a0 作数)读命令 k+0 k+0 k+063 因此各PU从K+0单元中分k+1b0k+1b1 k+1|b63 别取出A阵列数据a0~a3k+2c0k+2|cl k+2 c63 ②第二个公共地址K+1和 取操作数,各PU又将K+1单 元中的bo~b63取出 ③CU向各PU发出求和命令,各PU将取出的a及b求和,即c=a+b ④CU第三次向各PU发出公共地址K+2和写命令,各PU将c:存入K+2 单元
2)阵列存储器分配 每个局部存储器占用三个单元 c0 b0 a0 ┇ ┇ PEM0 k+0 k+1 k+2 c1 b1 a1 ┇ ┇ PEM1 c63 b63 a63 ┇ ┇ PEM63 k+0 k+1 k+2 k+0 k+1 k+2 ┅ 3)完成矩阵的加运算 CU向各PU发出有关命令: ①公共地址K+0和(取操 作数)读命令。 因此各PU从K+0单元中分 别取出A阵列数据a0~a63。 ②第二个公共地址K+1和 取操作数,各PU又将K+1单 元中的b0~b63取出。 ③CU向各PU发出求和命令,各PU将取出的ai及bi求和,即ci=ai+ bi。 ④CU第三次向各PU 发出公共地址K+2和写命令,各PU将ci存入K+2 单元
3矩阵乘 用阵列式多处理机完成矩阵乘法,不如阵列流水线处 理机,因为用矩阵乘法运算比矩阵加法复杂,对阵列多 处理机各部件的利用率不如矩阵加 4可加速累加和的形式(与单机比较 1)计算 S=∑ aota 1 a ta ③S3=a4+a5④S=a6+a ⑤
3 矩阵乘 用阵列式多处理机完成矩阵乘法,不如阵列流水线处 理机,因为用矩阵乘法运算比矩阵加法复杂,对阵列多 处理机各部件的利用率不如矩阵加。 4 可加速累加和的形式(与单机比较) 1)计算 7 i 0 i S a ① S1=a0+a1 ② S2=a2+a3 ③ S3=a4+a5 ④ S4=a6+a7 ⑤ S5=S1+S2 ⑥ S6=S3+S4 ⑦ S=S5+S6
2)参数存放 PEMO PEM1 PEM2 PEM3 k+0La0」k+0La2 k+0/a4 k+0 a6 k+1a1|k+1a3|k+1a5k+1|a7 k+2 k+2 k+2 k+2 3)计算过程 ①PU0、PU1、PU2、PU3分别取出a,a2,a4,a6; ②PU0、PU1、PU2、PU3再分别取出a1,a3,a5,a7; ③四个PU分别求和计算得S1、S2S3、S4 ④PU1→PU0由PU0计算S1+S2,PU3→PU2,由PU2计算 ⑤PU2→PU0由PU0计算S
2)参数存放 3)计算过程 ①PU0、PU1、PU2、PU3分别取出a0,a2,a4,a6; ②PU0、PU1、PU2、PU3再分别取出a1,a3,a5,a7; ③四个PU分别求和计算得S1、S2 S3、S4; ④PU1→PU0由PU0计算S1+S2,PU3→PU2,由PU2计算 S3+S4; ⑤PU2→PU0由PU0计算S。 a1 a0 PEM0 k+0 k+1 k+2 a3 a2 k+0 k+1 k+2 a5 a4 PEM2 k+0 k+1 k+2 PEM3 a7 a6 k+0 k+1 k+2 PEM1