9矩阵特征值计算 在实际的工程计算中,经常会遇到求n阶方阵A的特征值( Eigenvalue)与特征向量 ( Eigenvector)的问题。对于一个方阵A,如果数值λ使方程组 即(4-AL)x=0有非零解向量( SolutionⅤ ector)x,则称λ为方阵A的特征值,而非零向量x为 特征值所对应的特征向量,其中Ln为n阶单位矩阵 由于根据定义直接求矩阵特征值的过程比较复杂,因此在实际计算中,往往采取一些 数值方法。本章主要介绍求一般方阵绝对值最大的特征值的乘幂( Power)法、求对称方阵特 征值的雅可比法和单侧旋转(One- side rotation法以及求一般矩阵全部特征值的QR方法及 一些相关的并行算法 1.1求解矩阵最大特征值的乘幂法 111乘幂法及其串行算法 在许多实际问题中,只需要计算绝对值最大的特征值,而并不需要求矩阵的全部特征值 乘幂法是一种求矩阵绝对值最大的特征值的方法。记实方阵A的n个特征值为A (1,2,…,m),且满足: l2|2|≥|a32…≥|n 特征值λ对应的特征向量为x。乘幂法的做法是:①取n维非零向量w作为初始向量:② 对于k=1 ,做如下迭代: uk=Avk-1 V=Wk/uk 直至脚b-k<e为止,这时r就是A的绝对值最大的特征值x所对应的特 征向量x。若v与v的各个分量同号且成比例,则A=:若v1与v的各个分量异号 且成比例,则A1=-|ll。若各取一次乘法和加法运算时间、一次除法运算时间、一次比较 运算时间为一个单位时间,则因为一轮计算要做一次矩阵向量相乘、一次求最大元操作和一 次规格化操作,所以下述乘幂法串行算法21.1的一轮计算时间为n2+2n=O(n2)。 算法21.1单处理器上乘幂法求解矩阵最大特征值的算法 输入:系数矩阵Anxn,初始向量vn×1,ε 输出:最大的特征值max Begi while( diff>)de ()for i=l to n do (1.2)for=I to n do sm=sm+a[i引*xU enal io
1. 9 矩阵特征值计算 在实际的工程计算中,经常会遇到求 n 阶方阵 A 的特征值(Eigenvalue)与特征向量 (Eigenvector)的问题。对于一个方阵 A,如果数值 λ 使方程组 Ax=λx 即 (A-λIn)x=0 有非零解向量(Solution Vector)x,则称 λ 为方阵 A 的特征值,而非零向量 x 为 特征值 λ 所对应的特征向量,其中 In 为 n 阶单位矩阵。 由于根据定义直接求矩阵特征值的过程比较复杂,因此在实际计算中,往往采取一些 数值方法。本章主要介绍求一般方阵绝对值最大的特征值的乘幂(Power)法、求对称方阵特 征值的雅可比法和单侧旋转(One-side Rotation)法以及求一般矩阵全部特征值的 QR 方法及 一些相关的并行算法。 1.1 求解矩阵最大特征值的乘幂法 1.1.1 乘幂法及其串行算法 在许多实际问题中,只需要计算绝对值最大的特征值,而并不需要求矩阵的全部特征值。 乘幂法是一种求矩阵绝对值最大的特征值的方法。记实方阵 A 的 n 个特征值为 λi i=(1,2, …,n),且满足: │λ1│≥│λ2│≥│λ3│≥…≥│λn│ 特征值 λi 对应的特征向量为 xi。乘幂法的做法是:①取 n 维非零向量 v0 作为初始向量;② 对于 k=1,2, …,做如下迭代: uk =Avk-1 vk= uk /║uk║∞ 直至 − uk+1 uk ε 为止,这时 vk+1 就是 A 的绝对值最大的特征值 λ1 所对应的特 征向量 x1。若 vk-1 与 vk的各个分量同号且成比例,则 λ1=║uk║∞;若 vk-1 与 vk的各个分量异号 且成比例,则 λ1= -║uk║∞。若各取一次乘法和加法运算时间、一次除法运算时间、一次比较 运算时间为一个单位时间,则因为一轮计算要做一次矩阵向量相乘、一次求最大元操作和一 次规格化操作,所以下述乘幂法串行算法 21.1 的一轮计算时间为 n 2+2n=O(n 2 )。 算法 21.1 单处理器上乘幂法求解矩阵最大特征值的算法 输入:系数矩阵 An×n,初始向量 v n×1,ε 输出:最大的特征值 max Begin while (│diff│>ε) do (1)for i=1 to n do (1.1)sum=0 (1.2)for j= 1 to n do sum=sum+a[i,j]*x[j] end for
(1.3)b}=sm (2)max b[ (3)for i=2 to n d if( b(a >max)then max= b(i end if end fo (4)for i=I to n do x[=b/ end for (5)diff=max-oldmax, oldmaxmax end while 112乘幕法并行算法 乘幂法求矩阵特征值由反复进行矩阵向量相乘来实现,因而可以采用矩阵向量相乘的数 据划分方法。设处理器个数为p,对矩阵A按行划分为p块,每块含有连续的m行向量 这里m=「m/pl,编号为i的处理器含有A的第m至第(+1)m-1行数据,(=01,…P-1),初 始向量γ被广播给所有处理器 各处理器并行地对存于局部存储器中a的行块和向量ν做乘积操作,并求其m维结果 向量中的最大值 localmax,然后通过归约操作的求最大值运算得到整个n维结果向量中的最 大值max并广播给所有处理器,各处理器利用max进行规格化操作。最后通过扩展收集操 作将各处理器中的m维结果向量按处理器编号连接起来并广播给所有处理器,以进行下 次迭代计算,直至收敛。具体算法框架描述如下 算法212乘幂法求解矩阵最大特征值的并行算法 输入:系数矩阵Axn,初始向量vn×1,ε 输出:最大的特征值max Begin 对所有处理器 my rank( my rank=0,…,p-1)同时执行如下的算法 hil(dile)do/dif.特征向量的各个分量新旧值之差的最大值* (1)for=0tom-1do/*对所存的行计算特征向量的相应分量* (1.1)am=0 (1.2)forj=0 to n-l do sumsumtai, xlI end fo (1.3)6[}= nd fo (2) calmar=|b0]|/对所计算的特征向量的相应分量 求新旧值之差的最大值 localmax* ()for i=l to m-I do if( b(i>localmax)then localmax= b[a end if (4)用 Allreduce操作求出所有处理器中 locaImax值的最大值max 并广播到所有处理器中 (5)fori=0tom-1do/*对所计算的特征向量归一化*
(1.3)b[i]= sum end for (2)max=│b[1]│ (3)for i=2 to n do if (│b[i]│>max) then max=│b[i]│ end if end for (4)for i=1 to n do x[i] =b[i]/max end for (5)diff=max-oldmax , oldmax=max end while End 1.1.2 乘幂法并行算法 乘幂法求矩阵特征值由反复进行矩阵向量相乘来实现,因而可以采用矩阵向量相乘的数 据划分方法。设处理器个数为 p,对矩阵 A 按行划分为 p 块,每块含有连续的 m 行向量, 这里 m = n/ p ,编号为 i 的处理器含有 A 的第 im 至第(i+1)m-1 行数据,(i=0,1, …,p-1),初 始向量 v 被广播给所有处理器。 各处理器并行地对存于局部存储器中 a 的行块和向量 v 做乘积操作,并求其 m 维结果 向量中的最大值 localmax,然后通过归约操作的求最大值运算得到整个 n 维结果向量中的最 大值 max 并广播给所有处理器,各处理器利用 max 进行规格化操作。最后通过扩展收集操 作将各处理器中的 m 维结果向量按处理器编号连接起来并广播给所有处理器,以进行下一 次迭代计算,直至收敛。具体算法框架描述如下: 算法 21.2 乘幂法求解矩阵最大特征值的并行算法 输入:系数矩阵 An×n,初始向量 v n×1,ε 输出:最大的特征值 max Begin 对所有处理器 my_rank(my_rank=0,…, p-1)同时执行如下的算法: while (│diff│>ε) do /* diff 为特征向量的各个分量新旧值之差的最大值*/ (1)for i=0 to m-1 do /*对所存的行计算特征向量的相应分量*/ (1.1)sum=0 (1.2)for j= 0 to n-1 do sum=sum+a[i,j]*x[j] end for (1.3)b[i]= sum end for (2)localmax=│b[0]│ /*对所计算的特征向量的相应分量 求新旧值之差的最大值 localmax */ (3)for i=1 to m-1 do if (│b[i]│>localmax) then localmax=│b[i]│ end if end for (4)用 Allreduce 操作求出所有处理器中 localmax 值的最大值 max 并广播到所有处理器中 (5)for i=0to m-1 do /*对所计算的特征向量归一化 */
bG=b[0/max end for 6)用A! gather操作将各个处理器中计算出的特征向量的分量的新值组合并广播到 所有处理器中 (7)diff=max-oldmax, oldmaxmax end while 若各取一次乘法和加法运算时间、一次除法运算时间、一次比较运算时间为一个单位时 间,一轮迭代的计算时间为m+2m;一轮迭代中,各处理器做一次归约操作,通信量为1, 次扩展收集操作,通信量为m,则通信时间为4,(√P-1)+(m+1yn(p-1)。因此乘幂法的 轮并行计算时间为Tn=m+2m+42(√P-1)+(m+1xn(P-1) MPI源程序请参见所附光盘。 12求对称矩阵特征值的雅可比法 121雅可比法求对称矩阵特征值的串行算法 若矩阵A=[a是n阶实对称矩阵,则存在一个正交矩阵U,使得 UAU=D 其中D是一个对角矩阵,即 这里λ(=1,2…,m)是A的特征值,U的第i列是与λ对应的特征向量。雅可比算法主要是通 过正交相似变换将一个实对称矩阵对角化,从而求出该矩阵的全部特征值和对应的特征向 量。因此可以用一系列的初等正交变换逐步消去A的非对角线元素,从而使矩阵A对角化。 设初等正交矩阵为R(P2qO,其(pP)(q,q)位置的数据是cosO,(p,q)(qp)位置的数据分别是 sinO和 sinA(p≠q),其它位置的数据和一个同阶数的单位矩阵相同。显然可以得到 R(p,q,O)R(p4,0)=1n 不妨记B=R(PqO)AR(Pq,O,如果将右端展开,则可知矩阵B的元素与矩阵A的元素 之间有如下关系 bpp=appcos20+aggsin20+apgsin20 appSin-0+agg cos B-apgsin28 bpg=((aqg-app)sin20)/2+apg cos bpi= arcose+aa sine bip=aip cose+ aigsine 其中1≤i,j≤n且订≠Pq。因为A为对称矩阵,R为正交矩阵,所以B亦为对称矩阵 若要求矩阵B的元素b=0,则只需令(aq-ap)sin2)2+apqc0s20=0,即:
b[i] =b[i]/max end for (6)用 Allgather 操作将各个处理器中计算出的特征向量的分量的新值组合并广播到 所有处理器中 (7)diff=max-oldmax, oldmax=max end while End 若各取一次乘法和加法运算时间、一次除法运算时间、一次比较运算时间为一个单位时 间,一轮迭代的计算时间为 mn+2m;一轮迭代中,各处理器做一次归约操作,通信量为 1, 一次扩展收集操作,通信量为 m,则通信时间为 4t ( p −1) + (m +1)tw( p −1) s 。因此乘幂法的 一轮并行计算时间为 T = mn + 2m + 4t ( p −1) + (m +1)tw( p −1) p s 。 MPI 源程序请参见所附光盘。 1.2 求对称矩阵特征值的雅可比法 1.2.1 雅可比法求对称矩阵特征值的串行算法 若矩阵 A=[aij]是 n 阶实对称矩阵,则存在一个正交矩阵 U,使得 U TAU=D 其中 D 是一个对角矩阵,即 = n D 0 0 0 0 0 0 2 1 这里 λi (i=1,2,…,n)是 A 的特征值,U 的第 i 列是与 λi 对应的特征向量。雅可比算法主要是通 过正交相似变换将一个实对称矩阵对角化,从而求出该矩阵的全部特征值和对应的特征向 量。因此可以用一系列的初等正交变换逐步消去 A 的非对角线元素,从而使矩阵 A 对角化。 设初等正交矩阵为 R(p,q,θ),其(p,p)( q,q)位置的数据是 cosθ,(p, q)( q, p)位置的数据分别是 -sinθ 和 sinθ(p ≠ q),其它位置的数据和一个同阶数的单位矩阵相同。显然可以得到: R(p,q,θ) TR(p,q,θ)=In 不妨记 B= R(p,q,θ) TAR(p,q,θ),如果将右端展开,则可知矩阵 B 的元素与矩阵 A 的元素 之间有如下关系: bpp = appcos2θ+aqqsin2θ+apqsin2θ bqq = appsin2θ+aqq cos2θ-apqsin2θ bpq = ((aqq -app)sin2θ)/2+apq cos2θ bqp = bpq bpj= apjcosθ+aqjsinθ bqj = -apjsinθ +aqjcosθ bip= aipcosθ+aiqsinθ biq= -aipsinθ +aiqcosθ bij= aij 其中 1 ≤ i, j ≤ n 且 i,j ≠ p,q。因为 A 为对称矩阵,R 为正交矩阵,所以 B 亦为对称矩阵。 若要求矩阵 B 的元素 bpq =0,则只需令 ((aqq -app)sin2θ)/2+apq cos2θ=0,即:
(agg-app)/2 在实际应用时,考虑到并不需要解出O,而只需要求出sin26,sin0和co就可以了。 如果限制θ值在-x/2<20≤π/2,则可令 容易推出 利用sin2θ,sinθ和cosθ的值,即得矩阵B的各元素。矩阵A经过旋转变换,选定的 非主对角元素ap及a4p(一般是绝对值最大的)就被消去,且其主对角元素的平方和增加了 2a2,而非主对角元素的平方和减少了2a2四,矩阵元素总的平方和不变。通过反复选取主 元素φ,并作旋转变换,就逐步将矩阵A变为对角矩阵。在对称矩阵中共有(n2-n)2个非主 对角元素要被消去,而每消去一个非主对角元素需要对2n个元素进行旋转变换,对一个元 素进行旋转变换需要2次乘法和1次加法,若各取一次乘法运算时间或一次加法运算时间为 一个单位时间,则消去一个非主对角元素需要3个单位运算时间,所以下述算法213的一 轮计算时间复杂度为(m2-n)/2*2n*3=3m(n-1)=O(n) 算法21.3单处理器上雅可比法求对称矩阵特征值的算法 输入:矩阵Anxn,E 输出:矩阵特征值 Eigenvalue (while(max >e)de (1.1)max=a[12] (1.2)for i=l to n de for户=汁+ I to n do if(a[/)>max)then max=a[i P=i, qj end if end for (1.3)Compute m-alp, q ], n(alg, q]. pl)2, w=sgn(n)*m/sqrt(m*m+n*n si2=w, sil=w/sqrt(2(1+ sqrt(l-y*w))), col=sqrt(l-sil*sil) blp,P=alp.]*col col+al, q*si l*sil+ alp. q]*si2 bl, q=alp,P]*sil*sil+ alg, q*col*col-alp, q*si2 b{q,p]=0,b{P,q}=0 (1.4)for户= I to n do if(≠p)and(≠q))then (ibp=alp col+ala sil (ii)bla=-alp. *sil +a[g]*col end if (1. 5)for i=l to n do
( ) 2 2 qq pp pq a a a tg − − = 在实际应用时,考虑到并不需要解出 θ,而只需要求出 sin2θ,sinθ 和 cosθ 就可以了。 如果限制 θ 值在-π/2 < 2θ ≤ π/2,则可令 2 2 ( ), sgn( ) 2 1 , m n m m apq n aqq app w n + = − = − = 容易推出: sin2 = w, 2(1 1 ) sin w2 w + − = , 2 cos = 1−sin 利用 sin2θ,sinθ 和 cosθ 的值,即得矩阵 B 的各元素。矩阵 A 经过旋转变换,选定的 非主对角元素 apq 及 aqp(一般是绝对值最大的)就被消去,且其主对角元素的平方和增加了 2 2apq ,而非主对角元素的平方和减少了 2a 2 pq,矩阵元素总的平方和不变。通过反复选取主 元素 apq,并作旋转变换,就逐步将矩阵 A 变为对角矩阵。在对称矩阵中共有(n 2 -n)/2 个非主 对角元素要被消去, 而每消去一个非主对角元素需要对 2n 个元素进行旋转变换, 对一个元 素进行旋转变换需要 2 次乘法和 1 次加法,若各取一次乘法运算时间或一次加法运算时间为 一个单位时间,则消去一个非主对角元素需要 3 个单位运算时间,所以下述算法 21.3 的一 轮计算时间复杂度为 (n 2 -n)/2*2n*3=3n 2 (n-1)=O(n 3 )。 算法 21.3 单处理器上雅可比法求对称矩阵特征值的算法 输入:矩阵 An×n,ε 输出:矩阵特征值 Eigenvalue Begin (1)while (max >ε) do (1.1) max=a[1,2] (1.2)for i=1 to n do for j= i+1 to n do if (│a[i,j]) │>max) then max =│a[i,j] │,p=i,q=j end if end for end for (1.3)Compute: m=- a[p,q],n=(a[q,q]- a[p,p])/2,w=sgn(n)*m/sqrt(m*m+n*n), si2=w,si1=w/sqrt(2(1+ sqrt(1-w*w))),co1=sqrt(1-si1*si1), b[p,p]= a[p,p]*co1*co1+ a[q,q]*si1*si1+ a[p,q]*si2, b[q,q]= a[p,p]*si1*si1+ a[q,q]*co1*co1- a[p,q]*si2, b[q, p]=0,b[p,q]=0 (1.4)for j=1 to n do if ((j ≠ p) and ( j ≠ q)) then (i)b[p,j]= a[p,j]*co1+ a[q,j]*si1 (ii)b[q,j]= -a[p,j]*si1 + a[q,j]*co1 end if end for (1.5)for i=1 to n do
if(i+p)and(i≠q)then (ib, P=aip]col+ai, q* sil (ii)b[i, g=-alip*sil+ ali, q]"col end if end for (1. 6for i=/ to n do forj=l to n de q[/=b end for end while (2)for i=l to Eigenvalue=a[i, i] end for End 122雅可比法求对称矩阵特征值的并行算法 串行雅可比算法逐次寻找非主对角元绝对值最大的元素的方法并不适合于并行计算。因 此,在并行处理中,我们每次并不寻找绝对值最大的非主对角元消去,而是按一定的顺序将 A中的所有上三角元素全部消去一遍,这样的过程称为一轮。由于对称性,在一轮中,A的 下三角元素也同时被消去一遍。经过若干轮,可使A的非主对角元的绝对值减少,收敛于 个对角方阵。具体算法如下 设处理器个数为p,对矩阵A按行划分为2p块,每块含有连续的m/2行向量,记 m=「n/p1,这些行块依次记为A4,…Ayp,并将A2与A2+存放与标号为i的处理器中 每轮计算开始,各处理器首先对其局部存储器中所存的两个行块的所有行两两配对进行 旋转变换,消去相应的非对角线元素。然后按图21.1所示规律将数据块在不同处理器之间 传送,以消去其它非主对角元素。 开始:(0,1)(2,3)(4,5)(6,7) 七步: 图11p=4时的雅可比算法求对称矩阵特征值的数据交换图
if((i ≠ p) and (i ≠ q)) then (i)b[i, p]= a[i,p]*co1+ a[i,q]*si1 (ii)b[i, q]= - a[i,p]*si1+ a[i,q]*co1 end if end for (1.6)for i=1 to n do for j=1 to n do a[i,j]=b[i,j] end for end for end while (2)for i=1 to n do Eigenvalue[i]= a[i, i] end for End 1.2.2 雅可比法求对称矩阵特征值的并行算法 串行雅可比算法逐次寻找非主对角元绝对值最大的元素的方法并不适合于并行计算。因 此,在并行处理中,我们每次并不寻找绝对值最大的非主对角元消去,而是按一定的顺序将 A 中的所有上三角元素全部消去一遍,这样的过程称为一轮。由于对称性,在一轮中,A 的 下三角元素也同时被消去一遍。经过若干轮,可使 A 的非主对角元的绝对值减少,收敛于 一个对角方阵。具体算法如下: 设处理器个数为 p,对矩阵 A 按行划分为 2p 块,每块含有连续的 m/2 行向量,记 m = n / p ,这些行块依次记为 A0,A1, …,A2p-1,并将 A2i 与 A2i+1 存放与标号为 i 的处理器中。 每轮计算开始,各处理器首先对其局部存储器中所存的两个行块的所有行两两配对进行 旋转变换,消去相应的非对角线元素。然后按图 21.1 所示规律将数据块在不同处理器之间 传送,以消去其它非主对角元素。 开 始 :(0,1)(2,3)(4,5)(6,7) 第一步 :(0,3)(1,5)(2,7)(4,6) 第二步 :(0,5)(3,7)(1,6)(2,4) 第三步 :(0,7)(5,6)(3,4)(1,2) 第四步 :(0,6)(7,4)(5,2)(3,1) 第五步 :(0,4)(6,2)(7,1)(5,3) 第六步 :(0,2)(4,1)(6,3)(7,5) 第七步 :(0,1)(2,3)(4,5)(6,7) 0 1 2 3 4 5 6 7 图 1.1 p=4 时的雅可比算法求对称矩阵特征值的数据交换图