.26. 第一讲线性代数基础 其中r:是与入:所对应的最大Jordan块的维数 1.4.2Schr分解 Jordan标准型在理论研究中非常有用,但数值计算比较闲难.下面我们介绍一个比较实用的 矩阵分解,即Schur分解. 定理1.47设A∈Cmxn(成Rnx”),则存在酉矩阵U∈Cmxn使得 [λ1r12r1n U'AU= 0 2nR或A=URU (1.9) 0.0入m 其中1,2,,入m是A的特征值(可以按任意顺序排列)。 (板书) 关于Schur分解的几点说明 。该结论告诉我们,任意一个矩阵都可以西三角化. ·三角矩阵可以说是一般矩阵在西相似变化下的最简形式 ·定理中的U和R不是唯一的. 。的对角线元素可以按任意顺序排列,特别地,可以按模从大到小排列 推论1.48设A∈Cmxm,则 ()A是正规矩阵当且仅当R是对角矩阵,即A可对角化当且仅当A是正规矩阵 (2)A是Hermite矩阵当且仅当R是实对角矩阵 众所周知,当A是实矩阵时,其特征值和特征向量仍可能是复的。在计算实矩阵的特征值时, 通常希望尽可能地避免复数运算.这时,我们就需要用到下面的实Schr分解(或拟Schur分解). 定理1.49设A∈Rn×n,则存在正交矩阵Q∈Rnxn,使得 QTAQ=T. (1.10 其中T∈mx”是拟上三角矩阵,即T是块上三角的,且对角块为1×12×2的块矩阵.若对 角块是1×1的,则其就是A的一个特征值,若对角块是2×2的,则其特征值是A的一对共轭 复特征值 (板书》 易知,若拟上三角矩阵T是上三角矩阵,则A的特征值都是实的.反之,结论也成立 推论1.50设A∈Rn×n的特征值都是实的,则存在正交矩阵Q∈Rnxm和上三角矩阵R∈ Rnxn使得 QTAQ=R. 其中R的对角线元素即为A的特征值, http://math.ecnu.edu.cn/-jypan
仅供课堂教学使用,请勿外传 · 26 · 第一讲 线性代数基础 其中 ri 是与 λi 所对应的最大 Jordan 块的维数. 1.4.2 Schur 分解 Jordan 标准型在理论研究中非常有用, 但数值计算比较困难. 下面我们介绍一个比较实用的 矩阵分解, 即 Schur 分解. 定理 1.47 设 A ∈ C n×n (或 R n×n ), 则存在酉矩阵 U ∈ C n×n 使得 U ∗AU = λ1 r12 · · · r1n 0 λ2 · · · r2n . . . . . . . . . 0 · · · 0 λn ≜ R 或 A = URU∗ , (1.9) 其中 λ1, λ2, . . . , λn 是 A 的特征值 (可以按任意顺序排列). (板书) 关于 Schur 分解的几点说明 • 该结论告诉我们, 任意一个矩阵都可以酉三角化. • 三角矩阵可以说是一般矩阵在酉相似变化下的最简形式. • 定理中的 U 和 R 不是唯一的. • R 的对角线元素可以按任意顺序排列, 特别地, 可以按模从大到小排列. 推论 1.48 设 A ∈ C n×n , 则 (1) A 是正规矩阵当且仅当 R 是对角矩阵, 即 A 可酉对角化当且仅当 A 是正规矩阵; (2) A 是 Hermite 矩阵当且仅当 R 是实对角矩阵. 众所周知, 当 A 是实矩阵时, 其特征值和特征向量仍可能是复的. 在计算实矩阵的特征值时, 通常希望尽可能地避免复数运算. 这时, 我们就需要用到下面的实 Schur 分解 (或拟 Schur 分解). 定理 1.49 设 A ∈ R n×n , 则存在正交矩阵 Q ∈ R n×n , 使得 Q ⊺ AQ = T, (1.10) 其中 T ∈ R n×n 是拟上三角矩阵, 即 T 是块上三角的, 且对角块为 1 × 1 或 2 × 2 的块矩阵. 若对 角块是 1 × 1 的, 则其就是 A 的一个特征值, 若对角块是 2 × 2 的, 则其特征值是 A 的一对共轭 复特征值. (板书) 易知, 若拟上三角矩阵 T 是上三角矩阵, 则 A 的特征值都是实的. 反之, 结论也成立. 推论 1.50 设 A ∈ R n×n 的特征值都是实的, 则存在正交矩阵 Q ∈ R n×n 和上三角矩阵 R ∈ R n×n 使得 Q ⊺ AQ = R, 其中 R 的对角线元素即为 A 的特征值. http://math.ecnu.edu.cn/~jypan
1.5几类特殊矩阵 1.5几类特殊矩阵 1.5.1对称正定矩阵 定义1.15设A∈Cmxn ·若对所有向量x∈C有R(红A)≥0,则称A是半正定的: ·若对所有非零向量x∈C有Re(x'Az)>0,则称A是正定的: ·若A是Hermite的且半正定,则称A为Hermite半正定: ·若A是Hermite的且正定,则称A为Hermite正定; ·若A∈Rnxn是对称的且半正定,则称A为对称半正定 ·若A∈Rnxn是对称的且正定,则称A为对称正定. 白若对所有向量x∈C有x*Ax∈R,则A=A. 白本讲义中,正定和半正定矩阵不要求是对称或Hermite.. 定理151设A∈Cmxm,则A正定(或半正定)的充要条件是矩阵H=(A+A)正定(成半 正 (留作练习) 如果A是实矩阵,则只需在实数域中考虑即可。 定理1.52设A∈Rnxn,则A正定(成半正定)的充要条件是对任意非零向量x∈Rm有xTAr> 0(成xAx20). (留作练习) 对称正定矩的基本性质 设A∈Cn×n. ()A Hermite正定当且仅当A Hermite且所有特征值都是正的: (2)A Hermite正定当且仅当存在酉矩阵U使得A=UAU“,其中A为对角矩阵且对角线均 为正实数 (3)A Hermite正定当且仅当SAS对称正定,其中S∈Cmxm是一个任意的非奇异矩阵: (④)若A Hermite正定,则A的任意主子矩阵都Hermite正定; (句若Hermite正定,则A的所有对角线元素都是正的,且罗la}<mea小.即绝对 值最大的元素出现在对角线上 白以上结论在实数域中也成立. 平方根 如果A是Hermite(半)正定矩阵,则可以定义其平方根,即存在唯一的Hermite(半)正定矩阵 B,使得B2=A.事实上,我们有下面更一般的结论71小. http://math.ecnu.edu.cn/-jypan
仅供课堂教学使用,请勿外传 1.5 几类特殊矩阵 · 27 · 1.5 几类特殊矩阵 1.5.1 对称正定矩阵 定义 1.15 设 A ∈ C n×n . • 若对所有向量 x ∈ C n 有 Re(x ∗Ax) ≥ 0, 则称 A 是半正定的; • 若对所有非零向量 x ∈ C n 有 Re(x ∗Ax) > 0, 则称 A 是正定的; • 若 A 是 Hermite 的且半正定, 则称 A 为 Hermite 半正定; • 若 A 是 Hermite 的且正定, 则称 A 为 Hermite 正定; • 若 A ∈ R n×n 是对称的且半正定, 则称 A 为对称半正定; • 若 A ∈ R n×n 是对称的且正定, 则称 A 为对称正定. b 若对所有向量 x ∈ C n 有 x ∗Ax ∈ R, 则 A∗ = A. b 本讲义中, 正定和半正定矩阵不要求是对称或 Hermite. 定理 1.51 设 A ∈ C n×n , 则 A 正定 (或半正定) 的充要条件是矩阵 H = 1 2 (A + A∗ ) 正定 (或半 正定). (留作练习) 如果 A 是实矩阵, 则只需在实数域中考虑即可. 定理 1.52 设 A ∈ R n×n , 则 A 正定 (或半正定) 的充要条件是对任意非零向量 x ∈ R n 有 x ⊺Ax > 0 (或 x ⊺Ax ≥ 0). (留作练习) 对称正定矩阵的基本性质 设 A ∈ C n×n . (1) A Hermite 正定当且仅当 A Hermite 且所有特征值都是正的; (2) A Hermite 正定当且仅当存在酉矩阵 U 使得 A = UΛU ∗ , 其中 Λ 为对角矩阵且对角线均 为正实数; (3) A Hermite 正定当且仅当 S ∗AS 对称正定, 其中 S ∈ C n×n 是一个任意的非奇异矩阵; (4) 若 A Hermite 正定, 则 A 的任意主子矩阵都 Hermite 正定; (5) 若 A Hermite 正定, 则 A 的所有对角线元素都是正的, 且 max i̸=j {|aij |} < max i {aii}, 即绝对 值最大的元素出现在对角线上. b 以上结论在实数域中也成立. 平方根 如果 A 是 Hermite (半) 正定矩阵, 则可以定义其平方根, 即存在唯一的 Hermite (半) 正定矩阵 B, 使得 B2 = A. 事实上, 我们有下面更一般的结论 [71]. http://math.ecnu.edu.cn/~jypan
·28 第一讲线性代数基础 定理1.53设A∈Cmxm是一个Hermite半正定矩阵,k是一个给定的正整数,则存在唯一的 Hermite半正定矩阵B∈Cnxn使得 Bk =A. 同时,我们还有下面的性质: (I)rank(B)=rank(A),因此,若A是正定的,则B也正定: (2)如果A是实矩阵的,则B也是实矩阵。 特别地,当k=2时,称B为A的平方根,记为A (留作课外自习) Hermite正定矩阵与内积 Hermite正定矩阵与内积之间有如下的一一对应关系 定理1.54设(,)是Cm上的一个内积,则存在一个Hermite正定矩阵A∈Cmxm使得 (,y)=y'Ar. 反之,若A∈Cnxm是Hermite正定矩阵,则 f红,)色Ax 是C”上的一个内积. (留作练习】 凸该结论在实数城中也成立, 1.5.2对角占优矩阵 定义1.16设A∈Cn×n,若 lail≥∑lal 对所有i=1,2,.,n都成立,且至少有一个不等式严格成立,则称A为弱行对角占优,简称弱 对角占优或对角占优.若所有不等式都严格成立,则为严格行对角占优或严格对角占优. 白类似地.可以定义列对角占优和严格列对角占优 定理155若A∈CmXm是严格对角占优矩阵,则A非奇异 (板书) 1.5.3不可约矩阵 http://math.ecnu.edu.cn/-jypan
仅供课堂教学使用,请勿外传 · 28 · 第一讲 线性代数基础 定理 1.53 设 A ∈ C n×n 是一个 Hermite 半正定矩阵, k 是一个给定的正整数, 则存在唯一的 Hermite 半正定矩阵 B ∈ C n×n 使得 B k = A. 同时, 我们还有下面的性质: (1) rank(B) = rank(A), 因此, 若 A 是正定的, 则 B 也正定; (2) 如果 A 是实矩阵的, 则 B 也是实矩阵. 特别地, 当 k = 2 时, 称 B 为 A 的平方根, 记为 A 1 2 . (留作课外自习) Hermite 正定矩阵与内积 Hermite 正定矩阵与内积之间有如下的一一对应关系. 定理 1.54 设 (·, ·) 是 C n 上的一个内积, 则存在一个 Hermite 正定矩阵 A ∈ C n×n 使得 (x, y) = y ∗Ax. 反之, 若 A ∈ C n×n 是 Hermite 正定矩阵, 则 f(x, y) ≜ y ∗Ax 是 C n 上的一个内积. (留作练习) b 该结论在实数域中也成立. 1.5.2 对角占优矩阵 定义 1.16 设 A ∈ C n×n , 若 |aii| ≥ X j̸=i |aij | 对所有 i = 1, 2, . . . , n 都成立, 且至少有一个不等式严格成立, 则称 A 为弱行对角占优, 简称弱 对角占优或对角占优. 若所有不等式都严格成立, 则为严格行对角占优或严格对角占优. b 类似地, 可以定义列对角占优 和 严格列对角占优. 定理 1.55 若 A ∈ C n×n 是严格对角占优矩阵, 则 A 非奇异. (板书) 1.5.3 不可约矩阵 http://math.ecnu.edu.cn/~jypan
1.5几类特殊矩阵 .29 定义1.17设A∈Cmxm,如果存在置换矩阵P使得PAPT为块上三角矩阵,即 PAPT= A11A12 0A2 ,A11∈Ckxk,A22∈Cn-k)xu- (1.11) 其中1≤k<,则称A是可约的,否则就称A为不可约的. 白如果A是1×1矩阵,则A不可约当且仅当A非零 白如果A∈Cmxn是可约的,则A至少有n-1个零 不可约的意义 若A可约,即存在置换矩阵P,使得 0A22 则线性方程组Az=b等价于PAPTPr=Pb.记y≌Px,f色Pb,则 :圆 因此,原方程组就转化为下面两个更小规模的子方程组 A22=f2, A11h=五-A122 显然,求解这两个方程组比求解原方程组所需的运算量更少 对于特征值问题,A的特征值就是A1和A2的特征值的并,因此也只需考虑子矩阵A1和 A2的特征值即可. 如果A22或A1仍然是可约的,则可以转化为更小规模的子问题,直到不可约为止.因此我们 在讨论某些算法的性质时,一般只需考虑不可约情形, 凸由于PAPT保持A的对角线元素仍然在对角线上,因此由定理1.58可知,主对角线元素是 否为零并不影响矩阵的可约性。 推论156设A=[a∈Cmxn不可约,则A+D也不可约,其中D是任意对角矩阵.特别地, B兰A-diag(a1l,a22,,ann)不可约. 如果A可约,即存在置换矩阵P使得PAP具有(1.11)的形式,则对任意正整数k,有 PApT=(PAPTY=[A临] 04 (1.12) 于是我们有下面的结论. http://math.ecnu.edu.cn/-jypan
仅供课堂教学使用,请勿外传 1.5 几类特殊矩阵 · 29 · 定义 1.17 设 A ∈ C n×n , 如果存在置换矩阵 P 使得 P AP⊺ 为块上三角矩阵, 即 P AP⊺ = " A11 A12 0 A22# , A11 ∈ C k×k , A22 ∈ C (n−k)×(n−k) (1.11) 其中 1 ≤ k < n, 则称 A 是可约的, 否则就称 A 为不可约的. b 如果 A 是 1 × 1 矩阵, 则 A 不可约当且仅当 A 非零. b 如果 A ∈ C n×n 是可约的, 则 A 至少有 n − 1 个零. 不可约的意义 若 A 可约, 即存在置换矩阵 P, 使得 P AP⊺ = " A11 A12 0 A22# , 则线性方程组 Ax = b 等价于 P AP⊺ P x = P b. 记 y ≜ P x, f ≜ P b, 则 " A11 A12 0 A22# "y1 y2 # = " f1 f2 # . 因此, 原方程组就转化为下面两个更小规模的子方程组 A22y2 = f2, A11y1 = f1 − A12y2. 显然, 求解这两个方程组比求解原方程组所需的运算量更少. 对于特征值问题, A 的特征值就是 A11 和 A22 的特征值的并, 因此也只需考虑子矩阵 A11 和 A22 的特征值即可. 如果 A22 或 A11 仍然是可约的, 则可以转化为更小规模的子问题, 直到不可约为止. 因此我们 在讨论某些算法的性质时, 一般只需考虑不可约情形. b 由于 P AP⊺ 保持 A 的对角线元素仍然在对角线上, 因此由定理 1.58 可知, 主对角线元素是 否为零并不影响矩阵的可约性. 推论 1.56 设 A = [aij ] ∈ C n×n 不可约, 则 A + D 也不可约, 其中 D 是任意对角矩阵. 特别地, B ≜ A − diag(a11, a22, . . . , ann) 不可约. 如果 A 可约, 即存在置换矩阵 P 使得 P AP⊺ 具有 (1.11) 的形式, 则对任意正整数 k, 有 P AkP ⊺ = (P AP⊺ ) k = " Ak 11 A˜ (k) 12 0 Ak 22 # . (1.12) 于是我们有下面的结论. http://math.ecnu.edu.cn/~jypan
.30 第一讲线性代数基础 定理1.57设A∈Cm×n.若A可约,则A也可约.反之,若存在一个正整数k,使得Ak是不可 约的,则A也不可约 -11 白需要指出的是,不可约矩阵的幂不一定是不可约的.如A= 不可约,但A2= 11 B习 下面的定理给出了一个矩阵不可约的充要条件 定理158设A=[al∈Cmx,指标集n={L,2,…,,n小,则A可约的充要条件是存在非空 指标集S,TCZn满足S⊕T=Z,使得 a=0,i∈S,jeT (板书) 下面是判断矩阵是否可约的另一个充要条件 定理159设A=[a]∈Cmn,指标集m={L,2,,n小,则A可约的充要条件是存在两个相 异的正整数k,1eZn,使得对任意指标序列{i1,i2,,i,}CZm,都有 a,a2…a,l=0. 这里r>0是任意正整数 (留作课外自习) 定理1.59的等价描述 矩阵A=[a∈C×m不可约的充要条件是:对任意两个相异正整数k,1∈Zm,都存在一个指 标序列{1,2…,m}Zm使得 aka1a4ml≠0 我们知道,严格对角占优矩阵是非奇异的.如果A是不可约对角占优矩阵,则可以同样证明 A是非奇异的. 定理1.60设A∈Cm×n是不可约的弱对角占优矩阵,则A非奇异. (留作练习) 凸关于严格对角占优矩阵和不可约弱对角占优矩阵的非奇异性,也可以使用Gerschgorin园盘 定理证明,参见140: 通常,如果某个元素全不为零的矩阵具有某种性质,则这个性质往往能推广到不可约矩阵。 http://math.ecnu.edu.cn/-jypan
仅供课堂教学使用,请勿外传 · 30 · 第一讲 线性代数基础 定理 1.57 设 A ∈ C n×n . 若 A 可约, 则 Ak 也可约. 反之, 若存在一个正整数 k, 使得 Ak 是不可 约的, 则 A 也不可约. b 需要指出的是, 不可约矩阵的幂不一定是不可约的. 如 A = " −1 1 1 1# 不可约, 但 A2 = " 2 0 0 2# 可约. 下面的定理给出了一个矩阵不可约的充要条件. 定理 1.58 设 A = [aij ] ∈ C n×n , 指标集 Zn = {1, 2, . . . , ..., n}, 则 A 可约的充要条件是存在非空 指标集 S, T ⊂ Zn 满足 S ⊕ T = Zn, 使得 aij = 0, i ∈ S, j ∈ T . (板书) 下面是判断矩阵是否可约的另一个充要条件. 定理 1.59 设 A = [aij ] ∈ C n×n , 指标集 Zn = {1, 2, . . . , n}, 则 A 可约的充要条件是存在两个相 异的正整数 k, l ∈ Zn, 使得对任意指标序列 {i1, i2, . . . , ir} ⊆ Zn, 都有 aki1 ai1i2 · · · airl = 0. 这里 r > 0 是任意正整数. (留作课外自习) 定理 1.59 的等价描述 矩阵 A = [aij ] ∈ C n×n 不可约的充要条件是: 对任意两个相异正整数 k, l ∈ Zn, 都存在一个指 标序列 {i1, i2, . . . , im} ⊆ Zn 使得 aki1 ai1i2 · · · aiml ̸= 0. 我们知道, 严格对角占优矩阵是非奇异的. 如果 A 是不可约对角占优矩阵, 则可以同样证明 A 是非奇异的. 定理 1.60 设 A ∈ C n×n 是不可约的弱对角占优矩阵, 则 A 非奇异. (留作练习) b 关于严格对角占优矩阵和不可约弱对角占优矩阵的非奇异性, 也可以使用 Gerschgorin 圆盘 定理证明, 参见 [140]. 通常, 如果某个元素全不为零的矩阵具有某种性质, 则这个性质往往能推广到不可约矩阵. http://math.ecnu.edu.cn/~jypan