1.2矩阵与投影 .11 推论1.12设A∈Rmxk,B∈Rkxm,k≤m,若A和B都是满秩矩阵,则 rank(AB)=rank(BA)=rank(A)=rank(B)=k. 张成的线性空向 设1,2,…,k∈R,记 span,2+2+:01,02....,) 则spa{c1,2,,}构成R”的一个线性子空间,称为由,2,张成的线性空间.特别 地,记span(A)为由A的所有列向量张成的线性空间. 矩阵A相关的四个子空问 设A∈Rmxn,则A可以看作是从R到Rm的一个线性变换(或线性映射,线性算子,即 A:E→A 我们分别称 Ker(A)ERm Ar=0}CRm 和 Ran(A)≌{y∈Rm:y=Ar,x∈R"}SRm 为A的零空间(核和像空间(列空间,值域),称 Ker(A)兰{y∈Rm:Ay=0}CRm 和 Ran(A)e{x∈R”:x=A,y∈Rm}SR" 为A的左零空向和行空间.可以证明,Kcr(A)和Ran(AT)是R的线性子空间,Ran(A)和Kcr(AT) 是Rm的线性子空间,且Ran(A)=span(A). 定理1.13设A∈Rm×n,则有 dim(Ran(A))=dim(Ran(AT))=rank(A); .dim(Ker(A))+dim(Ran(AT))=n; .Ran(AT A)=Ran(AT),Ker(ATA)=Ker(A). 例1.8设A∈Rm×n,则 Ran(A)=Ker(AT). (板书) '严格地讲,是某个线性变换在某组基下的矩阵 http://math.ecnu.edu.cn/-jypan
仅供课堂教学使用,请勿外传 1.2 矩阵与投影 · 11 · 推论 1.12 设 A ∈ R m×k , B ∈ R k×m, k ≤ m. 若 A 和 B 都是满秩矩阵, 则 rank(AB) = rank(BA) = rank(A) = rank(B) = k. 张成的线性空间 设 x1, x2, . . . , xk ∈ R n , 记 span{x1, x2, . . . , xk} ≜ α1x1 + α2x2 + · · · + αkxk : α1, α2, . . . , αk ∈ R , 则 span{x1, x2, . . . , xk} 构成 R n 的一个线性子空间, 称为由 x1, x2, . . . , xk 张成的线性空间. 特别 地, 记 span(A) 为由 A 的所有列向量张成的线性空间. 矩阵 A 相关的四个子空间 设 A ∈ R m×n , 则 A 可以看作是从 R n 到 R m 的一个线性变换 (或线性映射, 线性算子) 1 , 即 A : x → Ax 我们分别称 Ker(A) ≜ x ∈ R n : Ax = 0 ⊆ R n 和 Ran(A) ≜ y ∈ R m : y = Ax, x ∈ R n ⊆ R m 为 A 的零空间 (核) 和像空间 (列空间, 值域), 称 Ker(A ⊺ ) ≜ y ∈ R m : A ⊺ y = 0 ⊆ R m 和 Ran(A ⊺ ) ≜ x ∈ R n : x = A ⊺ y, y ∈ R m ⊆ R n 为 A 的左零空间和行空间. 可以证明, Ker(A) 和 Ran(A ⊺ ) 是 R n 的线性子空间, Ran(A) 和 Ker(A ⊺ ) 是 R m 的线性子空间, 且 Ran(A) = span(A). 定理 1.13 设 A ∈ R m×n , 则有 • dim(Ran(A)) = dim(Ran(A ⊺ )) = rank(A); • dim(Ker(A)) + dim(Ran(A ⊺ )) = n; • Ran(A ⊺A) = Ran(A ⊺ ), Ker(A ⊺A) = Ker(A). 例 1.8 设 A ∈ R m×n , 则 Ran(A) ⊥ = Ker(A ⊺ ). (板书) 1严格地讲, 是某个线性变换在某组基下的矩阵 http://math.ecnu.edu.cn/~jypan
·12. 第一讲线性代数基础 白类似地,有Kcr(A)'=Ran(AT). 白结论在复数域也成立:如果A∈Cmxn,则Ran(A)=Kcr(A),Kcr(A)=Ran(A') 例1.9设A∈Rm×n,则由例1.8可知 Ker(A)⊕Ran(A=R",Ker(A)⊕Ran(A)=Rm. 例1.10(矩阵的秩与济次线性方程组基础解系)设A∈mxn的秩为k≤min{m,n,则齐次线 性方程组Ax=0的基础解系所含解的个数为n-k,也即dim(Kcr(A)=n一k, 1.22特征值与特征向量 定义1.6(特征值和特征向量)设A∈Rnxm.若存在入∈C和非零向量工,y∈C”,满足 Ax=入r, 则称入为A的特征值,x为A对应于入的特征向量,并称(八,)为A的一个特征对(eigenpair. 多思考:从定义1.6能否判断矩阵A是否一定存在特征值和特征向量: 矩阵特征值也可以通过特征多项式来定义. 定义1.7(特征多项式和特征值设A∈Rmxm,记P4()色de(A一A).易知Pa()是关于入的 次多项式,我们称之为A的特征多项式,其在复数域中的零点称为A的特征值. 我们知道,n次多项式在复数域中一定存在n个零点(不考虑重复零点),因此根据定义1.7, 个n阶矩阵一定存在n个特征值. 下面是关于特征多项式的一个重要性质. 定理1.l4(Cayley-Hamilton)设pA()是AE Rnxn的特征多项式,则p4(A)=0. 由Cayley-Hamilton定理1.4可知,总存在多项式p(t)使得p(A)=0.这种特殊多项式称为 零化多项式(annihilating polynomial)). 定义1.8(零化多项式和最小多项式)设A∈Rmxm,如采多项式叫)满足pA=0,则称其为A 的零化多项式,其中次数最低的首一(即首项系数为1)多项式称为A的最小多项式, 最小多顶式是矩阵的一个重要概念,在线性代数中有若重要的应用.容易证明.品小多项式是 存在唯一的,而且次数不超过n.计算最小多项式通常是非常闲难的,一种方法是通过Jordar标准 型来计算,见定理1.46. http://math.ecnu.edu.cn/-jypan
仅供课堂教学使用,请勿外传 · 12 · 第一讲 线性代数基础 b 类似地, 有 Ker(A) ⊥ = Ran(A ⊺ ). b 结论在复数域也成立: 如果 A ∈ C m×n , 则 Ran(A) ⊥ = Ker(A∗ ), Ker(A) ⊥ = Ran(A∗ ). 例 1.9 设 A ∈ R m×n , 则由例 1.8 可知 Ker(A) ⊕ Ran(A ⊺ ) = R n , Ker(A ⊺ ) ⊕ Ran(A) = R m. 例 1.10 (矩阵的秩与齐次线性方程组基础解系) 设 A ∈ R m×n 的秩为 k ≤ min{m, n}, 则齐次线 性方程组 Ax = 0 的基础解系所含解的个数为 n − k, 也即 dim(Ker(A)) = n − k. 1.2.2 特征值与特征向量 定义 1.6 (特征值和特征向量) 设 A ∈ R n×n . 若存在 λ ∈ C 和非零向量 x, y ∈ C n , 满足 Ax = λx, 则称 λ 为 A 的特征值, x 为 A 对应于 λ 的特征向量, 并称 (λ, x) 为 A 的一个特征对 (eigenpair ). 思考:从定义 1.6 能否判断矩阵 A 是否一定存在特征值和特征向量? 矩阵特征值也可以通过特征多项式来定义. 定义 1.7 (特征多项式和特征值) 设 A ∈ R n×n , 记 pA (λ) ≜ det(A − λI). 易知 pA (λ) 是关于 λ 的 n 次多项式, 我们称之为 A 的特征多项式, 其在复数域中的零点称为 A 的特征值. 我们知道, n 次多项式在复数域中一定存在 n 个零点 (不考虑重复零点), 因此根据定义 1.7, 一 个 n 阶矩阵一定存在 n 个特征值. 下面是关于特征多项式的一个重要性质. 定理 1.14 (Cayley-Hamilton) 设 pA (λ) 是 A ∈ R n×n 的特征多项式, 则 pA (A) = 0. 由 Cayley-Hamilton 定理 1.14 可知, 总存在多项式 p(t) 使得 p(A) = 0. 这种特殊多项式称为 零化多项式 (annihilating polynomial). 定义 1.8 (零化多项式和最小多项式) 设 A ∈ R n×n , 如果多项式 p(t) 满足 p(A) = 0, 则称其为 A 的零化多项式, 其中次数最低的首一 (即首项系数为 1) 多项式称为 A 的最小多项式. 最小多项式是矩阵的一个重要概念, 在线性代数中有着重要的应用. 容易证明, 最小多项式是 存在唯一的, 而且次数不超过 n. 计算最小多项式通常是非常困难的, 一种方法是通过 Jordan 标准 型来计算, 见定理 1.46. http://math.ecnu.edu.cn/~jypan
1.2矩阵与投影 .13 关于特征值的几点说明 ·只有当A是方阵时,特征值与特征向量才有定义 ·实矩阵的特征值与特征向量也有可能是复的. 。一个n阶矩阵总是存在n个特征值其中可能有相等的),通常记为1,A2,,入 ·所有特征值组成的集合称为矩阵的谱,通常记为σ(4A),即 a(A)兰{1,A2,,Xm. ·特征值有代数重数(所对应的特征多项式零点的重数和几何重数(所对应的特征空间的 维数,几何重数不超过代数重数。 ·相似变换不改变矩阵的特征值. ·合同变换不改变矩阵的惯性指数(即正特征值、负特征值和零特征值的个数 《思考:设A∈Rnxm,则AT与A的特征值和特征向量是什么关系: 设A非奇异,则A~1与A的特征值和特征向量是什么关系: 更一般地,设p)是一个多项式,则p(A)与A的特征值和特征向量是什么关系: 定义1.9(谱半径设A∈Rmxm或Cmxm,其谱半径定义如下: (A) 其中a(A)表示A的诺 下面给出特征值的一些常用性质。 定理1.15设AeRn×m,则有 1A2…入n=det(A),d+2+…+Xn=r(A) 其中de(A)表示A的行列式,r(A)表示A的迹(对角线元素之和,即 r(A)≌a11+a22+…+am (留作课外自习,高次多项式的韦达定理) 推论1.16若A与B相似,则r(A)=r(B),即相似矩阵具有相同的迹 定义1.10设A∈Rnxn.若存在一个非奇异矩阵X∈Cnxn,使得 X-1AX A, (1.1 其中A∈Cxn是对角矩阵,则称A是可对角化的,矩阵A的对角线元素即为A的特征值,分解 (1.)称为矩阵A的特征值分解或谱分解 http://math.ecnu.edu.cn/-jypan
仅供课堂教学使用,请勿外传 1.2 矩阵与投影 · 13 · 关于特征值的几点说明 • 只有当 A 是方阵时, 特征值与特征向量才有定义. • 实矩阵的特征值与特征向量也有可能是复的. • 一个 n 阶矩阵总是存在 n 个特征值 (其中可能有相等的), 通常记为 λ1, λ2, . . . , λn. • 所有特征值组成的集合称为矩阵的谱, 通常记为 σ(A), 即 σ(A) ≜ { λ1, λ2, . . . , λn }. • 特征值有代数重数 (所对应的特征多项式零点的重数) 和几何重数 (所对应的特征空间的 维数), 几何重数不超过代数重数. • 相似变换不改变矩阵的特征值. • 合同变换不改变矩阵的惯性指数 (即正特征值、负特征值和零特征值的个数). 思考:设 A ∈ R n×n , 则 A ⊺ 与 A 的特征值和特征向量是什么关系? 设 A 非奇异, 则 A−1 与 A 的特征值和特征向量是什么关系? 更一般地, 设 p(t) 是一个多项式, 则 p(A) 与 A 的特征值和特征向量是什么关系? 定义 1.9 (谱半径) 设 A ∈ R n×n 或 C n×n , 其谱半径定义如下: ρ(A) ≜ max λ∈σ(A) |λ|, 其中 σ(A) 表示 A 的谱. 下面给出特征值的一些常用性质. 定理 1.15 设 A ∈ R n×n , 则有 λ1λ2 · · · λn = det(A), λ1 + λ2 + · · · + λn = tr(A), 其中 det(A) 表示 A 的行列式, tr(A) 表示 A 的迹 (对角线元素之和), 即 tr(A) ≜ a11 + a22 + · · · + ann. (留作课外自习, 高次多项式的韦达定理) 推论 1.16 若 A 与 B 相似, 则 tr(A) = tr(B), 即相似矩阵具有相同的迹. 定义 1.10 设 A ∈ R n×n . 若存在一个非奇异矩阵 X ∈ C n×n , 使得 X−1AX = Λ, (1.1) 其中 Λ ∈ C n×n 是对角矩阵, 则称 A 是可对角化的, 矩阵 Λ 的对角线元素即为 A 的特征值, 分解 (1.1) 称为矩阵 A 的特征值分解或谱分解. http://math.ecnu.edu.cn/~jypan
14 第一讲线性代数基础 凸并非所有矩阵都可以对角化,比如A= 0是无法对角化的 00 定理1.17设A∈RnXn,则 (①)A可对角化当且仅当A有n个线性无关的特征向量: (2)A可对角化当且仅当A的所有特征值的代数重数与几何重数都相等 (3)若A有n个互不相等的特征值,则A可对角化 例1.11设A∈Rmxn是对称矩阵,则A可对角化,而且可以正交对角化,即存在正交矩阵Q∈ Rnxn使得 A=QAQT. 白酉矩阵与正交矩阵:设Q∈Cmxm,若QQ=1,即所有列向量都是单位向量,且相互正交, 则称Q为西阵.如果Q是实矩阵,则称为正交阵 根据多项式零点关于多项式系数的连续性,我们可以得到下面的结论。 定理118矩阵的特征值关于矩阵元素是连续的,即当矩阵的元素发生变化时,其特征值的变化 是连续的 1.2.3特征值的粗略估计 矩阵特征值在科学与工程计算中应用非常广泛,但直接计算特征值通常比较困难,特别是当 矩阵规模非常大时.本小节给出两个估计特征值所在范围的方法.我们这里假定A是复矩阵. Bendixson估计方法 设A∈Cmx,我们记 H(A+A),5会(A-A). 易知A=H+5,且 H*=H.S*=-S. 即H是Hermite的,S是Skcw-Hermite(斜Hermite)的.我们分别称H和S为A的Hermite部分 和Skcw-Hermite部分. 设(,)是A的一个特征对,且x*x=1,则 Ax=Ax→入=xAr=xHx+xSx 其中xHx是实数,xSr是纯虚数 http://math.ecnu.edu.cn/-jypan
仅供课堂教学使用,请勿外传 · 14 · 第一讲 线性代数基础 b 并非所有矩阵都可以对角化, 比如 A = " 0 1 0 0# 是无法对角化的. 定理 1.17 设 A ∈ R n×n , 则 (1) A 可对角化当且仅当 A 有 n 个线性无关的特征向量; (2) A 可对角化当且仅当 A 的所有特征值的代数重数与几何重数都相等; (3) 若 A 有 n 个互不相等的特征值, 则 A 可对角化. 例 1.11 设 A ∈ R n×n 是对称矩阵, 则 A 可对角化, 而且可以正交对角化, 即存在正交矩阵 Q ∈ R n×n 使得 A = QΛQ ⊺ . b 酉矩阵与正交矩阵: 设 Q ∈ C n×n , 若 Q∗Q = I, 即所有列向量都是单位向量, 且相互正交, 则称 Q 为酉矩阵. 如果 Q 是实矩阵, 则称为正交矩阵. 根据多项式零点关于多项式系数的连续性, 我们可以得到下面的结论. 定理 1.18 矩阵的特征值关于矩阵元素是连续的, 即当矩阵的元素发生变化时, 其特征值的变化 是连续的. 1.2.3 特征值的粗略估计 矩阵特征值在科学与工程计算中应用非常广泛, 但直接计算特征值通常比较困难, 特别是当 矩阵规模非常大时. 本小节给出两个估计特征值所在范围的方法. 我们这里假定 A 是复矩阵. Bendixson 估计方法 设 A ∈ C n×n , 我们记 H ≜ 1 2 (A + A ∗ ), S ≜ 1 2 (A − A ∗ ). 易知 A = H + S, 且 H∗ = H, S∗ = −S, 即 H 是 Hermite 的, S 是 Skew-Hermite (斜 Hermite) 的. 我们分别称 H 和 S 为 A 的 Hermite 部分 和 Skew-Hermite 部分. 设 (λ, x) 是 A 的一个特征对, 且 x ∗x = 1, 则 Ax = λx =⇒ λ = x ∗Ax = x ∗Hx + x ∗Sx, 其中 x ∗Hx 是实数, x ∗Sx 是纯虚数. http://math.ecnu.edu.cn/~jypan
1.2矩阵与投影 .15 定理1.I9(Bendixson定理设A∈Cxn,则 Xmin(H)≤Rc(A(A)≤入max(H), Xmin(-iS)≤Im(a(A)≤Xa(-iS), 其中R(和Im(分别表示实部和虚部,i是虚部单位. 这个定理告诉我们,一个矩阵的特征值的实部的取值范围由其Hermite部分确定,而虚部则 由其Skew-Hermite部分确定, Gerschgorin圆盘估计方法 设A=a]∈Cmxm,定义集合 (1.2) j=l≠ 我们称D,为A的Gerschgorin圆盘(他称盖尔圆盘). 定理1.20(Gerschgorin圆盘定理设A∈Cxm,则A的所有特征值都包含在A的Gerschgorin 回盘的并集中,即a(A)CUD. (板书 将A的非对角线元素换成r,其中0≤r≤1,并利用特征值关于矩阵元素的连续性,我们 就可以得到下面的结论. 定理121设AeCm×”,如采UD:可分解成两个不相交的子集S和T,即 9D=5UT且snT=0, 并假定S由k个圆盘组成,而T由其它n一k个圆盘组成,则S中恰好包含A的k个特征值(重 特征值按重数计算),而T中则包含A的其它n一k个特征值 1.2.4不变子空问 定义1.11设A∈Rmxm,子空问SCR,若ASS,即对任意x∈S,都有A∈S,则称S为A 的一个不变子空问. 类特殊的不变子空间就是由特征向量所张成的子空间。 定理122设1,2,,m是A的一组线性无关的特征向量,则pa,2,,m}是A的 一个m维不变子空间. 下面的结论对矩阵特征值计算非常重要 http://math.ecnu.edu.cn/-jypan
仅供课堂教学使用,请勿外传 1.2 矩阵与投影 · 15 · 定理 1.19 (Bendixson 定理) 设 A ∈ C n×n , 则 λmin(H) ≤ Re(λ(A)) ≤ λmax(H), λmin(−i S) ≤ Im(λ(A)) ≤ λmax(−i S), 其中 Re(·) 和 Im(·) 分别表示实部和虚部, i 是虚部单位. 这个定理告诉我们, 一个矩阵的特征值的实部的取值范围由其 Hermite 部分确定, 而虚部则 由其 Skew-Hermite 部分确定. Gerschgorin 圆盘估计方法 设 A = [aij ] ∈ C n×n , 定义集合 Di ≜ z ∈ C : |z − aii| ≤ Xn j=1,j̸=i |aij | , i = 1, 2, . . . , n. (1.2) 我们称 Di 为 A 的 Gerschgorin 圆盘 (也称盖尔圆盘). 定理 1.20 (Gerschgorin 圆盘定理) 设 A ∈ C n×n , 则 A 的所有特征值都包含在 A 的 Gerschgorin 圆盘的并集中, 即 σ(A) ⊂ Sn i=1 Di . (板书) 将 A 的非对角线元素换成 τ aij , 其中 0 ≤ τ ≤ 1, 并利用特征值关于矩阵元素的连续性, 我们 就可以得到下面的结论. 定理 1.21 设 A ∈ C n×n , 如果 Sn i=1 Di 可分解成两个不相交的子集 S 和 T, 即 Sn i=1 Di = S S T 且 S T T = ∅, 并假定 S 由 k 个圆盘组成, 而 T 由其它 n − k 个圆盘组成, 则 S 中恰好包含 A 的 k 个特征值 (重 特征值按重数计算), 而 T 中则包含 A 的其它 n − k 个特征值. 1.2.4 不变子空间 定义 1.11 设 A ∈ R n×n , 子空间 S ⊆ R n . 若 AS ⊆ S, 即对任意 x ∈ S, 都有 Ax ∈ S, 则称 S 为 A 的一个不变子空间. 一类特殊的不变子空间就是由特征向量所张成的子空间. 定理 1.22 设 x1, x2, . . . , xm 是 A 的一组线性无关的特征向量, 则 span{x1, x2, . . . , xm} 是 A 的 一个 m 维不变子空间. 下面的结论对矩阵特征值计算非常重要. http://math.ecnu.edu.cn/~jypan