第二章矩阵运算 与线性方程组一样,矩阵的概念也具有悠久的历史,如河图、洛书、幻方、拉丁方等.矩阵作为 现代数学的研究对象,则是在行列式的研究发展起来之后.许多与矩阵有关的性质已经在行列式的 研究中被发现,此时引入矩阵的概念变得水到渠成.1801年,Gass叫把线性变换的所有系数当作 一个整体使用,并用一个字母表示.l844年,Eisenstein冈讨论了线性变换(矩阵)的乘积,并强调 了乘积的不可交换性.1850年,Sylvester周首先使用了“矩阵”一词.从1858年开始,Cayley川发 表了一系列关于矩阵的论文,系统地阐述了矩阵的运算及其性质.因此,Cyly被公认是矩阵论的 莫基人 S2.1基本概念 一个m行n列的表格 /a1a12 021022 02n A= aml am2…amn/ 称为m×n矩阵,简记A=(a,)mxm,其中a,称为A的第i行列元素,或者A的(6,)位置 元素.有序整数对(m,n)称为A的维数或阶数.当m=n时,A称为m阶方阵.当mm=0时, A称为空矩阵. 设A的元素都属于某个集合5.A称为S上的矩阵例如,当S=C,R,Q,时,A称为 复数矩阵、实数矩阵、有理数矩阵、整数矩阵.S上的所有m×n矩阵的集合记作Sm×.矩阵 A∈Sm×n还可以看作是从集合{1,2,·,m}×{1,2,…,n}到S的映射:(,)→a a:称为A的对角元素。A的所有对角元素之和称为A的迹,记作r(.当i<了时,a称 为A的上三角元素。当i>方时,,称为A的下三角元素。下三角元素都是0的矩阵称为上三角 矩阵.上三角元素都是0的矩阵称为下三角矩阵。上三角矩阵和下三角矩阵统称为三角矩阵. 元素都是0的矩阵称为零矩阵,记作O.通常也把空矩阵视为零矩阵。非对角元素都是0 的矩阵称为对角矩阵.以a1,2,·,an为对角元素的n阶对角方阵常记作diag(@1,a2,·,an): diag(a,a,·,a)称为纯量方阵.diag(1,1,·,1)称为单位方阵,记作I.(,)位置元素为1,其它 元素为0的矩阵称为基础矩阵,记作E C- 数学 15
第二章 矩阵运算 与线性方程组一样,矩阵的概念也具有悠久的历史,如河图、洛书、幻方、拉丁方等.矩阵作为 现代数学的研究对象,则是在行列式的研究发展起来之后.许多与矩阵有关的性质已经在行列式的 研究中被发现,此时引入矩阵的概念变得水到渠成.1801 年,Gauss[1]把线性变换的所有系数当作 一个整体使用,并用一个字母表示.1844 年,Eisenstein[2]讨论了线性变换(矩阵)的乘积,并强调 了乘积的不可交换性.1850 年,Sylvester[3] 首先使用了“矩阵”一词.从 1858 年开始,Cayley[4]发 表了一系列关于矩阵的论文,系统地阐述了矩阵的运算及其性质.因此,Cayley 被公认是矩阵论的 奠基人. §2.1 基本概念 一个 m 行 n 列的表格 A = a11 a12 · · · a1n a21 a22 · · · a2n . . . . . . · · · . . . am1 am2 · · · amn 称为 m × n 矩阵,简记 A = (aij )m×n,其中 aij 称为 A 的第 i 行 j 列元素,或者 A 的 (i, j) 位置 元素.有序整数对 (m, n) 称为 A 的维数或阶数.当 m = n 时,A 称为 n 阶方阵.当 mn = 0 时, A 称为空矩阵. 设 A 的元素都属于某个集合 S.A 称为 S 上的矩阵.例如,当 S = C, R, Q, Z 时,A 称为 复数矩阵、实数矩阵、有理数矩阵、整数矩阵.S 上的所有 m × n 矩阵的集合记作 S m×n.矩阵 A ∈ S m×n 还可以看作是从集合 {1, 2, · · · , m} × {1, 2, · · · , n} 到 S 的映射:(i, j) 7→ aij. aii 称为 A 的对角元素.A 的所有对角元素之和称为 A 的迹,记作 tr(A).当 i < j 时,aij 称 为 A 的上三角元素.当 i > j 时,aij 称为 A 的下三角元素.下三角元素都是 0 的矩阵称为上三角 矩阵.上三角元素都是 0 的矩阵称为下三角矩阵.上三角矩阵和下三角矩阵统称为三角矩阵. 元素都是 0 的矩阵称为零矩阵,记作 O.通常也把空矩阵视为零矩阵.非对角元素都是 0 的矩阵称为对角矩阵.以 a1, a2, · · · , an 为对角元素的 n 阶对角方阵常记作 diag(a1, a2, · · · , an). diag(a, a, · · · , a) 称为纯量方阵.diag(1, 1, · · · , 1) 称为单位方阵,记作 I.(i, j) 位置元素为 1,其它 元素为 0 的矩阵称为基础矩阵,记作 Eij. [1]Johann Carl Friedrich Gauss,1777–1855,德国数学家,近代数学奠基人之一. [2]Ferdinand Gotthold Max Eisenstein,1823–1852,德国数学家. [3]James Joseph Sylvester,1814–1897,英国数学家. [4]Arthur Cayley,1821–1895,英国数学家. 15
16 第二章矩阵运算 满足每个b,=a的矩阵B=(b,)nxm称为A=(a,)mxm的转置,记作B=AP.满足 AT=A的矩阵A称为对称方阵.满足AT :一A的矩阵A称为反对称方阵。当A是复数矩阵时, 矩阵B=(O丽)mx称为A的共轭,记作B=不.矩阵不称为A的共轭转置,常记作A巴.若 AH=A,则A称为Hermitel方阵.若AH=-A,则A称为反Hermite方阵. 矩阵A可以看作是m个元素排成的m行n列的表格,也可以看作是m个行向量排成一列, 又或者是n个列向量排成一行 =(B…Bn 其中行向量a1=(a1,a2,…,an),列向量B=(a1,2,·,am)T.矩阵概念可以看作是向量概 念的推广,向量可以看作是矩阵的特殊形式.行向量是1×n的矩阵,列向量是m×1的矩阵.向 量的运算可以推广到矩阵的运算. 定义2.1.设F是数域,A=(a)emxm,B=(6)EPmxn,入eF,定义 1.A与B的加法运算A+B=(a+b)∈mx. 2.A与B的减法运算A-B=(a-b,)∈mxm 3.入与A的数乘运算入M=(a)∈Fmxn. 4.1A1+2A2+…+kAk称为矩阵的线性组合运算,其中每个A∈Fm×m,入∈F. 定理21.矩阵的加法和数来运算具有与定理1.4类似的性质,并且对于任意A,B∈mxm,入e, (A+B)T=AT+BT,(A)T=AAT. 例21.设映射∫=(1,2,…,∫m):m→m,其中每个方是n元齐次线性函数, f(r1,x2,,En)=a1r1十a2E2十十anEn,i=1,2,,m ∫称为线性映射.A=(a)m×m与∫一一对应.A称为∫的矩阵表示 例2.2.设A和B分别是n→Fm的线性映射∫=(,2,Jnm)和g=(91,2,,9m)的 矩阵表示,入∈,则f+g=(+g1,2+g2,…,fm+gm)和J=(i,入2,…,入jm)也是 Fm→Fm的线性映射,并且A+B是∫+9的矩阵表示,入A是的矩阵表示. 例2.3.设∫=(伍,2,…,m)是”→Fm的线性映射 f(c1,x2,…,n)=a11+a22+…+ann,i=1,2,,m g=(g1,2,…,9n)是Fp→Fm的线性映射, g(c1,x2,…,n)=b1x1+b22+…+bpxp,i=l,2,…,n
16 第二章 矩阵运算 满足每个 bij = aji 的矩阵 B = (bij )n×m 称为 A = (aij )m×n 的转置,记作 B = AT.满足 AT = A 的矩阵 A 称为对称方阵.满足 AT = −A 的矩阵 A 称为反对称方阵.当 A 是复数矩阵时, 矩阵 B = (aij )m×n 称为 A 的共轭,记作 B = A.矩阵 AT 称为 A 的共轭转置,常记作 AH.若 AH = A,则 A 称为 Hermite[5]方阵.若 AH = −A,则 A 称为反 Hermite 方阵. 矩阵 A 可以看作是 mn 个元素排成的 m 行 n 列的表格,也可以看作是 m 个行向量排成一列, 又或者是 n 个列向量排成一行. A = α1 α2 . . . αm = β1 β2 · · · βn 其中行向量 αi = (ai1, ai2, · · · , ain),列向量 βj = (a1j , a2j , · · · , amj ) T.矩阵概念可以看作是向量概 念的推广,向量可以看作是矩阵的特殊形式.行向量是 1 × n 的矩阵,列向量是 m × 1 的矩阵.向 量的运算可以推广到矩阵的运算. 定义 2.1. 设 F 是数域,A = (aij ) ∈ F m×n,B = (bij ) ∈ F m×n,λ ∈ F,定义 1. A 与 B 的加法运算 A + B = aij + bij ∈ F m×n. 2. A 与 B 的减法运算 A − B = aij − bij ∈ F m×n. 3. λ 与 A 的数乘运算 λA = λaij ∈ F m×n. 4. λ1A1 + λ2A2 + · · · + λkAk 称为矩阵的线性组合运算,其中每个 Ai ∈ F m×n,λi ∈ F. 定理 2.1. 矩阵的加法和数乘运算具有与定理 1.4 类似的性质,并且对于任意 A, B ∈ F m×n,λ ∈ F, (A + B) T = A T + B T , (λA) T = λAT . 例 2.1. 设映射 f = (f1, f2, · · · , fm) : F n → F m,其中每个 fi 是 n 元齐次线性函数, fi(x1, x2, · · · , xn) = ai1x1 + ai2x2 + · · · + ainxn, i = 1, 2, · · · , m. f 称为线性映射.A = (aij )m×n 与 f 一一对应.A 称为 f 的矩阵表示. 例 2.2. 设 A 和 B 分别是 F n → F m 的线性映射 f = (f1, f2, · · · , fm) 和 g = (g1, g2, · · · , gm) 的 矩阵表示,λ ∈ F,则 f + g = (f1 + g1, f2 + g2, · · · , fm + gm) 和 λf = (λf1, λf2, · · · , λfm) 也是 F n → F m 的线性映射,并且 A + B 是 f + g 的矩阵表示,λA 是 λf 的矩阵表示. 例 2.3. 设 f = (f1, f2, · · · , fm) 是 F n → F m 的线性映射, fi(x1, x2, · · · , xn) = ai1x1 + ai2x2 + · · · + ainxn, i = 1, 2, · · · , m, g = (g1, g2, · · · , gn) 是 F p → F n 的线性映射, gi(x1, x2, · · · , xp) = bi1x1 + bi2x2 + · · · + bipxp, i = 1, 2, · · · , n, [5]Charles Hermite,1822–1901,法国数学家.
S2.1基本概念 17 则h=(h,h2,…,hm)=fog是F即→Fm的线性映射,其中 aw=宫aa…w=宫-套-2官与 设A=(a)mxm,B=(,nxp,C=(Gmxp分别是手g,h的矩阵表示,则有 -2a咖i (2.1) 定义2.2.上式(2.1)定义的矩阵C称为A与B的乘积,记作C=AB. 设A的行向量分别为a1,2,…,am,B的列向量分别为,,…,,则C=AB也可以 看作是由cg=a4·(n维向量的数量积运算)排成的矩阵. .81 a1,B2.. 02 ,B=(…)→AB= 202B2 am3am·32…am·3 并非任意两个矩阵A,B都可以作乘法运算AB.只有当A的列数与B的行数相等时,运算 AB才有意义.AB有意义也不能保证BA有意义.矩阵的乘法运算不满足交换律.为了避免歧义, 有时称AB为“A右乘上B”或“B左乘上A”, 例25.利用矩阵的乘法运算,可以很简明地表示数学式. ·线性方程组(1.)可写成Ax=b. ·例2.1中的线性映射∫可写成f(x)=Ax. ·例2.2表明Ax+Bx=(A+B)x,AAz)=(AA)z. ·例2.3表明A(Bx)=(AB)x.换而言之,∫og的矩阵表示是AB,线性映射的复合与它们的 矩阵表示的乘积一一对应. 例2.6。许多数学问题可以通过矩阵转化为线性代数问题.在许多实际问题中,矩阵也同样有者重 要的作用。 ·(几何变换)2中向量逆时针旋转0的旋转变换可以表示为矩阵乘积的形式 Θ-(。)Θ R2上的仿射变换(,)→(a1x+b1y+c1,a2+by+)可以表示为 Θ-(色)日(日
§2.1 基本概念 17 则 h = (h1, h2, · · · , hm) = f ◦ g 是 F p → F m 的线性映射,其中 hi(x1, x2, · · · , xp) = Xn k=1 aikgk(x1, x2, · · · , xp) = Xn k=1 aikXp j=1 bkjxj = Xp j=1 Xn k=1 aikbkj! xj . 设 A = (aij )m×n,B = (bij )n×p,C = (cij )m×p 分别是 f, g, h 的矩阵表示,则有 cij = Xn k=1 aikbkj , ∀i, j. (2.1) 定义 2.2. 上式 (2.1) 定义的矩阵 C 称为 A 与 B 的乘积,记作 C = AB. 设 A 的行向量分别为 α1, α2, · · · , αm,B 的列向量分别为 β1, β2, · · · , βp,则 C = AB 也可以 看作是由 cij = αi · βj(n 维向量的数量积运算)排成的矩阵. A = α1 α2 . . . αm , B = β1 β2 · · · βp ⇒ AB = α1 · β1 α1 · β2 · · · α1 · βp α2 · β1 α2 · β2 · · · α2 · βp . . . . . . · · · . . . αm · β1 αm · β2 · · · αm · βp . 例 2.4. 设 A = 1 0 0 0! ,B = 0 1 0 0! ,则有 AB = B,BA = O. 并非任意两个矩阵 A, B 都可以作乘法运算 AB.只有当 A 的列数与 B 的行数相等时,运算 AB 才有意义.AB 有意义也不能保证 BA 有意义.矩阵的乘法运算不满足交换律.为了避免歧义, 有时称 AB 为“A 右乘上 B”或“B 左乘上 A”. 例 2.5. 利用矩阵的乘法运算,可以很简明地表示数学式. • 线性方程组 (1.1) 可写成 Ax = b. • 例 2.1 中的线性映射 f 可写成 f(x) = Ax. • 例 2.2 表明 Ax + Bx = (A + B)x,λ(Ax) = (λA)x. • 例 2.3 表明 A(Bx) = (AB)x.换而言之,f ◦ g 的矩阵表示是 AB,线性映射的复合与它们的 矩阵表示的乘积一一对应. 例 2.6. 许多数学问题可以通过矩阵转化为线性代数问题.在许多实际问题中,矩阵也同样有着重 要的作用. • (几何变换) R 2 中向量逆时针旋转 θ 的旋转变换可以表示为矩阵乘积的形式 x y ! 7→ cos θ − sin θ sin θ cos θ ! x y ! . R 2 上的仿射变换 (x, y) 7→ (a1x + b1y + c1, a2x + b2y + c2) 可以表示为 x y ! 7→ a1 b1 a2 b2 ! x y ! + c1 c2 ! 或 x y 1 7→ a1 b1 c1 a2 b2 c2 0 0 1 x y 1
18 第二章矩阵运算 ·(二次方程)2上二次曲线的一般方程 a11x2+2a12xy+a22/2+2b1x+2b2y+c=0 可以表示为矩阵乘积形式 类似地,R3上二次曲面的一般方程 a1x2+a222+agg22+212y+2a13x+2a23y2+2b1x+2b2y+2h2+c=0 也可以表示为矩阵乘积形式 a11a12a13b f(z+w)=f(z)+f(w),f(zw)=f(z)f(w),Vz,wEC. 因此,C可以看作是R2×2的子集,复数的加、减、乘法运算对应矩阵的加、减、乘法运算。 类似地,考虑四元数体阿 K={ao+ai+azj+aak ao,a1,a2,a3 ER} 其中,方k是K的生成元,满足 2=子=2=-1,=-i=k,k=-k=ik=-k=方 设映射 容易验证,9是单射并且满足 g(a+b)=g(a)+g(b).g(ab)=g(a)g(b).Ya.bEK. (2.2) 因此,K可以看作是C2×2的子集,四元数的加、减、乘法运算对应矩阵的加、减、乘法运算 同理,我们可以构造单射9:K→R4x4满足(2.2),把K看作是Rx4的子集
18 第二章 矩阵运算 • (二次方程) R 2 上二次曲线的一般方程 a11x 2 + 2a12xy + a22y 2 + 2b1x + 2b2y + c = 0 可以表示为矩阵乘积形式 x y 1 a11 a12 b1 a12 a22 b2 b1 b2 c x y 1 = 0. 类似地,R 3 上二次曲面的一般方程 a11x 2 + a22y 2 + a33z 2 + 2a12xy + 2a13xz + 2a23yz + 2b1x + 2b2y + 2b3z + c = 0 也可以表示为矩阵乘积形式 x y z 1 a11 a12 a13 b1 a12 a22 a23 b2 a13 a23 a33 b3 b1 b2 b3 c x y z 1 = 0. • (数系的扩充) 设映射 f : C → R 2×2,a + b i 7→ a b −b a! .容易验证,f 是单射并且满足 f(z + w) = f(z) + f(w), f(zw) = f(z)f(w), ∀z, w ∈ C. 因此,C 可以看作是 R 2×2 的子集,复数的加、减、乘法运算对应矩阵的加、减、乘法运算. 类似地,考虑四元数体[6] K = {a0 + a1i + a2j + a3k | a0, a1, a2, a3 ∈ R} 其中 i, j, k 是 K 的生成元,满足 i 2 = j 2 = k 2 = −1, ij = −ji = k, jk = −kj = i, ki = −ik = j. 设映射 g : K → C 2×2 , a0 + a1i + a2j + a3k 7→ a0 + a1i a2 + a3i −a2 + a3i a0 − a1i ! . 容易验证,g 是单射并且满足 g(a + b) = g(a) + g(b), g(ab) = g(a)g(b), ∀a, b ∈ K. (2.2) 因此,K 可以看作是 C 2×2 的子集,四元数的加、减、乘法运算对应矩阵的加、减、乘法运算. 同理,我们可以构造单射 g : K → R 4×4 满足 (2.2),把 K 看作是 R 4×4 的子集. [6]William Rowan Hamilton 于 1843 年发明了四元数的概念.
S2.1基本概念 19 ·(计算机图像)在计算机系统中,一幅分辨率为w×的黑白图片通常可以用一个h×w的实 数矩阵A=(a)表示,其中w和h分别是图片的宽度和高度,a是第i行犭列的像素点 的灰度。 一幅彩色图片则可以用三个矩阵G,B表示,分别对应红、绿、蓝三色的分量图 像处理的过程就是矩阵运算的过程。 。(投入产出模型)假设共有m种产品和n种原料。生产单位数量的产品需要消耗原料 的数量为,则m×n矩阵A=(a,)称为消耗系数矩阵假设需要生产出数量分别为 工1,2,…,工m的m种产品,则所需要投入的n种原料的数量h,欢,·,满足 (…)=( ·(图的矩阵表示)如下的图形G由6个点,2,…,%和6条线段e1,e2,…,6构成 通常记G=(心E),V={,2,,6}称为G的顶点集,{e1,e2,,6}称为G的边集 我们可以用一个6阶方阵A=(a与)来表示G,其中a= 1,与有线段相连: (0,与书没有线段相连 我们也可以用一个6阶方阵B=()来表示G,其中= 1,是e的端点; 0,号,不是的端点 /0100001 /110000 101100 011000 A= 010010 010100 010010 B= 001010 001101 000110 000010/ 000011 A称为G的邻接矩阵,B称为G的关联矩阵.它们之间具有联系 BTB=D+A,D=diag(di,d2....,do) 其中每个d是A的第方行(列)元素之和,也是B的第方列元素之和.D称为G的度矩阵 感兴趣的读者可参阅文献10组合矩阵论,了解关于图和矩阵的更多知识. ·(有限射影平面)设V={,,…,n,V中的元素称为点:E={e1,e2,…,em}由V的某 些子集构成,E中的元素称为线.当满足下列条件时,集合对T=(V,E)称为有限射影平面: ()对于任意两线e,∫∈E,存在唯一的点∈V,使得v∈e且v∈f:
§2.1 基本概念 19 • (计算机图像) 在计算机系统中,一幅分辨率为 w × h 的黑白图片通常可以用一个 h × w 的实 数矩阵 A = (aij ) 表示,其中 w 和 h 分别是图片的宽度和高度,aij 是第 i 行 j 列的像素点 的灰度.一幅彩色图片则可以用三个矩阵 R, G, B 表示,分别对应红、绿、蓝三色的分量.图 像处理的过程就是矩阵运算的过程. • (投入产出模型) 假设共有 m 种产品和 n 种原料,生产单位数量的产品 i 需要消耗原料 j 的数量为 aij,则 m × n 矩阵 A = (aij ) 称为消耗系数矩阵.假设需要生产出数量分别为 x1, x2, · · · , xm 的 m 种产品,则所需要投入的 n 种原料的数量 y1, y2, · · · , yn 满足 y1 y2 · · · yn = x1 x2 · · · xm a11 a12 · · · a1n a21 a22 · · · a2n . . . . . . · · · . . . am1 am2 · · · amn 即 y = xA. • (图的矩阵表示) 如下的图形 G 由 6 个点 v1, v2, · · · , v6 和 6 条线段 e1, e2, · · · , e6 构成. v1 v2 v3 v4 v5 v6 e1 e2 e3 e4 e5 e6 通常记 G = (V, E),V = {v1, v2, · · · , v6} 称为 G 的顶点集,{e1, e2, · · · , e6} 称为 G 的边集. 我们可以用一个 6 阶方阵 A = (aij ) 来表示 G,其中 aij = 1, vi 与 vj 有线段相连; 0, vi 与 vj 没有线段相连. 我们也可以用一个 6 阶方阵 B = (bij ) 来表示 G,其中 bij = 1, vj 是 ei 的端点; 0, vj 不是 ei 的端点. A = 0 1 0 0 0 0 1 0 1 1 0 0 0 1 0 0 1 0 0 1 0 0 1 0 0 0 1 1 0 1 0 0 0 0 1 0 , B = 1 1 0 0 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 0 1 0 1 0 0 0 0 1 1 0 0 0 0 0 1 1 . A 称为 G 的邻接矩阵,B 称为 G 的关联矩阵.它们之间具有联系 B TB = D + A, D = diag(d1, d2, · · · , d6) 其中每个 dj 是 A 的第 j 行 (列) 元素之和,也是 B 的第 j 列元素之和.D 称为 G 的度矩阵. 感兴趣的读者可参阅文献 [10] 组合矩阵论,了解关于图和矩阵的更多知识. • (有限射影平面) 设 V = {v1, v2, · · · , vn},V 中的元素称为点;E = {e1, e2, · · · , em} 由 V 的某 些子集构成,E 中的元素称为线.当满足下列条件时,集合对 π = (V, E) 称为有限射影平面: (i) 对于任意两线 e, f ∈ E,存在唯一的点 v ∈ V ,使得 v ∈ e 且 v ∈ f;