2 内积空间 第一章所讲的线性空间,其基本运算是向量的加法及向量与数域中的数的数量乘法,并 没有考虑向量的长度、向量之间的夹角等度量性质由于各种需要,有必要在线性空间中引 入内积概念,使得在这样的空间里可以处理这些度量性质的问题,深化对线性空间、线性变 换的研究 2.1内积空间的概念 定义2-1设V是实数域R上的线性空间如果对V中任意两个向量a,B都有一个 实数(记为(Q,)与它们相对应,并且满足下列各个条件,则实数(a,)称为向量a,B的 内积: (1)(a,B)=(B,a); (2)(ka,B)=k(a,B),(k∈R): (3)(a+B,Y)=(a,Y)+(B,Y),(ye); (4)(a,a)≥0,当且仅当a=0,等号成立, 而线性空间V则称为实内积空间,简称内积空间 几何空间向量的内积(亦称为数量积)显然适合定义2-1中列举的所有性质,故几何空 间向量的全体关于向量加法及数与向量的乘法,就构成一个内积空间 例2-1若对n维线性空间R”中的任两向量 X=(x,.,x),y=(,.,), 定义内积为 (X,Y)=∑x, 则容易验证它满足内积定义的条件,从而R”成为一个内积空间,我们仍用R”来表示它, 内积空间R”称为欧几里得(Euclid)空间,简称为欧氏空间稍后就知道,所有n维(实) 内积空间都与R”同构,因此把有限维(实)内积空间都称为欧氏空间本书所讲的空间主要 是指有限维空间,虽然无论在线性空间的定义中,或在实内积空间的定义中,都没有规定空 间的维数是有限的,甚至在讨论一些简单性质时也无此规定,但是在本书或一般的线性代数 及矩阵论的书中,主要的、绝大部分的内容都是对有限维空间来说的 例2-2考虑n维线性空间Rx”如果对任何A,B∈R"”,定义 (A,B)=a, 则容易验证(A,B)满足内积定义的各个条件,从而Rx“构成一内积空间 例2-3R[a,b]定义(f(x),g(x)=∫f(x)g(x)dx,则可以验证(f八x),g(x)
2 内 积 空 间 第一章所讲的线性空间,其基本运算是向量的加法及向量与数域中的数的数量乘法, 并 没有考虑向量的长度、向量之间的夹角等度量性质 .由于各种需要, 有必要在线性空间中引 入内积概念,使得在这样的空间里可以处理这些度量性质的问题,深化对线性空间、线性变 换的研究 . 2 .1 内积空间的概念 定义 2 1 设 V 是实数域 R 上的线性空间 .如果对 V 中任意两个向量α,β都有一个 实数 (记为(α,β) ) 与它们相对应, 并且满足下列各个条件, 则实数 ( α,β) 称为向量 α,β的 内积: (1 ) (α,β) = (β,α) ; (2 ) ( kα,β) = k (α,β) , ( k∈R) ; (3 ) (α+ β,γ) = (α,γ) + (β,γ) , (γ∈ V ) ; (4 ) (α,α)≥0, 当且仅当 α= 0, 等号成立, 而线性空间 V 则称为实内积空间, 简称内积空间 . 几何空间向量的内积(亦称为数量积) 显然适合定义 2 1 中列举的所有性质,故几何空 间向量的全体关于向量加法及数与向量的乘法,就构成一个内积空间 . 例 2 1 若对 n 维线性空间R n 中的任两向量 X = ( x1 , x2 , ., x n ) , Y = ( y1 , y2 , ., yn ) , 定义内积为 ( X, Y ) = ∑ n i = 1 xi yi , 则容易验证它满足内积定义的条件,从而R n 成为一个内积空间,我们仍用R n 来表示它 . 内积空间R n 称为欧几里得( Euclid) 空间,简称为欧氏空间 .稍后就知道, 所有 n 维( 实) 内积空间都与R n 同构, 因此把有限维(实) 内积空间都称为欧氏空间 .本书所讲的空间主要 是指有限维空间,虽然无论在线性空间的定义中, 或在实内积空间的定义中, 都没有规定空 间的维数是有限的,甚至在讨论一些简单性质时也无此规定, 但是在本书或一般的线性代数 及矩阵论的书中,主要的、绝大部分的内容都是对有限维空间来说的 . 例 2 2 考虑 n 2 维线性空间R n× n .如果对任何 A , B∈R n× n , 定义 ( A, B) = ∑ n i , j = 1 aij bij , 则容易验证( A, B)满足内积定义的各个条件, 从而R n× n 构成一内积空间 . 例 2 3 R[ a, b] 定义 ( f ( x ) , g ( x ) ) =∫ b a f ( x ) g( x ) d x , 则可以验证 ( f( x ) , g( x ) )
22 矩阵分析引论 满足内积的条件,从而R[a,b)]构成内积空间。 由定义可推得内积(α,B)具有下列基本性质: (I)(a,k)=k(a,B),(k∈R)月 (2)(a,B+Y)=(a,B)+(a,Y): (3)(a,0)=(0,)=0 其中(3)的证明如下: (a.0)=a.0B)=0(a.B)=0 有了内积概念,就可以在内积空间中引入向量的长度及向量之间的夹角等概念,下面先 来证明关于内积的一个重要不等式, 定理2-1设V是内积空间,a,B是V中任两向量,则有 (a,B)≤(a,a)(B,B), 等号当且仅当α,B线性相关时成立. 证明设1为一任意实数,则由内积定义的条件(4),得知内积 (a-tB,Q-tB)≥0. 也就是说,对任意实数1,有 (B,)t-2(a,B)1+(a,a)≥0 此不等式左边是个关于t的二次三项式,对任意实数1,它都取非负值,故其判别式 △=[-2(a,B)·4(B,)(a,a)≤0 由此便得 (a,)2≤(a,a)(B,B) 如果a,B线性相关,不妨设B=ka(k是实数)此时,有 (a,B)2=(a,ka)广=【k(a,a)=(a,a)(ka,k如)=(a,a)(B,B) 同样地,若ā=B,也可以证明 (a,)=(a,a)(B,B). 因此,当α,B线性相关时,定理中的不等式成为等式反过来,如果等式 (a,B)'=(a,a)(B,) 成立,则a,B必定线性相关事实上,若α,B线性无关,则对任何实数t,都有a·B≠0,从 而就有 (a-B,a·)>0 由定理前半部分的证明中可以看到,此时,前面提到的判别式△<0,从而导致 (a,B)2<(a,a)(B,B) 这与(a,)=(a,a)(,)矛盾,因而定理得证 定理2-1中的不等式,常称为柯西一许瓦兹(Cauchy-Schwarz)不等式,下面用到它时, 简单地称之为(C,-S)不等式 现在来定义向量的长度 定义2-2设a是内积空间V的任一向量,则非负实数(a,a)称为向量a的长度, 并记为|a|,亦即定义向量a的长度为 lal =(a,a)
满足内积的条件,从而R[ a, b] 构成内积空间 . 由定义可推得内积(α,β)具有下列基本性质: (1 ) (α, kβ) = k (α,β) , ( k∈R) ; (2 ) (α,β+ γ) = (α,β) + (α,γ) ; (3 ) (α, 0) = (0,β) = 0 . 其中(3 )的证明如下: (α, 0 ) = (α, 0β) = 0(α,β) = 0 . 有了内积概念,就可以在内积空间中引入向量的长度及向量之间的夹角等概念, 下面先 来证明关于内积的一个重要不等式 . 定理 2 1 设 V 是内积空间, α,β是 V 中任两向量,则有 (α,β) 2 ≤ (α,α) (β,β) , 等号当且仅当 α,β线性相关时成立 . 证明 设 t 为一任意实数,则由内积定义的条件 (4 ) ,得知内积 (α - tβ,α - tβ) ≥ 0 . 也就是说,对任意实数 t ,有 (β,β) t 2 - 2(α,β) t + (α, α) ≥ 0 . 此不等式左边是个关于 t 的二次三项式,对任意实数 t ,它都取非负值, 故其判别式 Δ = [ - 2(α,β) ] 2 - 4(β,β) (α,α) ≤ 0 . 由此便得 (α,β) 2 ≤ (α,α) (β,β) . 如果 α,β线性相关, 不妨设 β= kα( k 是实数) .此时,有 (α,β) 2 = (α, kα) 2 = [ k (α,α) ] 2 = (α,α) ( kα, kα) = (α,α) (β,β) . 同样地,若 α= lβ,也可以证明 (α,β) 2 = (α,α) (β,β) . 因此,当 α,β线性相关时,定理中的不等式成为等式 .反过来,如果等式 (α,β) 2 = (α,α) (β,β) 成立,则 α,β必定线性相关 .事实上, 若 α,β线性无关,则对任何实数 t ,都有 α - tβ≠0, 从 而就有 (α - tβ,α - tβ) > 0 . 由定理前半部分的证明中可以看到,此时, 前面提到的判别式Δ< 0 ,从而导致 (α,β) 2 < (α,α) (β,β) . 这与(α,β) 2 = (α,α) (β,β) )矛盾,因而定理得证 . 定理 2 1 中的不等式,常称为柯西—许瓦兹 (Cauchy-Schwarz )不等式 .下面用到它时, 简单地称之为(C . - S .)不等式 . 现在来定义向量的长度 . 定义 2 2 设 α是内积空间 V 的任一向量, 则非负实数 (α, α) 称为向量 α的长度, 并记为 α ,亦即定义向量 α的长度为 α = (α,α) . 22 矩阵分析引论
2内积空间 23 若|a=1,则称a为单位向量对于任一非零向量a,取B=a,则B是与a线性相 关的单位向量这种做法称为向量的单位化 由于向量的内积(a,B)是个实数,因此利用长度概念,(C,-S)不等式又可以表示为 l(a,)l≤|a|·I. 当a,B都不是零向量时,由此不等式可得 (a,B) 亦即 1品s1 因此,可以用等式 c0s中= I a.B)I a·Bl 来定义两个非零向量a,B的夹角中,且限制中的取值范围为0≤中≤Ⅱ当(a,)=0时,则 称a,B是正交的,记为a⊥B.由于(a,0)=0,所以认为零向量与任何向量正交. 例2-4若ā,B是两个正交向量,则有 la+82=a+8* 般地,如果a1,a2,.,at是k个两两正交的向量,则有 |a,+a2+.+a.=|a,2+|,2+.+|a.|2 这利用内积性质及正交条件是不难证明的,故留给读者作为练习 从定理2-1可以推出如下简单推论 推论对内积空间V的任两向量ā,B都有 (1)la+Bl≤lal+IBl;(2)la-Bl≥|al-IBl 证明因为 |a+B=(a+B,a+B)=(a,a)+2(a,B)+(B,B) ≤(a,a)+2a小|Bl+(B,B)=|aF+2la小.lBl+IBl =〔Ial+|l)2 由此即得a+B≤|a+|B又应用这一结果得到等式a=(a·B)+B,即得 lal=l(a-B)+Bl<la-Bl+I 8 因此得a-|B≤|a-B这就是(2)式 把定理2~1应用到欧氏空间R”和例23中R[a,b]得不等式 公≤E·名 fx)gx)dx≤∫f(x)dx.小g(x)dx 这是历史上两个著名的不等式
若 α = 1,则称 α为单位向量 .对于任一非零向量 α, 取 β= α α , 则 β是与α线性相 关的单位向量 .这种做法称为向量的单位化 . 由于向量的内积(α,β)是个实数,因此利用长度概念, (C . - S .)不等式又可以表示为: (α,β) ≤ α · β . 当 α,β都不是零向量时, 由此不等式可得 (α,β) α · β ≤ 1, 亦即 - 1 ≤ (α,β) α· β ≤ 1 . 因此,可以用等式 cosφ = (α,β) α· β 来定义两个非零向量 α,β的夹角φ, 且限制 φ的取值范围为 0≤φ≤π.当( α,β) = 0 时, 则 称 α,β是正交的, 记为 α⊥β.由于(α, 0 ) = 0, 所以认为零向量与任何向量正交 . 例 2 4 若 α,β是两个正交向量,则有 α+ β 2 = α 2 + β 2 . 一般地,如果 α1 ,α2 ,.,αk 是 k 个两两正交的向量, 则有 α1 + α2 + . + αk 2 = α1 2 + α2 2 + . + αk 2 . 这利用内积性质及正交条件是不难证明的,故留给读者作为练习 . 从定理 2 1 可以推出如下简单推论 . 推论 对内积空间 V 的任两向量α,β都有 (1 ) α+ β ≤ α + β ; (2 ) α- β ≥ α - β . 证明 因为 α+ β 2 = (α+ β,α+ β) = (α, α) + 2 (α,β) + (β,β) ≤ (α, α) + 2 α · β + (β,β) = α 2 + 2 α · β + β 2 = α + β 2 , 由此即得 α+ β ≤ α + β .又应用这一结果得到等式 α= (α- β) + β, 即得 α = (α - β) + β ≤ α - β + β . 因此得 α - β ≤ α- β .这就是( 2)式 . 把定理 2 1 应用到欧氏空间R n 和例 2 3 中R[ a, b]得不等式 ∑ n i = 1 xi yi ≤ ∑ n i = 1 x 2 i · ∑ n i = 1 y 2 i , ∫ b a f ( x ) g( x ) d x 2 ≤∫ b a f 2 ( x ) d x·∫ b a g 2 ( x ) d x . 这是历史上两个著名的不等式 . 2 内积空间 23
24 矩阵分析引论 22正交基及子空间的正交关系 由于在内积空间中有向量夹角的概念,因而在各种基中,可以选择一种特殊的、使用起 来很方便的基,称为正交集这种情况在普通的线性空间里是没有的“正交”概念的引入,使 得在内积空间中增加了不少在一般线性空间中所没有的、很有意义的性质 内积空间中两两正交的一组非零向量,称为正交组正交组是线性无关的事实上,若 4,4,“,am为一正交组,如果有 ka1+ka:+.+ka。=0, 则用a,与此向量等式两边作内积,注意到当≠j时均有(α,a,)=0,便可得到 k(a1,a,)=(a,0)=0. 因a,≠0,故(a,a)>0,因此有k=0(i=1,2,.,m),即a1,a2,.,a。线性无关 定义2~3在n维欧氏空间中,由正交组构成的基称为正交基:如果正交基中每个向 量的长度都等于单位长度,则此正交基便称为标准正交基(或称单位正交基): 简单地说,若a,a:,.,a,是n维欧氏空间V的一组非零向量,且满足条件 ∫1当i=j (a,a)={0当1≠j (ij=1,2,.,n), 则a,a2,.,a,即为一标准正交基。 定理2~2任一n维欧氏空间V都存在正交基. 证明设a,a:,a,为V的一个基,从这个基出发,去构作V的一个正交基,下面 是具体做法 首先可以取B=a,接若作向量 B2=a2+%a1, 其中,系数k可由正交条件(B,B)=0来确定,由于 (B,B)=(@:+kB,B)=(a2,B)+k(R,B)=0, 因此可得 骨:} 因B=a,与a,线性无关,所以B≠0,且以上求得的B,B是正交的类似地,令 B=d+ 则B必不为零向量再由正交条件(要求) (B,B)=0,(B,B)=0, 便可求得系数k2,k为 g}食剂 因而B便可确定,于是又得到正交组B,B,B,按此方法做下去,若已作出正交组 月,B2,.,B1, 则令
2 .2 正交基及子空间的正交关系 由于在内积空间中有向量夹角的概念, 因而在各种基中, 可以选择一种特殊的、使用起 来很方便的基,称为正交集 .这种情况在普通的线性空间里是没有的“. 正交”概念的引入, 使 得在内积空间中增加了不少在一般线性空间中所没有的、很有意义的性质 . 内积空间中两两正交的一组非零向量, 称为正交组 .正交组是线性无关的 .事实上, 若 α1 ,α2 , .,αm 为一正交组, 如果有 k1 α1 + k2 α2 + . + kmαm = 0, 则用 αi 与此向量等式两边作内积,注意到当 i≠ j 时均有(αi ,αj ) = 0,便可得到 ki (αi ,αi ) = (αi , 0) = 0 . 因 αi ≠0, 故(αi ,αi ) > 0, 因此有 ki = 0 ( i = 1 ,2 ,., m ) ,即 α1 ,α2 ,., αm 线性无关 . 定义 2 3 在 n 维欧氏空间中, 由正交组构成的基称为正交基; 如果正交基中每个向 量的长度都等于单位长度,则此正交基便称为标准正交基( 或称单位正交基) . 简单地说,若 α1 ,α2 ,.,αn 是 n 维欧氏空间 V 的一组非零向量,且满足条件 (αi ,αj ) = 1 当 i = j 0 当 i ≠ j ( i , j = 1 ,2 ,., n ) , 则 α1 ,α2 , .,αn 即为一标准正交基 . 定理 2 2 任一 n 维欧氏空间 V 都存在正交基 . 证明 设 α1 , α2 , .,αn 为 V 的一个基, 从这个基出发, 去构作 V 的一个正交基, 下面 是具体做法 . 首先可以取 β1 = α1 , 接着作向量 β2 = α2 + k1 α1 , 其中,系数 k1 可由正交条件(β2 ,β1 ) = 0 来确定, 由于 (β2 ,β1 ) = (α2 + k1β1 ,β1 ) = (α2 ,β1 ) + k1 (β1 ,β1 ) = 0 , 因此可得 k1 = - (α2 ,β1 ) (β1 ,β1 ) . 因 β1 = α1 与 α2 线性无关, 所以 β2 ≠0,且以上求得的 β1 ,β2 是正交的 .类似地,令 β3 = α3 + k2β1 + k3β2 , 则 β3 必不为零向量 .再由正交条件 (要求) (β3 ,β1 ) = 0, (β3 ,β2 ) = 0, 便可求得系数 k2 , k3 为 k2 = - (α3 ,β1 ) (β1 ,β1 ) , k3 = - (α3 ,β2 ) (β2 ,β3 ) , 因而 β3 便可确定,于是又得到正交组 β1 ,β2 ,β3 .按此方法做下去, 若已作出正交组 β1 ,β2 ,.,βn - 1 , 则令 24 矩阵分析引论
2内积空间 25 B.=a。+IB+3B2+.+1.,B。.1 显然R≠0再由正交条件 (B,B)=0,(B,B)=0,.,(A,B1)=0, 便可定出 4-.(a,B) (B,B) (i=1,2,.,n1) 因此,便得到正交基B,B,.,B定理证毕 注意,如果将上面求得的正交基的每个基向量都化为单位向量,即令 =T月(i=1,2,.,) 则得到标准正交基:%,“,Y。因此,从定理2~2又可得知,每个有限维内积空间都存 在标准正交基定理2~2及上述做法,不仅解决了正交基的存在性问题,而且还提供了一个 实际做法,这个做法叫做施密特(Schmidt)正交化过程. 假设V是个n维欧氏空间,不妨设a,a,.,a。是它的一个标准正交基现考察V 中任两向量a,B在这个基下内积的表达式为此,可设 a=xa+a+.+xma,B=a+2a+.+a, 于是,利用内积性质(稍作推广)及标准正交基的定义,可得: (a,)=(xa1+.+xna,片a+.+以an)=x1片+3为+.+x% 由此可见,在标准正交基下,欧氏空间(有限维实内积空间)向量内积可由坐标的一个简 单表达式来描述 下面讨论从一个标准正交基到另一个标准正交基的过渡矩阵有何特性 设无,马,.,。及n,:,.,几是n维欧氏空间V的两个标准正交基,从前一个基到 后一个基的过渡矩阵为A即 (,2,.,几)=(1,.,n)A 2-1 由式2-1转置得 .=A. 2-2 n。 利用形式矩阵乘法将式2-2两边分别左乘2-1,得 「(n,n)(n,e).(n,n)门 「(,)(,6).(,8) (几w,n)(几e,k)·(na,几m)J (8,)(,).(,6)J 2-3 由于 「1当i=j (,)=10当i≠ 如a,B为列向量,则有(a,)=aB
βn = αn + l1β1 + l2β2 + . + ln - 1βn - 1 . 显然 βn ≠0 .再由正交条件 (βn ,β1 ) = 0, (βn ,β2 ) = 0, ., (βn ,βn - 1 ) = 0, 便可定出 li = - (αn ,βi ) (βi ,βi ) ( i = 1, 2, ., n - 1 ) . 因此,便得到正交基 β1 ,β2 ,.,βn .定理证毕 . 注意,如果将上面求得的正交基的每个基向量都化为单位向量, 即令 γi = βi βi ( i = 1 ,2 ,., n ) , 则得到标准正交基:γ1 ,γ2 ,.,γn .因此,从定理 2 2 又可得知, 每个有限维内积空间都存 在标准正交基 .定理 2 2 及上述做法, 不仅解决了正交基的存在性问题,而且还提供了一个 实际做法,这个做法叫做施密特( Schmidt) 正交化过程 . 假设 V 是个 n 维欧氏空间, 不妨设 α1 , α2 , ., αn 是它的一个标准正交基 .现考察 V 中任两向量α,β在这个基下内积的表达式 .为此, 可设 α = x1 α1 + x2 α2 + . + x nαn , β = y1 α1 + y2 α2 + . + ynαn , 于是,利用内积性质( 稍作推广)及标准正交基的定义, 可得: (α,β) = ( x1 α1 + . + x nαn , y1 α1 + . + ynαn ) = x1 y1 + x2 y2 + . + xn yn . 由此可见,在标准正交基下, 欧氏空间(有限维实内积空间) 向量内积可由坐标的一个简 单表达式来描述 . 下面讨论从一个标准正交基到另一个标准正交基的过渡矩阵有何特性 . 设 ε1 ,ε2 , .,εn 及η1 ,η2 ,., ηn 是 n 维欧氏空间 V 的两个标准正交基, 从前一个基到 后一个基的过渡矩阵为 A .即 (η1 , η2 , .,ηn ) = (ε1 ,ε2 ,.,εn ) A . 2 1 由式 2 1 转置得 η1 . ηn = A T ε1 . εn . 2 2 利用形式矩阵乘法将式 2 2 两边分别左乘 2 1,得 (η1 , η1 ) (η1 , η2 ) . (η1 , ηn ) (η2 , η1 ) (η2 , η2 ) . (η2 , η2 ) . . . (ηn , η1 ) (ηn , η2 ) . (ηn , ηn ) = A T (ε1 , ε1 ) (ε1 , ε2 ) . (ε1 , εn ) (ε2 , ε1 ) (ε2 , ε2 ) . (ε2 , ε2 ) . . . (εn , ε1 ) (εn , ε2 ) . (εn , εn ) A . 2 3 由于 (ηi , ηj ) = 1 当 i = j 0 当 i ≠ j , 2 内积空间 25 如 α, β为列向 量 , 则有 (α,β) = αTβ