第2章光滑映射的微分及其应用上一章构建了“光滑范畴”,在该范畴中对象是光滑流形,而态射则是光滑映射。抽象范畴论的基本思想之一是用对象之间的态射来研究对象本身。本章的目的就是深人研究光滑映射,并利用光滑映射研究光滑流形本身。2.1光滑映射的微分本节旨在定义光滑映射的微分。对一个光滑映射在一个给定点取微分,本质上就是在该点附近用线性映射逼近原映射,即“以直代曲”的线性化过程。为此,需要先定义光滑流形在每点处的切空间,作为该线性化映射的承载空间。2.1.1切空间丁欧氏空间中光滑映射的微分首先回顾一下欧氏空间开集间光滑映射的微分。设U,V为欧氏空间中的开集,且f:U→V是一个光滑映射.f在点aEU处的微分(或称切映射)是一个线性映射dfa:Rn→Rm.它(在典范基下的)矩阵是f在a处的Jacobi矩阵,即((a)(a) )dfa=1.(n(a).fm(a))在多变量微积分中已经所看到,线性映射df。在研究光滑映射f时扮演了关键角色,因为它本质上是f在a附近的“线性化”:I(a) - f(a) - dfa(α - a) = 0.limI-all关于微分的一个非常有用的事实是:1命题2.1.1.(链式法则)如果映射f:U→V在r=a处可微,而映射g:V→W在=fa)处可微,那么复合映射gof:U→W在=a处也可微,并且d(g o f)a = dgf(a) odfa.切向量定义背后的想法设M,N是光滑流形,且f:M一→N是光滑映射.我们希望跟欧氏空间情形一样将f在点p处的微分dfp定义为对应切空间之间某个线性映射,作为映射在点p附近的线性化。为此,首先需要解决的问题是:什么是光滑流形在一点处的切空间?1考虑两个范畴,第一个范畴是以“欧氏空间中“带点开集”(U,a)”为对象,以“光滑映射”为态射,第二个范畴是以“线性空间”为对象,以“线性映射”为态射,那么d可被视作是从第一个范畴到第二个范畴的一个“函子”,而链式法则只不过是函子性质的一部分
第 2 章 光滑映射的微分及其应用 上一章构建了“光滑范畴”,在该范畴中对象是光滑流形,而态射则是光滑映射。抽 象范畴论的基本思想之一是用对象之间的态射来研究对象本身。本章的目的就是深入研 究光滑映射,并利用光滑映射研究光滑流形本身。 2.1 光滑映射的微分 本节旨在定义光滑映射的微分。对一个光滑映射在一个给定点取微分,本质上就是 在该点附近用线性映射逼近原映射,即“以直代曲”的线性化过程。为此,需要先定义 光滑流形在每点处的切空间,作为该线性化映射的承载空间。 2.1.1 切空间 ¶ 欧氏空间中光滑映射的微分 首先回顾一下欧氏空间开集间光滑映射的微分。设 U, V 为欧氏空间中的开集, 且 f : U → V 是一个光滑映射. f 在点 a ∈ U 处的微分(或称切映射)是一个线性映射 dfa : R n → R m. 它 (在典范基下的) 矩阵是 f 在 a 处的 Jacobi 矩阵, 即 dfa = Ü ∂f1 ∂x1 (a) · · · ∂f1 ∂xn (a) . . . . . . . . . ∂fm ∂x1 (a) · · · ∂fm ∂xn (a) ê . 在多变量微积分中已经所看到,线性映射 dfa 在研究光滑映射 f 时扮演了关键角色,因 为它本质上是 f 在 a 附近的“线性化”: limx→a kf(x) − f(a) − dfa(x − a)k kx − ak = 0. 关于微分的一个非常有用的事实是: 1 命题 2.1.1. (链式法则) ♠ 如果映射 f : U → V 在 x = a 处可微,而映射 g : V → W 在 x = f(a) 处可微, 那么复合映射 g ◦ f : U → W 在 x = a 处也可微, 并且 d(g ◦ f)a = dgf(a) ◦ dfa. ¶ 切向量定义背后的想法 设 M, N 是光滑流形,且 f : M → N 是光滑映射. 我们希望跟欧氏空间情形一样, 将 f 在点 p 处的微分 dfp 定义为对应切空间之间某个线性映射, 作为映射 f 在点 p 附近 的线性化. 为此,首先需要解决的问题是: 什么是光滑流形在一点处的切空间? 1考虑两个范畴,第一个范畴是以“欧氏空间中‘带点开集’(U, a)”为对象,以“光滑映射”为态射,第二 个范畴是以“线性空间”为对象,以“线性映射”为态射. 那么 d 可被视作是从第一个范畴到第二个范畴的 一个“函子”,而链式法则只不过是函子性质的一部分
2.1光滑映射的微分从熟悉的例子开始。在数学分析以及古典微分几何中已经学过空间中“曲线的切线”以及“曲面的切平面”的概念.例如,若f = (fi, f2,f3) : D → R3是空间里的一个曲面的(局部)参数方程,则该曲面在点f(u,)处的切平面是由向量(,)和(,)所张成的平面,而该平面恰好是在点(u)处的微分df(u,)的像集.一般地,若M是RN中的一个具体流形(即将学到的Whitney嵌入定理说明这总是正确的),那么总可以选择p附近的一个坐标卡(,U,V),使得-1:V→U是一个微分同胚(这个映射可被视为是该流形的局部参数方程):将从M到R的嵌人记为:M→R,就得到欧氏空间中开集之间的一个光滑映射Lo0-1:V-RN,从而可以跟空间中曲面情形类似,把切空间T,M定义为以下线性映射d(t0-1)g() :Rn→RN的像集,当然,需要验证用这种方式定义的空间T,M不依赖于坐标卡的选取,并且,因为从M到欧氏空间的嵌人方式不唯一,还需要研究不同嵌入所得的切空间T,M之间的关系.因为目前我们并不先验地知道光滑流形是否可被嵌入欧氏空间,而且又没有一个简洁优美的“几何图像”去实现一个抽象的流形,下面将仅使用M本身的信息去内蕴地定义切空间T,M.为了理解下文中将要给出的“光滑流形在每一点处切空间”的抽象定义,我们先仔细考察欧氏空间的情况:基本思路是:。在给定点a处的任意向量ER"都可被视作在a处的方向导数。方向导数有一个纯代数的刻画,且该刻画可以被推广到光滑流形上,于是,可以将切空间定义为由这些“用代数方法定义的方向导数”所构成的线性空间!欧氏空间中方向导数的代数刻画先回顾一下:对于任意ERn,n元函数f在a处沿着方向的方向导数是f(a+ho)-f(r)dDof := limf(a+tu)=dfa(の).hdtt-h0-0因此对于每个给定的点α以及向量,都有一个算子D : C(R") →R.在坐标表示下,如果=(ul,,un)T,那么由链式法则可得Df=(a).换句话说,作为Cα(Rn)上的一个算子,有De-uoOri当然,D:C°(R")→R是一个非常特殊的算子:它是一个线性算子D(αf+Bg)=aDf+βDg,Va,βeR29
2.1 光滑映射的微分 从熟悉的例子开始. 在数学分析以及古典微分几何中已经学过空间中“曲线的切线” 以及“曲面的切平面”的概念. 例如,若 f = (f1, f2, f3) : D → R 3 是空间里的一个曲面的(局部)参数方程,则该曲面在点 f(u, v) 处的切平面是由向量 ( ∂f1 ∂u , ∂f2 ∂u , ∂f3 ∂u ) T 和 ( ∂f1 ∂v , ∂f2 ∂v , ∂f3 ∂v ) T 所张成的平面,而该平面恰好是 f 在点 (u, v) 处的微 分 df(u,v) 的像集. 一般地,若 M 是 R N 中的一个具体流形(即将学到的 Whitney 嵌入定理说明这总是正确的), 那么总可以选择 p 附近的一个坐标卡 (ϕ, U, V ), 使得 ϕ −1 : V → U 是一个微分同胚(这 个映射可被视为是该流形的局部参数方程). 将从 M 到 R N 的嵌入记为 ι : M ,→ R N , 就得到 欧氏空间中开集之间的一个光滑映射 ι ◦ ϕ −1 : V → R N , 从而可以跟空间中曲面情形类似,把切空间 TpM 定义为以下线性映射 d(ι ◦ ϕ −1 )φ(p) : R n → R N 的像集. 当然,需要验证用这种方式定义的空间 TpM 不依赖于坐标卡的选取,并且,因 为从 M 到欧氏空间的嵌入方式不唯一,还需要研究不同嵌入所得的切空间 TpM 之间的 关系. 因为目前我们并不先验地知道光滑流形是否可被嵌入欧氏空间,而且又没有一个简 洁优美的“几何图像”去实现一个抽象的流形,下面将仅使用 M 本身的信息去内蕴地定 ✿✿✿✿✿✿ 义切空间 TpM. 为了理解下文中将要给出的“光滑流形在每一点处切空间”的抽象定义, 我们先仔细考察欧氏空间的情况. 基本思路是: 在给定点 a 处的任意向量 ~v ∈ R n 都可被视作在 a 处的方向导数, 方向导数有一个纯代数的刻画,且该刻画可以被推广到光滑流形上. 于是,可以将切空间定义为由这些“用代数方法定义的方向导数”所构成的线性空间! ¶ 欧氏空间中方向导数的代数刻画 先回顾一下: 对于任意 ~v ∈ R n , n 元函数 f 在 x 处沿着方向 v 的方向导数是 Da ⃗v f := lim h→0 f(a + h~v) − f(x) h = d dt t=0 f(a + t~v)= dfa(~v). 因此对于每个给定的点 a 以及向量 ~v,都有一个算子 Da ⃗v : C ∞(R n ) → R. 在坐标表示下,如果 ~v = hv 1 , · · · , vn i T , 那么由链式法则可得 Da ⃗v f = Pv i ∂f ∂xi (a). 换句 话说,作为 C∞(R n ) 上的一个算子, 有 Da ⃗v = X i v i ∂ ∂xi x=a . 当然,Da ⃗v : C∞(R n ) → R 是一个非常特殊的算子: 它是一个线性算子 Da ⃗v (αf + βg) = αDa ⃗v f + βDa ⃗v g, ∀α, β ∈ R 29
2.1光滑映射的微分并且它满足(在a处的)Leibnitz法则D(fg) = f(a)Dg + g(a)Df反之,这两个性质刻画了方向导数:命题2.1.2.(方向导数的代数刻画)如果D:Coo(Rn)一R是线性的并且满足在a处的Leibnitz法则,即D(fg) = f(a)D(g) + g(a)D(f),那么存在a处的某个向量使得D=D%证明对于任意fEC(R"),有id (a + (μ- a)dt = (a) + ( -αd)h(a), f(r) = f(a) +i=1其中ofh;(r) =(a+t(α-a))dt.Ori另一方面,可以用Leibnitz法则计算D(1),其中1表示恒取常值1的函数:D(1) = D(1 - 1) = 2D(1) D(1) = 0再结合线性性,对于任意常数c都有D(c)=0.因此2nafD(f) = 0 +Z D(r")h;(a) + (αt -a')D(hi) =ZD(ri)(a)Orti=1=1i=1由此可得,作为Co(IR")上的算子,0D=D(riari口于是只要令=D()D(rn)就有D=D注2.1.3.一般地,人们把满足Leibnitz性质的线性映射叫做导子:定义2.1.4(导子)若 A是域 k(例如R)一个代数(例如 C(U)、C~(M)),B是A上的一个双模(例如R、Co(M)等),且线性算子d:A→B满足Leibnitz法则d(uv) = (du)u + u(dv),则称d为A的一个(取值于B的)导子。品不难验证对于给定的A和B,所有导子组成一个线性空间。本书后续章节中还将出现很多对应于不同代数的导子,例如向量场、李导数等。下面考虑“(几何)向量-(代数)导子”对应关系u~ Dg.我们有。该对应是从(由在a处的全部切向量构成的)线性空间Rn到“由在α点处的全部30
2.1 光滑映射的微分 并且它满足(在 a 处的)Leibnitz 法则: Da ⃗v (fg) = f(a)Da ⃗v g + g(a)Da ⃗v f. 反之,这两个性质刻画了方向导数: 命题 2.1.2. (方向导数的代数刻画) ♠ 如果 D : C∞(R n ) → R 是线性的并且满足在 a 处的 Leibnitz 法则,即 D(fg) = f(a)D(g) + g(a)D(f), 那么存在 a 处的某个向量 ~v 使得 D = Da ⃗v . 证明 对于任意 f ∈ C∞(R n ), 有 f(x) = f(a) + Z 1 0 d dtf(a + t(x − a))dt = f(a) +Xn i=1 (x i − a i )hi(x), 其中 hi(x) = Z 1 0 ∂f ∂xi (a + t(x − a))dt. 另一方面,可以用 Leibnitz 法则计算 D(1),其中 1 表示恒取常值 1 的函数: D(1) = D(1 · 1) = 2D(1) =⇒ D(1) = 0. 再结合线性性,对于任意常数 c 都有 D(c) = 0. 因此 D(f) = 0 +Xn i=1 D(x i )hi(a) +Xn i=1 (a i − a i )D(hi) = Xn i=1 D(x i ) ∂f ∂xi (a). 由此可得,作为 C∞(R n ) 上的算子, D = Xn i=1 D(x i ) ∂ ∂xi x=a . 于是只要令 ~v = hD(x 1 ), · · · , D(x n )i, 就有 D = Da ⃗v . □ 注 2.1.3. 一般地,人们把满足 Leibnitz 性质的线性映射叫做导子: 定义 2.1.4. (导子) ♣ 若 A 是域 k(例如 R) 一个代数(例如 C ∞(U)、C ∞(M)),B 是 A 上的一个双模(例如 R、C ∞(M) 等),且线性算子 d : A → B 满足 Leibnitz 法则 d(uv) = (du)v + u(dv), 则称 d 为 A 的一个(取值于 B 的)导子。 不难验证对于给定的 A 和 B,所有导子组成一个线性空间。本书后续章节中还将出现很 多对应于不同代数的导子,例如向量场、李导数等。 下面考虑“(几何) 向量-(代数) 导子”对应关系 ~v ⇝ Da ⃗v . 我们有 该对应是从 (由在 a 处的全部切向量构成的) 线性空间 R n 到“由在 a 点处的全部 30
2.1光滑映射的微分导子构成的线性空间D”的线性映射:Da+Bu=αD+βBDa。它是单射:如果1≠2,那么D%≠D%(请读者尝试去证明它)。。它是满射:这正是命题2.1.2的结论因此“点α处的切向量构成的线性空间”与“点α处的导子构成的线性空间”是线性同构的,即可以将点α处所有切向量的向量空间等同于点α处所有导数的向量空间!光滑流形在一点处的切空间现在回到光滑流形的情形虽然在抽象框架里并没有“几何向量”,但仍然有全体光滑函数构成的代数Cα(M).跟欧氏空间情形一样,可以代数地定义在一点处的导子,并称之为该点处的切向量:定义2.1.5.(切向量)令M为一个n-维光滑流形(1)若R-线性映射Xp:Co(M)→R在点pEM处满足Leibnitz法则Xp(fg) = f(p)Xp(g) + Xp(f)g(p),Vf,g E C(M)则称X,为M在p点处的一个切向量(2)称在p处的全体切向量所构成的线性空间T,M为M在p点处的切空间应用Leibnitz法则和线性性易得:如果f=c是一个常值函数,那么Xp(f)=0.更般地,引理2.1.6.(局部常值函数的导数)如果在 p点的某个邻域里有 f = c, 那么 X,(f)= 0.证明取M上的鼓包函数,使得Φ在p的附近恒为1,且在集合于≠c上恒为0.则(f -c)p= 0.因此0 = X,((f - c)) =(f(p) - c)X,() + X,(f)(p) =Xp(f),口特别地,如果在p点的某邻域里有f=g2,那么Xp(f)=Xp(g).换而言之,Xp(f)这个数由f在p的邻域里的值决定.因此可以将定义2.1.5中的C(M)替换为C(U),其中U是任意包含p的开集:命题2.1.7.(切空间是局部的)设M是一个光滑流形,U是PCM任一开邻域,那么作为线性空间,T,M ~ T,U.2注意对于不同的函数对,这里取的邻域可以不同。人们用芽的语言来描述这种局部性:如果在p的某邻域内有=g,则我们称于和g在p点处定义了相同的芽不难验证“在p点处定义了相同的芽"是了C(M)上(或更一般地,在C(M,N)上)的一个等价关系.当研究局部性质的时候,在芽上处理起来一般而言更加便利.31
2.1 光滑映射的微分 导子构成的线性空间 D”的线性映射: Da α⃗v+β ⃗w = αDa ⃗v + βDa ⃗w. 它是单射: 如果 ~v1 6= ~v2, 那么 Da ⃗v1 6= Da ⃗v2 (请读者尝试去证明它). 它是满射: 这正是命题2.1.2的结论. 因此“点 a 处的切向量 ~v 构成的线性空间”与“点 a 处的导子构成的线性空间”是线性 同构的,即可以将点 a 处所有切向量的向量空间等同于点 a 处所有导数的向量空间! ¶ 光滑流形在一点处的切空间 现在回到光滑流形的情形. 虽然在抽象框架里并没有“几何向量”,但仍然有全体光 滑函数构成的代数 C∞(M). 跟欧氏空间情形一样,可以代数地定义在一点处的导子,并 称之为该点处的切向量: 定义 2.1.5. (切向量) ♣ 令 M 为一个 n-维光滑流形. (1) 若 R-线性映射 Xp : C∞(M) → R 在点 p ∈ M 处满足 Leibnitz 法则 Xp(fg) = f(p)Xp(g) + Xp(f)g(p), ∀f, g ∈ C ∞(M), 则称 Xp 为 M 在 p 点处的一个切向量. (2) 称在 p 处的全体切向量所构成的线性空间 TpM 为 M 在 p 点处的切空间. 应用 Leibnitz 法则和线性性易得: 如果 f ≡ c 是一个常值函数, 那么 Xp(f) = 0. 更 一般地, 引理 2.1.6. (局部常值函数的导数) ♦ 如果在 p 点的某个邻域里有 f = c, 那么 Xp(f) = 0. 证明 取 M 上的鼓包函数 ϕ,使得 ϕ 在 p 的附近恒为 1, 且在集合 f 6= c 上恒为 0. 则 (f − c)ϕ ≡ 0. 因此 0 = Xp((f − c)ϕ) = (f(p) − c)Xp(ϕ) + Xp(f)ϕ(p) = Xp(f). □ 特别地,如果在 p 点的某邻域里有 f = g 2 , 那么 Xp(f) = Xp(g). 换而言之, Xp(f) 这个数由 f 在 p 的邻域里的值决定. 因此可以将定义2.1.5中的 C∞(M) 替换为 C∞(U), 其中 U 是任意包含 p 的开集: 命题 2.1.7. (切空间是局部的) ♠ 设 M 是一个光滑流形, U 是 p ⊂ M 任一开邻域, 那么作为线性空间, TpM ' TpU. 2注意对于不同的函数对,这里取的邻域可以不同。人们用芽的语言来描述这种局部性: 如果在 p 的✿✿某邻域内 有 f = g,则我们称 f 和 g 在 p 点处定义了相同的芽. 不难验证“在 p 点处定义了相同的芽”是了 C ∞(M) 上(或更一般地,在 C∞(M, N) 上)的一个等价关系. 当研究局部性质的时候,在芽上处理起来一般而言更加便利. 31
2.1光滑映射的微分2.1.2光滑映射的微分光滑流形之间的光滑映射的微分现在定义光滑流形之间光滑映射的微分:我们知道,欧氏空间中开集之间的光滑映射f:U→V在点a处的微分是一个线性映射dfa:TaU=Rn-→Tr(a)V=Rm其矩阵是f在a处的Jacobi矩阵((a).为了将这个概念推广到流形之间的光滑映射,需要仔细考察T.U的两种解释:我们已经看到了可以将α点处(几何的)向量πERn等同于a处(代数的)导子D=l=a·注意到从几何上看,ofi(a)u,...,ofmdfa():(a)arjdrji2上式右侧的向量是Rm中的一个几何向量,它可以被代数地解释为在V里点f(a)处的导子,即把gEC(Rm)映为aEEuofagZu(g o f) = D(g o f)(a)drOrjOy'j的映射.上面的计算表明向量dfa()对应的导子恰好是在点f(a)处“将gEC(Rm)映射到D(g。f)”的那个导子.由此启发我们定义定义2.1.8.(光滑映射的微分)对于任意光滑映射:M→N.以及任意点pEM,f在p处的微分是一个线性映射dfp:T,M→Tf(p)N,其定义由下式给出:dfp(Xp)(g) = Xp(g 0 f),VXET,M.gECO(N)吊注2.1.9.对于R,可以将TR等同于R,dCHeTR mcER.这个对应还可以用下述方式如下理解取g(t)=t,则gECo(R),且跟向量c量所对应的实数c恰好就是向量c%作用在函数g上所得的结果。特别地,对于任意光滑函数fEC(M)以及任意XET,M,在上述等同下,跟向量df(X)对应的实数就是dfp(Xp)(g) = Xp(g o f) = Xp(f)于是我们得到了如下非常有用的公式:dfp(Xp) = Xp(f),Vf EC(M),VXp ETpM32
2.1 光滑映射的微分 2.1.2 光滑映射的微分 ¶ 光滑流形之间的光滑映射的微分 现在定义光滑流形之间光滑映射的微分. 我们知道,欧氏空间中开集之间的光滑映 射 f : U → V 在点 a 处的微分是一个线性映射 dfa : TaU = R n x → Tf(a)V = R m y , 其矩阵是 f 在 a 处的 Jacobi 矩阵 ( ∂fi ∂xj (a)). 为了将这个概念推广到流形之间的光滑映 射,需要仔细考察 TaU 的两种解释: 我们已经看到了可以将 a 点处 (几何的) 向量 ~v ∈ R n 等同于 a 处 (代数的) 导子 Da ⃗v = Pv i ∂ ∂xi |x=a. 注意到从几何上看, dfa(~v) = Å ∂fi ∂xj (a) ã ~v = ∞X j ∂f1 ∂xj (a)v j , · · · , X j ∂fm ∂xj (a)v j ∫T . 上式右侧的向量是 R m y 中的一个几何向量,它可以被代数地解释为在 V 里点 f(a) 处的 导子, 即把 g ∈ C∞(R m y ) 映为 X i X j v j ∂fi ∂xj (a) ∂g ∂yi = X j v j ∂ ∂xj x=a (g ◦ f) = Da ⃗v (g ◦ f) 的映射. 上面的计算表明向量 dfa(~v) 对应的导子恰好是在点 f(a) 处“将 g ∈ C∞(R m) 映射 到 Da ⃗v (g ◦ f)”的那个导子. 由此启发我们定义 定义 2.1.8. (光滑映射的微分) ♣ 对于任意光滑映射 f : M → N. 以及任意点 p ∈ M, f 在 p 处的 微分是一个线性 映射 dfp : TpM → Tf(p)N,其定义由下式给出: dfp(Xp)(g) = Xp(g ◦ f), ∀Xp ∈ TpM, g ∈ C ∞(N) 注 2.1.9. 对于 R,可以将 TtR 等同于 R, c d dt ∈ TtR ↭ c ∈ R. 这个对应还可以用下述方式如下理解: 取 g(t) = t,则 g ∈ C∞(R),且跟向量 c d dt 所对应的实数 c 恰好就是向量 c d dt 作用在函数 g 上所得的结果。 特别地,对于任意光滑函数 f ∈ C∞(M) 以及任意 Xp ∈ TpM,在上述等同下,跟向量 dfp(Xp) 对应的实数就是 dfp(Xp)(g) = Xp(g ◦ f) = Xp(f). 于是我们得到了如下非常有用的公式: dfp(Xp) = Xp(f), ∀f ∈ C ∞(M), ∀Xp ∈ TpM, 32