§1变分法简介 作为数学的一个分支,变分法的诞生,是现实世界许多现象不断探索的结果,人们可以追寻 到这样一个轨迹 约翰·伯努利( Johann Bernoulli,1667-1748)1696年向全欧洲数学家挑战,提出 个难题:“设在垂直平面内有任意两点,一个质点受地心引力的作用,自较高点下滑至较 低点,不计摩擦,问沿着什么曲线下滑,时间最短?” 这就是著名的“最速降线”问题( The Brachistochrone Problen)。它的难处在于和普通 的极大极小值求法不同,它是要求出一个未知函数(曲线),来满足所给的条件。这问题的 新颖和别出心裁引起了很大兴趣,罗比塔( Guillaume francois antonie de i' Hospital 1661-1704)、雅可比·伯努利( Jacob Bernoulli1654-1705)、莱布尼茨( Gottfried Wilhelm Leibniz,1646-1716)和牛顿( Isaac Newton642-1727)都得到了解答。约翰的解法比较 漂亮,而雅可布的解法虽然麻烦与费劲,却更为一般化。后来欧拉( Euler leonhard,107~ 1783)和拉格朗日( Lagrange, Joseph louis,1736-1813)发明了这一类问题的普遍解法 从而确立了数学的一个新分支一一变分学 有趣的是,在1690年约翰·伯努利的哥哥雅可比·伯努利曾提出著名的悬链线问题 ( The Hanging Chain Problem)向数学界征求答案,即,固定项链的两端,在重力场中让它自 然垂下,问项链的曲线方程是什么。在大自然中,除了悬垂的项链外,我們还可以观察到吊 桥上方的悬垂钢索,挂着水珠的蜘蛛网,以及两根电线杆之间所架设的电线,这些都是悬链 线( catenary) 伽利略( Galileo,1564~1643)比贝努利更早注意到悬链线,他猜测悬链线是抛物线 从外表看的确象,但实际上不是。惠更斯( Huygens,,1629~1695)在1646年(当时17岁), 经由物理的论证,得知伽利略的猜测不对,但那时,他也求不出答案。到1691年,也就是 雅可比·伯努利提出悬链线问题的第二年,莱布尼兹、惠更斯(以62岁)与约翰·伯努利 各自得到了正确答案,所用方法是诞生不久的微积分,具体说是把问题转化为求解一个二阶 常微分方程 dy =yo y(0)=0 解此方程并适当选取参数,得 y=-(e+e 20 即为悬链线 悬链线问题本身和变分法并没有关系,然而这和最速降线问题一样都是贝努利兄弟间的 相互争强好胜、不断争吵的导火索,虽然雅可比·贝努利在解决悬链线问题时略占下风,但 他随后所证明的“悬挂于两个固定点之间的同一条项链,在所有可能的形状中,以悬链线的 重心最低,具有最小势能”,算是扳回了一局,俩兄弟扯平了!之所以提到悬链线问题,有 两方面考虑,其一,这是有关数学史上著名的贝努利家族内的一个趣闻,而这是一个在变分 法乃至整个数学物理领域有着巨大贡献的家族,其二,有关悬链线的得几个结论,可以用变
1 §1 变分法简介 作为数学的一个分支,变分法的诞生,是现实世界许多现象不断探索的结果,人们可以追寻 到这样一个轨迹: 约翰·伯努利(Johann Bernoulli,1667-1748)1696 年向全欧洲数学家挑战,提出 一个难题:“设在垂直平面内有任意两点,一个质点受地心引力的作用,自较高点下滑至较 低点,不计摩擦,问沿着什么曲线下滑,时间最短?” 这就是著名的“最速降线”问题(The Brachistochrone Problem)。它的难处在于和普通 的极大极小值求法不同,它是要求出一个未知函数(曲线),来满足所给的条件。这问题的 新颖和别出心裁引起了很大兴趣,罗比塔(Guillaume Francois Antonie de l'Hospital 1661-1704)、雅可比·伯努利(Jacob Bernoulli 1654-1705)、莱布尼茨(Gottfried Wilhelm Leibniz,1646-1716)和牛顿(Isaac Newton1642—1727)都得到了解答。约翰的解法比较 漂亮,而雅可布的解法虽然麻烦与费劲,却更为一般化。后来欧拉(Euler Lonhard,1707~ 1783)和拉格朗日(Lagrange, Joseph Louis,1736-1813)发明了这一类问题的普遍解法, 从而确立了数学的一个新分支——变分学。 有趣的是,在 1690 年约翰·伯努利的哥哥雅可比·伯努利曾提出著名的悬链线问题 (The Hanging Chain Problem)向数学界征求答案,即,固定项链的两端,在重力场中让它自 然垂下,问项链的曲线方程是什么。在大自然中,除了悬垂的项链外,我們还可以观察到吊 桥上方的悬垂钢索,挂着水珠的蜘蛛网,以及两根电线杆之间所架设的电线,这些都是悬链 线(catenary)。 伽利略(Galileo, 1564~1643)比贝努利更早注意到悬链线,他猜测悬链线是抛物线, 从外表看的确象,但实际上不是。惠更斯(Huygens, 1629~1695)在 1646 年(当时 17 岁), 经由物理的论证,得知伽利略的猜测不对,但那时,他也求不出答案。到 1691 年,也就是 雅可比·伯努利提出悬链线问题的第二年,莱布尼兹、惠更斯(以 62 岁)与约翰·伯努利 各自得到了正确答案,所用方法是诞生不久的微积分,具体说是把问题转化为求解一个二阶 常微分方程 解此方程并适当选取参数,得 ( ) 2 1 ax ax e e a y − = + (1) 即为悬链线。 悬链线问题本身和变分法并没有关系,然而这和最速降线问题一样都是贝努利兄弟间的 相互争强好胜、不断争吵的导火索,虽然雅可比·贝努利在解决悬链线问题时略占下风,但 他随后所证明的“悬挂于两个固定点之间的同一条项链,在所有可能的形状中,以悬链线的 重心最低,具有最小势能”,算是扳回了一局,俩兄弟扯平了!之所以提到悬链线问题,有 两方面考虑,其一,这是有关数学史上著名的贝努利家族内的一个趣闻,而这是一个在变分 法乃至整个数学物理领域有着巨大贡献的家族,其二,有关悬链线的得几个结论,可以用变 = = = + (0) 0 (0) 1 ( ) 0 2 2 2 y y y dx dy a dx d y
分法来证明! 现实中很多现象可以表达为泛函极小问题,我们称之为变分问题。求解方法通常有两种 古典变分法和最优控制论。我们这儿要介绍的基本属于古典变分法的范畴。 1.1变分法的基本概念 1.1.1泛函的概念 设S为一函数集合,若对于每一个函数x(1)∈S有一个实数J与之对应,则称J是定义 在S上的泛函,记作J(x(1)。S称为J的容许函数集 例如,在[x0,x1]上光滑曲线y(x)的长度可定义为 1+ydx 考虑几个具体曲线,取x0=0,x1 若y(x)=x,则 ((x)=(x)=√+lk=√2 若y(x)为悬链线,则 2 2 对应C[x,x1]中不同的函数y(x),有不同曲线长度值J,即J依赖于yx),是定义在 函数集合C[x0,x1]上的一个泛函,此时我们可以写成 J=J((x)) 我们称如下形式的泛函为最简泛函 J(x(t)=F(t,x(o),i(t)dt 被积函数F包含自变量1,未知函数x(t)及导数x(t)。上述曲线长度泛函即为一最简泛函 1.1.2泛函极值问题 考虑上述曲线长度泛函,我们可以提出下面问题: 在所有连接定点A(x0,y0)和B(x1,y1)的平面曲线中,试求长度最小的曲线 即,求y(x)∈u(x)y(x)∈C"[x,x1y(x0)=ya,y(x)=y1},使 取最小值。此即为泛函极值问题的一个例子。以极小值为例,一般的泛函极值问题可表述为, 称泛函J/(x(1)在x0(1)∈S取得极小值,如果对于任意一个与x0(1)接近的x()∈S 都有J(x(m)≥J(x0(D)。所谓接近,可以用距离d(x(1),x0(1)<E来度量,而距离可以定 义为 d(x(1),x0(m))=max{x(t)-x0(t),x(t)-x0()}
2 分法来证明! 现实中很多现象可以表达为泛函极小问题,我们称之为变分问题。求解方法通常有两种: 古典变分法和最优控制论。我们这儿要介绍的基本属于古典变分法的范畴。 1.1 变分法的基本概念 1.1.1 泛函的概念 设 S 为一函数集合,若对于每一个函数 x(t) S 有一个实数 J 与之对应,则称 J 是定义 在 S 上的泛函,记作 J (x(t)) 。 S 称为 J 的容许函数集。 例如,在 [ , ] 0 1 x x 上光滑曲线 y(x)的长度可定义为 = + 1 0 2 1 x x J y dx (2) 考虑几个具体曲线,取 x0 = 0, x1 =1, 若 y(x) = x ,则 = = + = 1 0 J (y(x)) J (x) 1 1dx 2 若 y(x)为悬链线,则 − − − − − = + = − = + + 1 0 1 0 2 1 4 2 2 ( ) ) 1 2 ( e e dx e e dx e e e e J x x x x x x 对应 [ , ] 0 1 1 C x x 中不同的函数 y(x),有不同曲线长度值 J,即 J 依赖于 y(x),是定义在 函数集合 [ , ] 0 1 1 C x x 上的一个泛函,此时我们可以写成 J = J ( y(x)) 我们称如下形式的泛函为最简泛函 = f t t J x t F t x t x t dt 0 ( ( )) ( , ( ), ( )) (3) 被积函数 F 包含自变量 t ,未知函数 x (t)及导数 x (t)。上述曲线长度泛函即为一最简泛函。 1.1.2 泛函极值问题 考虑上述曲线长度泛函,我们可以提出下面问题: 在所有连接定点 ( , ) ( , ) 0 0 1 1 A x y 和B x y 的平面曲线中,试求长度最小的曲线。 即,求 0 1 0 0 1 1 1 y(x) y(x) y(x)C [x , x ], y(x ) = y , y(x ) = y ,使 = + 1 0 2 ( ( )) 1 x x J y x y dx 取最小值。此即为泛函极值问题的一个例子。以极小值为例,一般的泛函极值问题可表述为, 称泛函 J (x(t)) 在 x0 (t)S 取得极小值,如果对于任意一个与 ( ) 0 x t 接近的 x(t) S , 都有 ( ( )) ( ( )) 0 J x t J x t 。所谓接近,可以用距离 ( ( ), ( )) 0 d x t x t 来度量,而距离可以定 义为 ( ( ), ( )) max{| ( ) ( ) |,| ( ) ( ) |} 0 0 0 0 d x t x t x t x t x t x t f t t t = − −
泛函的极大值可以类似地定义。其中x0(1)称为泛函的极值函数或极值曲线 1.1.3泛函的变分 如同函数的微分是增量的线性主部一样,泛函的变分是泛函增量的线性主部。作为泛函 的自变量,函数x(1)在x0(1)的增量记为 x(D)=x(1)-x0(1) 也称函数的变分。由它引起的泛函的增量记作 △=J(x(1)+ax()-J(x0(D) 如果M/可以表为 △=L(x0(1)ax()+r(x(1),ai(1) 其中L为x的线性项,而r是ax的高阶项,则称L为泛函在x0()的变分,记作 a/(x0(1)。用变动的x(1)代替x0(1),就有&/(x(t)。 泛函变分的一个重要形式是它可以表为对参数a的导数: a(x(o) (x()+aa() (4) 这是因为当变分存在时,增量 △=J(x(1)+aai)-J(x(1))=L(x(1),aox)+r(x(),aax) 根据L和r的性质有 L(x(o), ad)=aL(x(n), ax) lim r(x(O),aax)- lim r(x(),aao=o a→0 所以 J(x+aar) J(x+aa)-j(x) a=0 L(, aa)+r(x, aar) L(, ax=a(x) 1.2泛函极值的相关结论 12.1泛函极值的变分表示 利用变分的表达式(4),可以得到有关泛函极值的重要结论。 泛函极值的变分表示:若J(x(m)在x(1)达到极值(极大或极小),则 a(x0())=0 (5) 证明:对任意给定的a,J(x0+a)是变量a的函数,该函数在a=0处达到极值。根 据函数极值的必要条件知
3 泛函的极大值可以类似地定义。其中 ( ) 0 x t 称为泛函的极值函数或极值曲线。 1.1.3 泛函的变分 如同函数的微分是增量的线性主部一样,泛函的变分是泛函增量的线性主部。作为泛函 的自变量,函数 x(t) 在 ( ) 0 x t 的增量记为 ( ) ( ) ( ) 0 x t = x t − x t 也称函数的变分。由它引起的泛函的增量记作 ( ( ) ( )) ( ( )) 0 0 J = J x t +x t − J x t 如果 J 可以表为 ( ( ), ( )) ( ( ), ( )) 0 0 J = L x t x t + r x t x t 其中 L 为 x 的线性项,而 r 是 x 的高阶项,则称 L 为泛函在 ( ) 0 x t 的变分,记作 ( ( )) 0 J x t 。用变动的 x(t) 代替 ( ) 0 x t ,就有 J (x(t)) 。 泛函变分的一个重要形式是它可以表为对参数 的导数: 0 ( ( )) ( ( ) ( )) + = = J x t J x t x t (4) 这是因为当变分存在时,增量 J = J (x(t) + x) − J (x(t)) = L(x(t), x) + r(x(t), x) 根据 L 和 r 的性质有 L(x(t),x) =L(x(t),x) 0 ( ( ), ) lim ( ( ), ) lim 0 0 = = → → x x r x t x r x t x 所以 ( ) ( ) ( ) lim 0 0 J x x J x J x x + − + = → = ( , ) ( ) ( , ) ( , ) lim 0 L x x J x L x x r x x = = + = → 1.2 泛函极值的相关结论 1.2.1 泛函极值的变分表示 利用变分的表达式(4),可以得到有关泛函极值的重要结论。 泛函极值的变分表示:若 J (x(t)) 在 ( ) 0 x t 达到极值(极大或极小),则 J (x0 (t)) = 0 (5) 证明:对任意给定的 x , ( ) 0 J x +x 是变量 的函数,该函数在 = 0 处达到极值。根 据函数极值的必要条件知
aa(o+ac 再由(4)式,便可得到(5)式。 变分法的基本引理:p(x)∈C[x1,x2],Vm(x)∈C[x12x2],m(x1)=7(x2)=0,有 P(x)n(x)dx =0 则(x)=0,x∈[x,x2] 证明略。 12.2泛函极值的必要条件 考虑最简泛函(3),其中F具有二阶连续偏导数,容许函数类S取为满足端点条件为 固定端点(6)的二阶可微函数 x(t X, x (t1)=x (6) 泛函极值的必要条件:设泛函(3)在xt)∈S取得极值,则x(t)满足欧拉方程 F-F=0 (7) dt 欧拉方程推导:首先计算(3)式的变分: d=(x)+a()a=0 F(1,x(1)+aa(1)x(1)+aa(O)a=0dt [F(, x, x)ax+F(,x, x)ar]dt 对上式右端第二项做分布积分,并利用a(t0)=ax(t1r)=0,有 F(, x, x)ardt F(, x, x)adt dt 所以 f[.-边1 利用泛函极值的变分表示,得 IFr- FAdt=0 因为ax的任意性,及x(t)=x()=0,由基本引理,即得(7) (7)式也可写成 F.-F.-Fx=0 (8) 通常这是关于x(t)的二阶微分方程,通解中的任意常数由端点条件(6)确定 1.2.3几种特殊形式最简泛函的欧拉方程 i)F不依赖于x,即F=F(t,x)
4 ( 0 + ) 0 = 0 = J x x 再由(4)式,便可得到(5)式。 变分法的基本引理: ( ) [ , ] 1 2 x C x x , ( ) [ , ] 1 2 1 x C x x ,(x1 ) =(x2 ) = 0 ,有 2 1 ( ) ( ) 0 x x x x dx , 则 ( ) 0, [ , ] 1 2 x x x x 。 证明略。 1.2.2 泛函极值的必要条件 考虑最简泛函(3),其中 F 具有二阶连续偏导数,容许函数类 S 取为满足端点条件为 固定端点(6)的二阶可微函数。 0 0 x(t ) = x , f f x(t ) = x (6) 泛函极值的必要条件:设泛函(3)在 x(t)∈S 取得极值,则 x(t)满足欧拉方程 x − Fx = 0 dt d F (7) 欧拉方程推导:首先计算(3)式的变分: 0 ( ( ) ( )) + = = J J x t x t + + = = f t t F t x t x t x t x t dt 0 0 ( , ( ) ( ), ( ) ( )) = + f t t Fx t x x x Fx t x x x dt 0 [ ( , , ) ( , , ) ] 对上式右端第二项做分布积分,并利用 x(t 0 ) = x(t f ) = 0 ,有 = − f f t t x t t x F t x x xdt dt d F t x x xdt 0 0 ( , , ) ( , , ) , 所以 = − f t t x x F xdt dt d J F 0 [ ] 利用泛函极值的变分表示,得 [ ] 0 0 − = f t t x x F xdt dt d F 因为 x 的任意性,及 x(t 0 ) = x(t f ) = 0 ,由基本引理,即得(7)。 (7)式也可写成 F − F − F x − F x = 0 x tx xx xx (8) 通常这是关于 x(t)的二阶微分方程,通解中的任意常数由端点条件(6)确定。 1.2.3几种特殊形式最简泛函的欧拉方程 (i) F 不依赖于 x ,即 F = F(t, x)
这时F2≡0,欧拉方程为F(t,x)=0,这个方程以隐函数形式给出x(1),但它一般不 满足边界条件,因此,变分问题无解 (i)F不依赖x,即F=F(t,x) 欧拉方程为 F2(x)=0 将上式积分一次,便得首次积分F2(t,x)=C1,由此可求出x=(t,c1),积分后得到可能的 极值曲线族 「,c (i)F只依赖于ⅸ,即F=F(x) 这时F=0,F6=0,Fx=0,欧拉方程为 F=0 由此可设x=0或F=0,如果x=0,则得到含有两个参数的直线族x=ct+c2°另外 若F=0有一个或几个实根时,则除了上面的直线族外,又得到含有一个参数c的直线族 x=kt+c,它包含于上面含有两个参数的直线族x=ct+c2中,于是,在F=F(x)情 况下,极值曲线必然是直线族 (iv)F只依赖于x和x,即F=F(x,x) 这时有Fs=0,故欧拉方程为 F 此方程具有首次积分为 F-XF=CI 事实上,注意到F不依赖于t,于是有 F=Fx+F x-xF-xF=xF-F 1.3几个经典的例子 1.3.1最速降线问题 最速降线问题设A和B是铅直平面上不在同一铅直线上的两点,在所有连结A和 的平面曲线中,求一曲线,使质点仅受重力作用,初速度为零时,沿此曲线从A滑行至B的 时间最短。 解将A点取为坐标原点,B点取为B(x1,y),如图1。根据能量守恒定律,质点在曲
5 这时 Fx 0 ,欧拉方程为 Fx (t, x) = 0 ,这个方程以隐函数形式给出 x(t) ,但它一般不 满足边界条件,因此,变分问题无解。 (ii) F 不依赖 x ,即 F = F(t, x ) 欧拉方程为 F (t, x) = 0 dt d x 将上式积分一次,便得首次积分 1 F (t, x) c x = ,由此可求出 ( , ) 1 x = t c ,积分后得到可能的 极值曲线族 x (t c )dt = 1 , (iii) F 只依赖于 x ,即 F = F(x ) 这时 Fx = 0,Ftx = 0,Fxx = 0 ,欧拉方程为 x Fxx = 0 由此可设 x = 0 或 Fxx = 0 ,如果 x = 0 ,则得到含有两个参数的直线族 1 2 x = c t +c 。另外 若 Fxx = 0 有一个或几个实根时,则除了上面的直线族外,又得到含有一个参数 c 的直线族 x = kt+c ,它包含于上面含有两个参数的直线族 1 2 x = c t +c 中,于是,在 F = F(x ) 情 况下,极值曲线必然是直线族。 (iv) F 只依赖于 x 和 x ,即 F = F(x, x ) 这时有 Ftx = 0 ,故欧拉方程为 Fx − x Fxx − x Fxx = 0 此方程具有首次积分为 1 F xF c − x = 事实上,注意到 F 不依赖于 t ,于是有 ( − x ) = x + x − x − x = ( x − Fx ) = 0 dt d F x F dt d F xF F x F x xF x dt d 。 1.3 几个经典的例子 1.3.1 最速降线问题 最速降线问题 设 A 和 B 是铅直平面上不在同一铅直线上的两点,在所有连结 A 和 B 的平面曲线中,求一曲线,使质点仅受重力作用,初速度为零时,沿此曲线从 A 滑行至 B 的 时间最短。 解 将 A 点取为坐标原点,B 点取为 B(x1,y1),如图 1。根据能量守恒定律,质点在曲