第十八章动态优化模型 动态过程的另一类问题是所谓的动态优化问题,这类问题一般要归结为求最优控制 函数使某个泛函达到极值。当控制函数可以事先确定为某种特殊的函数形式时,问题又 简化为求普通函数的极值。求解泛函极值问题的方法主要有变分法和最优控制理论方 §1变分法简介 变分法是研究泛函极值问题的一种经典数学方法,有着广泛的应用。下面先介绍变 分法的基本概念和基本结果,然后介绍动态系统最优控制问题求解的必要条件和最大值 原理。 1.1变分法的基本概念 1.1.1泛函 设S为一函数集合,若对于每一个函数x(1)∈S有一个实数J与之对应,则称J是 对应在S上的泛函,记作J(x()。S称为J的容许函数集。 通俗地说,泛函就是“函数的函数”。 例如对于xy平面上过定点A(x1,y1)和B(x2,y2)的每一条光滑曲线y(x),绕x轴 旋转得一旋转体,旋转体的侧面积是曲线y(x)的泛函J(y(x))。由微积分知识不难写 出 J(y(x))= 2ry(x)v1+y'(x)d (1) 容许函数集可表示为 S=t(lyxECIxx,ly(x=y,y(x,=yl (2) 最简单的一类泛函表为 被积函数F包含自变量t,未知函数x及导数文。(1)式是最简泛函。 1.1.2泛函的极值 泛函J(x(1)在x0(1)∈S取得极小值是指,对于任意一个与x0(1)接近的 x()∈S,都有J(x(1)≥J(x0(1)。所谓接近,可以用距离d(x()x0()<E来度量, 而距离定义为 d(x(),x0()=max{x(1)-x0(0)lx(m)-x(1)} 泛函的极大值可以类似地定义。x0(D)称为泛函的极值函数或极值曲线。 1.1.3泛函的变分 如同函数的微分是增量的线性主部一样,泛函的变分是泛函增量的线性主部。作为 泛函的自变量,函数x(1)在x0(1)的增量记为 x(1)=x(1)-x0(1) 也称函数的变分。由它引起的泛函的增量记作 △J=J(x0(1)+bt(D)-J(x0(1) 如果△J可以表为
-218- 第十八章 动态优化模型 动态过程的另一类问题是所谓的动态优化问题,这类问题一般要归结为求最优控制 函数使某个泛函达到极值。当控制函数可以事先确定为某种特殊的函数形式时,问题又 简化为求普通函数的极值。求解泛函极值问题的方法主要有变分法和最优控制理论方 法。 §1 变分法简介 变分法是研究泛函极值问题的一种经典数学方法,有着广泛的应用。下面先介绍变 分法的基本概念和基本结果,然后介绍动态系统最优控制问题求解的必要条件和最大值 原理。 1.1 变分法的基本概念 1.1.1 泛函 设 S 为一函数集合,若对于每一个函数 x(t)∈ S 有一个实数 J 与之对应,则称 J 是 对应在 S 上的泛函,记作 J (x(t)) 。 S 称为 J 的容许函数集。 通俗地说,泛函就是“函数的函数”。 例如对于 xy 平面上过定点 ( , ) 1 1 A x y 和 ( , ) 2 2 B x y 的每一条光滑曲线 y(x) ,绕 x 轴 旋转得一旋转体,旋转体的侧面积是曲线 y(x) 的泛函 J ( y(x)) 。由微积分知识不难写 出 J y x y x y x dx x x ( ( )) 2 ( ) 1 ' ( ) 2 1 2 ∫ = π + (1) 容许函数集可表示为 { ( ) | ( ) [ , ], ( ) , ( ) } 1 2 1 1 2 2 1 S = y x y x ∈C x x y x = y y x = y (2) 最简单的一类泛函表为 ∫ = 2 1 ( ( )) ( , , ) t t J x t F t x x& dt (3) 被积函数 F 包含自变量t ,未知函数 x 及导数 x& 。(1)式是最简泛函。 1.1.2 泛函的极值 泛函 J (x(t)) 在 x0 (t)∈ S 取得极小值是指,对于任意一个与 ( ) 0 x t 接近的 x(t)∈ S ,都有 ( ( )) ( ( )) 0 J x t ≥ J x t 。所谓接近,可以用距离 ( ( ), ( )) < ε 0 d x t x t 来度量, 而距离定义为 ( ( ), ( )) max{| ( ) ( ) |,| ( ) ( ) |} 0 0 0 1 2 d x t x t x t x t x t x t t t t = − & − & ≤ ≤ 泛函的极大值可以类似地定义。 ( ) 0 x t 称为泛函的极值函数或极值曲线。 1.1.3 泛函的变分 如同函数的微分是增量的线性主部一样,泛函的变分是泛函增量的线性主部。作为 泛函的自变量,函数 x(t) 在 ( ) 0 x t 的增量记为 ( ) ( ) ( ) 0 δ x t = x t − x t 也称函数的变分。由它引起的泛函的增量记作 ( ( ) ( )) ( ( )) 0 0 ΔJ = J x t +δx t − J x t 如果 ΔJ 可以表为
△=L(x0(1),ax(t)+r(x0(D),ax(1) 其中L为&x的线性项,而r是&x的高阶项,则L称为泛函在x0(1)的变分,记作 a(x0(1)。用变动的x()代替x0(D),就有a/(x() 泛函变分的一个重要形式是它可以表为对参数a的导数: a(x()=J(x()+a(m)a=0 (4) 这是因为当变分存在时,增量 A=J((0+aax)-J(x(D)=L(x(o), aax)+r(x(o), aar) 根据L和r的性质有 L(x(o),aax)=aL(x(o), ax) r(x(0),aar) lim rr(), adr) 6x=0 r 所以 J(x+aax )a==lim a lim L(x, a&x)+r(x,aax),L(x, ax)=a(x) 1.1.4极值与变分 利用变分的表达式(4)可以得到泛函极值与变分的关系: 若J(x()在x0(1)达到极值(极大或极小),则 (x0(1)=0 这是因为对任意给定的&,J/(x0+aoi)是变量a的函数,该函数在a=0处达到极 值。根据函数极值的必要条件知 于是由(4)式直接得到(5)式。 1.1.5.变分法的基本引理 引理(x)∈C[x1,x2],Vm(x)∈C[x1,x2],n(x1)=m(x2)=0,有 则(x)≡0,x∈[x1,x2] 12无约束条件的泛函极值 求泛函 J= F(,x(o),i(o))dt 的极值,一般是用泛函极值的必要条件去寻找一条曲线x(1),使给定的二阶连续可微 函数F沿该曲线的积分达到极值。常称这条曲线为极值曲线(或轨线),记为x(1)。 12.1端点固定的情况 设容许曲线x(1)满足边界条件
-219- ( ( ), ( )) ( ( ), ( )) 0 0 ΔJ = L x t δx t + r x t δx t 其中 L 为δx 的线性项,而 r 是δx 的高阶项,则 L 称为泛函在 ( ) 0 x t 的变分,记作 ( ( )) 0 δJ x t 。用变动的 x(t) 代替 ( ) 0 x t ,就有δJ (x(t))。 泛函变分的一个重要形式是它可以表为对参数α 的导数: 0 ( ( )) ( ( ) ( )) + = ∂ ∂ = αδ α α δJ x t J x t x t (4) 这是因为当变分存在时,增量 ΔJ = J (x(t) +αδx) − J (x(t)) = L(x(t),αδx) + r(x(t),αδx) 根据 L 和 r 的性质有 L(x(t),αδx) =αL(x(t),δx) 0 ( ( ), ) lim ( ( ), ) lim 0 0 = = → → x x r x t x r x t x δ αδ αδ α αδ α α 所以 α αδ αδ α α α ( ) ( ) ( ) lim 0 0 J x x J x J x x + − + = ∂ ∂ → = ( , ) ( ) ( , ) ( , ) lim 0 L x x J x L x x r x x δ δ α αδ αδ α = = + = → 1.1.4 极值与变分 利用变分的表达式(4)可以得到泛函极值与变分的关系: 若 J (x(t)) 在 ( ) 0 x t 达到极值(极大或极小),则 δJ (x0 (t)) = 0 (5) 这是因为对任意给定的δx , ( ) 0 J x +αδx 是变量α 的函数,该函数在α = 0 处达到极 值。根据函数极值的必要条件知 ( 0 + ) 0 = 0 ∂ ∂ αδ α = α J x x 于是由(4)式直接得到(5)式。 1.1.5. 变分法的基本引理 引理 ( ) [ , ] 1 2 ϕ x ∈C x x , ( ) [ , ] 1 2 1 ∀η x ∈C x x , ( ) ( ) 0 η x1 =η x2 = ,有 ∫ ≡ 2 1 ( ) ( ) 0 x x ϕ x η x dx , 则 ( ) 0, [ , ] 1 2 ϕ x ≡ x ∈ x x 。 1.2 无约束条件的泛函极值 求泛函 ∫ = f t t J F t x t x t dt 0 ( , ( ), &( )) (6) 的极值,一般是用泛函极值的必要条件去寻找一条曲线 x(t) ,使给定的二阶连续可微 函数 F 沿该曲线的积分达到极值。常称这条曲线为极值曲线(或轨线),记为 ( ) * x t 。 1.2.1 端点固定的情况 设容许曲线 x(t) 满足边界条件
x(0)=x0,x()=x (7) 且二次可微 首先计算(6)式的变分: J(x(r)+aar()aso rDF((+a&r(0), (0+ax()lasodr [F(,x,x)+F1(t,x,x)61t 对上式右端第二项做分布积分,并利用a(t0)=bx(t1)=0,有 F2(,x,x) h=- F(t, x, x)adt 再代回到(8)式,并利用泛函取极值的必要条件,有 d [F-F JOrdt=0 dt 因为x的任意性,及m(10)=(1)=0,所以由基本引理得到著名的欧拉方程 F-F=0 (9) 它是这类最简泛函取极值的必要条件。 (9)式又可记作 F-F F.x=0 通常这是x(t)的二阶微分方程,其通解的两个任意常数由(7)式中的两个端点条件确 122最简泛函的几种特殊情形 (i)F不依赖于文,即F=F(t,x) 这时F=0,欧拉方程为F2(,x)=0,这个方程以隐函数形式给出x(1),但它 般不满足边界条件,因此,变分问题无解。 (i)F不依赖x,即F=F(t,x) 欧拉方程为 (t,x)=0 将上式积分一次,便得首次积分F(t,x)=C1,由此可求出x=p(1,C1),积分后得到 可能的极值曲线族 x=∫och (i)F只依赖于x,即F=F(x) 这时F2=0,F=0,Fx=0,欧拉方程为 由此可设=0或F=0,如果x=0,则得到含有两个参数的直线族x=c1+c2
-220- 0 0 x(t ) = x , f f x(t ) = x (7) 且二次可微。 首先计算(6)式的变分: 0 ( ( ) ( )) + = ∂ ∂ = αδ α α δJ J x t x t ∫ + + = ∂ ∂ = f t t F t x t x t x t x t dt 0 0 ( , ( ) ( ), ( ) ( )) αδ αδ α α & & ∫ = + f t t Fx t x x x Fx t x x x dt 0 [ ( , , &) ( , , &) &] δ & δ (8) 对上式右端第二项做分布积分,并利用δx(t0 ) = δx(t f ) = 0 ,有 ∫ ∫ = − f f t t x t t x F t x x xdt dt d F t x x xdt 0 0 & ( , , &)δ& & ( , , &)δ , 再代回到(8)式,并利用泛函取极值的必要条件,有 ∫ = − = f t t x x F xdt dt d J F 0 δ [ & ]δ 0 因为δx 的任意性,及δx(t0 ) = δx(t f ) = 0 ,所以由基本引理得到著名的欧拉方程 x − Fx = 0 dt d F & (9) 它是这类最简泛函取极值的必要条件。 (9)式又可记作 Fx − Ftx& − Fxx& x& − Fx&x& & x& = 0 (10) 通常这是 x(t) 的二阶微分方程,其通解的两个任意常数由(7)式中的两个端点条件确 定。 1.2.2 最简泛函的几种特殊情形 (i) F 不依赖于 x& ,即 F = F(t, x) 这时 Fx& ≡ 0,欧拉方程为 Fx (t, x) = 0,这个方程以隐函数形式给出 x(t) ,但它一 般不满足边界条件,因此,变分问题无解。 (ii) F 不依赖 x ,即 F = F(t, x&) 欧拉方程为 F (t, x) = 0 dt d x & & 将上式积分一次,便得首次积分 1 F (t, x) c x& & = ,由此可求出 ( , )1 x& = ϕ t c ,积分后得到 可能的极值曲线族 x ( ) t c dt ∫ = 1 ϕ , (iii) F 只依赖于 x& ,即 F = F(x&) 这时 Fx = 0,Ftx& = 0,Fxx& = 0,欧拉方程为 & x&Fx&x& = 0 由此可设 & x& = 0 或 Fx&x& = 0,如果 & x& = 0 ,则得到含有两个参数的直线族 1 2 x = c t + c
另外若F=0有一个或几个实根时,则除了上面的直线族外,又得到含有一个参数c的 直线族x=k+c,它包含于上面含有两个参数的直线族x=c1t+c2中,于是,在 F=F(x)情况下,极值曲线必然是直线族 (iv)F只依赖于x和x,即F=F(x,x) 这时有F=0,故欧拉方程为 F-xF.-xF.=0 此方程具有首次积分为 F-xF.=CI 事实上,注意到F不依赖于t,于是有 XF=Fx+F x-xI F=X(Fr-F) dt 例1(最速降线问题)最速降线问题是历史上变分法开始发展的第一个问题。它是 约翰·贝努里(J. Bernoulli)于1696年提出的。问题的提法是这样的:设A和B是铅 直平面上不在同一铅直线上的两点,在所有连结A和B的平面曲线中,求一曲线,当 质点仅受重力作用,且初速为零,沿此曲线从A滑行至B时,使所需时间最短。 解将A点取为坐标原点,x轴水平向右,y轴垂直向下,B点为B(x2y2)。根 据能量守恒定律,质点在曲线y(x)上任一点处的速度,满足(s为弧长) Ids 将d=√l+y2(x)d代入上式得 于是质点滑行时间应表为y(x)的泛函 J(y(x))= dx 2 端点条件为 (0)=0,y(x2)=y2 最速降线满足欧拉方程,因为 FO,y)= y 不含自变量x,所以方程(10)可写作 F.-Fy-Frvy=0 等价于 (F-yF)=0 作一次积分得
-221- 另外若 Fx&x& = 0有一个或几个实根时,则除了上面的直线族外,又得到含有一个参数c 的 直线族 x = kt + c ,它包含于上面含有两个参数的直线族 1 2 x = c t + c 中,于是,在 F = F(x&) 情况下,极值曲线必然是直线族。 (iv) F 只依赖于 x 和 x& ,即 F = F(x, x&) 这时有 Ftx& = 0 ,故欧拉方程为 Fx − x&Fxx& − & x&Fx&x& = 0 此方程具有首次积分为 1 F xF c − & x& = 事实上,注意到 F 不依赖于t ,于是有 ( − x ) = x + x − x − x = ( x − Fx ) = 0 dt d F x F dt d F xF F x F x xF x dt d & & & & & & & && && & & 。 例 1 (最速降线问题)最速降线问题是历史上变分法开始发展的第一个问题。它是 约翰·贝努里(J. Bernoulli)于 1696 年提出的。问题的提法是这样的:设 A 和 B 是铅 直平面上不在同一铅直线上的两点,在所有连结 A 和 B 的平面曲线中,求一曲线,当 质点仅受重力作用,且初速为零,沿此曲线从 A 滑行至 B 时,使所需时间最短。 解 将 A 点取为坐标原点,x 轴水平向右, y 轴垂直向下,B 点为 ( , ) 2 2 B x y 。根 据能量守恒定律,质点在曲线 y(x) 上任一点处的速度 dt ds 满足( s 为弧长) mgy dt ds m ⎟ = ⎠ ⎞ ⎜ ⎝ ⎛ 2 2 1 将ds 1 y' (x) dx 2 = + 代入上式得 dx gy y dt 2 1 ' 2 + = 于是质点滑行时间应表为 y(x) 的泛函 dx gy y J y x x ∫ + = 2 0 2 2 1 ' ( ( )) 端点条件为 2 2 y(0) = 0, y(x ) = y 最速降线满足欧拉方程,因为 y y F y y 2 1 ' ( , ') + = 不含自变量 x ,所以方程(10)可写作 Fy − Fyy' y'−Fy' y' y' '= 0 等价于 (F − y' Fy' ) = 0 dx d 作一次积分得
令y=cg,则方程化为 ,sin=-(1-cos0 又因 dx (-cos0)d8 积分之,得 由边界条件y(0)=0,可知c2=0,故得 x=(0-sin8 这是摆线(圆滚线)的参数方程,其中常数c1可利用另一边界条件y(x2)=y2来确定。 例2最小旋转面问题 J((x)=2r.y(x)vl+y(x)dx S=lyECIx,x2l, y(x)=y,y(x2)=y2) 解因F=y√1+y2不包含x,故有首次积分 化简得 令y=sh,代入上式,y=ch+sht=cht 由于d shit C 积分之,得x=c1t+c2 消去1,就得到y 这是悬链线方程 123最简泛函的推广 最简泛函取极值的必要条件可以推广到其它情况 (i)含多个函数的泛函
-222- 1 2 y(1+ y' ) = c 令 , 2 ' θ y = ctg 则方程化为 (1 cos ) 2 2 sin 1 ' 2 1 2 1 1 θ θ = = − + = c c y c y 又因 θ θ θ θ θ θ d c ctg c d y dy dx (1 cos ) 2 2 2 cos 2 sin ' 1 1 = = = − 积分之,得 2 1 ( sin ) 2 c c x = θ − θ + 由边界条件 y(0) = 0 ,可知 0 c2 = ,故得 ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ = − = − (1 cos ). 2 ( sin ) 2 1 1 θ θ θ c y c x 这是摆线(圆滚线)的参数方程,其中常数 1 c 可利用另一边界条件 2 2 y(x )= y 来确定。 例 2 最小旋转面问题 J y x y x y x dx x x ( ( )) 2 ( ) 1 ' ( ) 2 1 2 ∫ = π + { | [ , ], ( ) , ( ) } 1 2 1 1 2 2 1 S = y y ∈C x x y x = y y x = y 解 因 1 ' 2 F = y + y 不包含 x ,故有首次积分 1 2 2 ' 1 ' ' ' 1 ' ' c y y F y F y y y y y = + − = + − 化简得 2 1 y = c 1+ y' 令 y'= sht ,代入上式, y c sh t c cht 1 2 = 1 1+ = 由于 c dt sht c shtdt y dy dx 1 1 ' = = = 积分之,得 1 2 x = c t + c 消去t ,就得到 1 2 1 c x c y c ch − = 。 这是悬链线方程。 1.2.3 最简泛函的推广 最简泛函取极值的必要条件可以推广到其它情况。 (ⅰ)含多个函数的泛函