自动控制原理电子教案 第9章最优控制 91最优控制的概念 设系统的状态方程为 k=f(x,u,1) (9.1) 性能指标的数学表达式一般可以表示为 J=O[x(t),t 1+L[x(o), u(t), t]dt (9.2) 所谓最优控制,就是要确定在[0,1中的最优控制a,将系统(9.1)的状 态从x(0)转移到x(r),或者x(t/)的一个集合,并使性能指标(9.2)最优。 9.2变分法与泛函的极值条件 1.泛函的概念 如果对于自变量t,存在一类函数{x(t)},对于每个函数x(t),有一个J值 与之对应,则变量J称为依赖于函数x(1)的泛函数,简称为泛函,记作J[x()。 如果泛函J[x]满足下列关系: Jax]=a/x] J[Ex+y]=J[x]+Jy] 式中,a是实数:x,y是函数空间中的函数,则泛函J是线性泛函。 2.泛函的变分 泛函Jx(m)的变量x()的变分,定义为b=x()-x’(),其中,x'(n)为 标称函数(即最优控制中的最优轨线),x(1)为x(m)邻域内与x()属于同 函数类的某一函数。 如果泛函Jx()的增量 Ax(o),ax]=J[x(t)+ax]-J[x(oI 可以表示为如下形式 △x()a]=Lx(,+x(,l (9.5) 其中,L[x()1是&的线性泛函,且当|→0时,所x(,a→0,则线性泛 函x(1),ah]称为泛函Jx(的变分(一阶变分),记作a。 由变分的定义可以看出,泛函的变分是一种线性映射,所以,它的运算规 则类似于函数的线性运算。设F和F2是x,和t的函数,则有如下的变分规 (1)δ(F1+F2)=F1+F2 (2)8(F,F2)=F,SF2+F28F1 (3)引F(x,=|F(x,M d 3.泛函的极值 若泛函Jx()在x=x*()附近的任一曲线上的值不小于Jx*(),即 M=Jx()-x*(l)≥0,则泛函J[x()在曲线x=x*(1)上达到极小值。 浙江工业大学自动化研究所1
自 动 控 制 原 理电 子 教 案 浙 江 工 业 大 学 自 动 化 研 究 所 1 第 9 章 最优控制 9.1 最优控制的概念 设系统的状态方程为 x&= f (x, u,t) (9.1) 性能指标的数学表达式一般可以表示为 ∫ = + f t t f f J x t t L x t u t t dt 0 θ[ ( ), ] [ ( ), ( ), ] (9.2) 所谓最优控制,就是要确定在[ , ] 0 f t t 中的最优控制u ,将系统(9.1)的状 态从 ( ) 0 x t 转移到 ( ) f x t ,或者 ( ) f x t 的一个集合,并使性能指标(9.2)最优。 9.2 变分法与泛函的极值条件 1.泛函的概念 如果对于自变量t ,存在一类函数{x(t)},对于每个函数 x(t) ,有一个 J 值 与之对应,则变量 J 称为依赖于函数 x(t) 的泛函数,简称为泛函,记作 J[x(t)]。 如果泛函 J[x]满足下列关系: [ ] [ ] [ ] [ ] [ ] J x y J x J y J ax aJ x + = + = (9.3) 式中, a 是实数; x, y 是函数空间中的函数,则泛函 J 是线性泛函。 2.泛函的变分 泛函 J[x(t)]的变量 x(t) 的变分δx ,定义为 ( ) ( ) * δx = x t − x t ,其中, ( ) * x t 为 一标称函数(即最优控制中的最优轨线), x(t) 为 ( ) * x t 邻域内与 ( ) * x t 属于同 一函数类的某一函数。 如果泛函 J[x(t)]的增量 ∆J[x(t),δx] = J[x(t) +δx]− J[x(t)] (9.4) 可以表示为如下形式 ∆J[x(t),δx] = L[x(t),δx]+ β[x(t),δx] δx (9.5) 其中,L[x(t),δx]是δx 的线性泛函,且当 δx → 0 时,β[x(t),δx] → 0 ,则线性泛 函 L[x(t),δx]称为泛函 J[x(t)]的变分(一阶变分),记作δJ 。 由变分的定义可以看出,泛函的变分是一种线性映射,所以,它的运算规 则类似于函数的线性运算。设 F1 和 F2 是 x ,x&和t 的函数,则有如下的变分规 则: (1) 1 2 1 2 δ (F + F ) = δF +δF (2) 1 2 1 2 2 1 δ (F F ) = F δF + F δF (3) F x x t dt F x x t dt ∫ ∫ δ ( , &, ) = δ ( , &, ) (4) x dt d δx&= δ 3.泛函的极值 若泛函 J[x(t)] 在 x = x *(t) 附近的任一曲线上的值不小于 J[x*(t)] ,即 ∆J = J[x(t)]− J[x *(t)] ≥ 0 ,则泛函 J[x(t)]在曲线 x = x *(t) 上达到极小值
自动控制原理电子教案 泛函Jx(门在曲线x=x*(t)上达到极小值的必要条件为(证明略) d(x*,△)=J(x*+Nx (9.6) 在等式约束下的泛函极值问题,称为条件泛函极值问题。对于条件泛函极 值问题,可以应用拉格朗日乘子法将其转化为无约束条件极值问题。 9.3变分法求解无约束最优控制问题 设系统的状态方程为 )=x(n),u(t),n (9.7) 性能指标为 J=x(r)1+「4xO.0 (9.8) 最优控制问题就是以状态方程(97)为约束,确定使泛函(9.8)达到极 值所要满足的必要条件。在上面的最优控制问题中,因为对控制变量u(1)没有 约束,所以通常称为无约束最优控制问题 无约束最优控制问题是一个求有等式约束的泛函极值问题,可以采用拉 格朗日乘子法把有约束条件问题转化为无约束条件问题。 构造增广泛函为 J=x()171+2xa(.1+U(0)a(,)-)d (9 构造哈密顿函数为 式中,λ∈R"为拉格朗日乘子向量。则增广泛函为 J=x()17+{Hxu,1,1-28m (9.11) 设初始时刻t及其状态给定为x(t0)=xo。根据终端状态边界条件,可按以下儿 种情况讨论 1.t给定,终端自由,即x()任意 增广泛函J为 J=x(7)+[(x1,2.0)-是4 (9.12) 取J的一阶变分并令其为零,得 rafa,rt '&+(at) )6λ--i8=0 由于 rx的=- (9.14) 将式(9.14)代入式(9.13),并注意到&(t0)=0,可得 +8+2)+(B2-8M=0(.15 由于在上式中,tr,,b和a都是任意的,并且相互独立,所以,增广性 能指标泛函J的一阶变分为零,即最优控制问题(9.7),(9.8)取极值的 必要条件为 正则方程 浙江工业大学自动化研究所
自 动 控 制 原 理电 子 教 案 浙 江 工 业 大 学 自 动 化 研 究 所 2 泛函 J[x(t)]在曲线 x = x *(t) 上达到极小值的必要条件为(证明略) ( *,∆ ) = ( *+ε∆ ) ε =0 = 0 ε δ J x x d d J x x (9.6) 在等式约束下的泛函极值问题,称为条件泛函极值问题。对于条件泛函极 值问题,可以应用拉格朗日乘子法将其转化为无约束条件极值问题。 9.3 变分法求解无约束最优控制问题 设系统的状态方程为 x&(t) = f [x(t), u(t),t] 0 0 x(t ) = x (9.7) 性能指标为 ∫ = + f t t f f J x t t L x t u t t dt 0 θ[ ( ), ] [ ( ), ( ), ] (9.8) 最优控制问题就是以状态方程(9.7)为约束,确定使泛函(9.8)达到极 值所要满足的必要条件。在上面的最优控制问题中,因为对控制变量u(t) 没有 约束,所以通常称为无约束最优控制问题。 无约束最优控制问题是一个求有等式约束的泛函极值问题,可以采用拉 格朗日乘子法把有约束条件问题转化为无约束条件问题。 构造增广泛函为 ∫ = + + − f t t T a f f J x t t L x t u t t f x t u t t x t dt 0 θ[ ( ), ] { [ ( ), ( ), ] λ [ ( ( ), ( ), ) &( )]} (9.9) 构造哈密顿函数为 H(x, u, ,t) L(x, u,t) f (x, u,t) T λ = + λ (9.10) 式中, n λ ∈ R 为拉格朗日乘子向量。则增广泛函为 = + ∫ − f t t T J a x t f t f H x u t x dt 0 θ[ ( ), ] { [ , ,λ, ] λ &} (9.11) 设初始时刻 0t 及其状态给定为 0 0 x(t ) = x 。根据终端状态边界条件,可按以下几 种情况讨论 1. f t 给定,终端自由,即 ( ) f x t 任意 增广泛函 a J 为 ∫ = + − f t t T J a x t f H x u t x dt 0 θ[ ( )] [ ( , ,λ, ) λ &] (9.12) 取 a J 的一阶变分并令其为零,得 ( ) [( ) ( ) ( ) ] 0 0 − − = ∂ ∂ + ∂ ∂ + ∂ ∂ + ∂ ∂ = = ∫ f f t t T T T T T t t T a x x dt H u u H x x H x x J δλ &δλ λ δ& λ δ δ δ θ δ (9.13) 由于 ∫ ∫ = − f f f t t t T t T t t T xdt x xdt 0 0 0 λ δ& λ δ λ &δ (9.14) 将式(9.14)代入式(9.13),并注意到δx(t0 ) = 0 ,可得 ( ) [( ) ( ) ( ) ] 0 0 − = ∂ ∂ + ∂ ∂ + + ∂ ∂ − + ∂ ∂ = = ∫ f f t t T T T t t T a x dt H u u H x x H x x J δλ λ λ δ λ δ δ θ δ & & (9.15) 由于在上式中, f t ,δx ,δu 和δλ 都是任意的,并且相互独立,所以,增广性 能指标泛函 a J 的一阶变分为零,即最优控制问题(9.7),(9.8)取极值的 必要条件为 正则方程
自动控制原理电子教案 状态方程H(x,,A) (9.16) 伴随方程= aH(,u, 1, 1) (9.17) 控制方程 aH(x, u, 1, 0) (9.18) 横截条件 (tr)= ae[x(t ) (9.19) 联立求解上述正则方程和控制方程,就可求得性能指标达到极值时的最优 控制u*(t)、最优状态轨线x*()及最优协态轨线λ*()。 例9.1已知系统的状态方程为 )=u(t) 初始条件为 x(0)=x0 求最优控制u*(t),使性能指标 为最小。 解本题为tr给定、终端自由的最优控制问题。由于控制变量不受约束, 所以,可以用变分法求解。构造哈密顿函数为 H(x,u, A 由伴随方程(9.17)得 ah a u*+Au)=0 因此,A=常数。由横截条件(9.19)得 ae[x(t) cx(t)]=cx(tr) x(t 由控制方程(9.18)得 将u*代入状态方程,得 -cx(ty) 上面这个微分方程的解为 tr时,有 x()=-cx(tr-0)+x(0) 所以 x(0) 最优控制为 (t 1+c(r-t0) 浙江工业大学自动化研究所
自 动 控 制 原 理电 子 教 案 浙 江 工 业 大 学 自 动 化 研 究 所 3 状态方程 λ λ ∂ ∂ = H(x, u, ,t) x& (9.16) 伴随方程 x H x u t ∂ ∂ = − ( , , λ, ) λ & (9.17) 控制方程 0 ( , , , ) = ∂ ∂ u H x u λ t (9.18) 横截条件 ( ) [ ( )] ( ) f f f x t x t t ∂ ∂ = θ λ (9.19) 联立求解上述正则方程和控制方程,就可求得性能指标达到极值时的最优 控制u *(t) 、最优状态轨线 x*(t) 及最优协态轨线λ *(t) 。 例 9.1 已知系统的状态方程为 x&(t) = u(t) 初始条件为 0 0 x(t ) = x 求最优控制u *(t) ,使性能指标 ∫ = + f t t f J cx t u dt 0 2 2 2 1 ( ) 2 1 , c > 0 为最小。 解 本题为 f t 给定、终端自由的最优控制问题。由于控制变量不受约束, 所以,可以用变分法求解。构造哈密顿函数为 H x u λ t = u + λu 2 2 1 ( , , , ) 由伴随方程(9.17)得 ) 0 2 1 ( 2 + = ∂ ∂ = − ∂ ∂ = − u u x x H λ & λ 因此,λ = 常数。由横截条件(9.19)得 , ( )] ( ) 2 1 [ ( ) ( ) [ ( )] ( ) 2 f f f f f f cx t cx t x t x t x t t = ∂ ∂ = ∂ ∂ = θ λ 由控制方程(9.18)得 = + = 0 ∂ ∂ u λ u H 即 * ( ) f u = −λ = −cx t 将u * 代入状态方程,得 ( ) f x&= u = −cx t 上面这个微分方程的解为 ( ) ( )( ) ( ) 0 0 x t cx t t t x t = − f − + 当 f t = t 时,有 ( ) ( )( ) ( ) 0 0 x t cx t t t x t f = − f f − + 所以 1 ( ) ( ) ( ) 0 0 c t t x t x t f f + − = 最优控制为 1 ( ) ( ) * ( ) 0 0 c t t cx t u cx t f f + − = − = −
自动控制原理电子教案 由本例的性能指标形式可知,性能指标只存在极小值,所以,最优控制 *()将使性能指标为最小。因此最优性能指标为 2 to) 2[+c(t -to)I =21+qu -lo 2.t给定,终端约束 设终端约束为 Mx(n),t]=Mx(t)]=0 (9.20) 式中,M∈R,即终端状态x()可沿规定的边界曲线移动。构造增广泛函Ja 为 J=明x()+Mx()+1(xx)+2Uf(x2x)-得}山 =Ox(r)+yMx()+[H(x2,D-(9.21) 式中,v∈R。对增广泛函J取一阶变分并令其为零,经过与上面类似的推导 得 a0 aM d,= +(H++(H8+(.-8队k=D(9.2 由于上式中b8(r),a,b和都是任意的,并且相互独立,所以增广性能 指标泛函Ja的一阶变分为零,即最优控制问题(9.7),(9.8)取极值的必 要条件为 正则方程 状态方程 aH(, u, a, 1) (9.23) 伴随方程心H(x,,A,1) (9.24) 控制方程 aH(x,u, a, 1) 0 (9.25) 边界条件 x(t0)=x0 MIx(t]=0 横截条件 06(x)OM(x) (9.27) 例9.2已知系统的状态方程为 4()=x2( k(1)=-x2(t)+u() 初始条件为 x1(0)=0 x2(0)=0 终端约束条件为 x1(2)+5x2(2)=15 求最优控制u*(t),使性能指标 浙江工业大学自动化研究所
自 动 控 制 原 理电 子 教 案 浙 江 工 业 大 学 自 动 化 研 究 所 4 由本例的性能指标形式可知,性能指标只存在极小值,所以,最优控制 u *(t) 将使性能指标为最小。因此最优性能指标为 ∫ = + f t t f J cx t u dt 0 2 2 2 1 ( ) 2 1 1 ( ) ( ) 2 1 ( ) [1 ( )] ( ) 2 1 [1 ( )] ( ) 2 1 0 0 2 0 2 0 0 2 2 2 0 0 2 c t t cx t t t c t t c x t c t t cx t f f f f + − = − + − + + − = 2. f t 给定,终端约束 设终端约束为 M[x(t f ),t f ] = M[x(t f )] = 0 (9.20) 式中, q M ∈ R ,即终端状态 ( ) f x t 可沿规定的边界曲线移动。构造增广泛函 a J 为 ∫ = + + + − f t t T f T a f J x t v M x t L x u t f x u t x dt 0 θ[ ( )] [ ( )] { ( , , ) λ [ ( , , ) &]} ∫ = + + − f t t T f T f x t v M x t H x u t x dt 0 θ[ ( )] [ ( )] [ ( , , λ, ) λ &] (9.21) 式中, q v ∈ R 。对增广泛函 a J 取一阶变分并令其为零,经过与上面类似的推导, 得 [( ) ( ) ( ) ] 0 ( ) 0 ∫ − = ∂ ∂ + ∂ ∂ + + ∂ ∂ + ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − ∂ ∂ + ∂ ∂ = = f f t t T T T t t T T a x dt H u u H x x H v x x M x J δλ λ λ δ δ λ δ θ δ & & (9.22) 由于上式中 x( ) f δ t ,δx ,δu 和δλ 都是任意的,并且相互独立,所以增广性能 指标泛函 a J 的一阶变分为零,即最优控制问题(9.7),(9.8)取极值的必 要条件为 正则方程 状态方程 λ λ ∂ ∂ = H(x, u, ,t) x& (9.23) 伴随方程 x H x u t ∂ ∂ = − ( , , λ, ) λ & (9.24) 控制方程 0 ( , , , ) = ∂ ∂ u H x u λ t (9.25) 边界条件 0 0 x(t ) = x M[x(t f )] = 0 (9.26) 横截条件 f t t T f v x M x x x t = ∂ ∂ + ∂ ∂ = ) ] ( ) ( ( ) ( ) [ θ λ (9.27) 例 9.2 已知系统的状态方程为 ( ) ( ) 1 2 x& t = x t ( ) ( ) ( ) 2 2 x& t = −x t + u t 初始条件为 x1 (0) = 0 x2 (0) = 0 终端约束条件为 x1 (2) + 5x2 (2) = 15 求最优控制u *(t) ,使性能指标
x(2)-52+{x2(2)-212+[an2() 为最小 解本题为tr给定、终端受约束的最优控制问题。由于控制变量不受约束, 所以可以用变分法求解。构造哈密顿函数为 +(A1-A2)x2 1(2)+5x2(2)-15=0 由于 ()=x2( 唇 A1(1)= ax n2(0) +A,=0 l(t)=-2()=-c2e′ 所以 x2(1)= ce -Cl 由初始条件x1(0)=0,x2(O)=0,得 0 因为 x1(2)=-c3e 由横截条件得 M A1(2)=x1(2)-5+v ax,(t)ax(tr) aM A2(t) 2(t,)ax2(r) 将x1(2)和x2(2)代入上式,得 5 求解以c1,C2,c3,C4和y作为未知数的联立方程组 -c1-0.5c2+c3=0 CA=15 3c1-0.5e2c2 浙江工业大学自动化研究
自 动 控 制 原 理电 子 教 案 浙 江 工 业 大 学 自 动 化 研 究 所 5 ∫ = − + − + 2 0 2 2 2 2 1 ( ) 2 1 [ (2) 2] 2 1 [ (2) 5] 2 1 J x x u t dt 为最小。 解 本题为 f t 给定、终端受约束的最优控制问题。由于控制变量不受约束, 所以可以用变分法求解。构造哈密顿函数为 H u x u 1 2 2 2 2 ( ) 2 1 = + λ − λ + λ 2 2 2 1 [ (2) 2] 2 1 [ (2) 5] 2 1 θ = x − + x − M = x1 (2) + 5x2 (2) −15 = 0 由于 ∂λ ∂ = H x& , ( ) ( ) 1 2 x& t = x t , ( ) ( ) ( ) 2 2 x& t = −x t + u t 0 1 1 = ∂ ∂ = − x H λ & , 1 1 λ (t) = c 2 1 2 λ 2 = λ − λ ∂ ∂ = − x & H , 2 2 1 (t) c e c t λ = + = + 2 = 0 ∂ ∂ u λ u H , 2 2 1 u(t) (t) c e c t = −λ = − − 所以 2 3 2 1 2 1 x (t) c e c e c t t = − − − 1 3 2 1 4 2 1 x (t) c e c e c t c t t = − − − + − 由初始条件 x1 (0) = 0, x2 (0) = 0 ,得 −0.5c2 − c3 + c4 = 0 −c1 − 0.5c2 + c3 = 0 因为 1 4 2 2 2 1 3 2 2 1 x (2) = −c e − c e − c + c − 1 2 2 2 2 3 2 1 x (2) = c e − c e − c − 由横截条件得 ( ) ( ) ( ) ( ) 1 1 1 f f f f v t x t M x t t ∂ ∂ + ∂ ∂ = θ λ 1 1 5 1 λ (2) = x (2) − + v = c ( ) ( ) ( ) ( ) 2 2 2 f f f f v t x t M x t t ∂ ∂ + ∂ ∂ = θ λ 2 2 2 2 5 1 2 λ (2) = x (2) − + v = c + c e 将 (2) 1x 和 (2) 2 x 代入上式,得 3 0.5 3 4 5 2 2 2 − 1 − − + + = − c e c e c c v 2 1.5 3 5 2 2 2 2 − 1 − + + = − c e c e c v 求解以c c c c 和v 1 2 3 4 , , , 作为未知数的联立方程组 −0.5c2 − c3 + c4 = 0 −c1 − 0.5c2 + c3 = 0 7 3 4 3 4 15 2 2 2 − 1 − + + = − c e c e c c 3 0.5 3 4 5 2 2 2 − 1 − − + + = − c e c e c c v