自动控制原理电子教案 2c1-1.5ec2+ec3+5v=2 可得c1=-073,c2=-0.13。则所求最优控制为 n*()=073+1.3e=0.7(+0.18e) 3.tr自由,终端约束 设终端约束为式(9.20)。同样构造增广泛函J为 J=x(r)+Mx()7+「[H(x2,0- (9.28) 将式(9.28)与式(9.21)比较可以看出,式(9.28)除了tr自由外,与式(9.21) 完全相同,因而所推导出的结果除了因ar是任意的而增加一个终端边界条件 方程外,其余结果完全相同。最优控制问题(9.7),(9.8)取极值的必要条 件为 正则方程 状态方程 OH(,u, 4, 1) (9. 29) 伴随方程 aH(, u, 1,1) (9.30) 控制方程 aH(,u,A,t) (9.31) 边界条件与横截条件x(0)=x Mlr(r),t,]=0 (9.32) A(r)=[+()v (9.33) [H(x, u, a, 1) 例9.3已知系统的状态方程为 t=u(t) 初始条件为x(0)=x0,终端时刻tr自由,终端约束条件为x(r)=co(常数), 求最优控制u*()和x*(t),使性能指标 J=[(x2+)d 为最小。 解本题为t自由、终端受约束的可动边界最优控制问题。由于控制变量 不受约束,所以可以用变分法求解。构造哈密顿函数为 H(x,u,.,D)=x2+&+A=x2+u2+Mn 伴随方程为 控制方程为 2u+A=0 由伴随方程和控制方程得 代入状态方程得 解上面的二阶微分方程得 x=ce +c2 浙江工业大学自动化研究所
自 动 控 制 原 理电 子 教 案 浙 江 工 业 大 学 自 动 化 研 究 所 6 2 1.5 3 5 2 2 2 2 − 1 − + + = − c e c e c v 可得c1 = −0.73 ,c2 = −0.13 。则所求最优控制为 *( ) 0.73 1.3 0.73(1 0.18 ) t t u t = + e = + e 3. f t 自由,终端约束 设终端约束为式(9.20)。同样构造增广泛函 a J 为 ∫ = + + − f t t T f f T a f f J x t t v M x t t H x u t x dt 0 θ[ ( ), ] [ ( ), ] [ ( , , λ, ) λ &] (9.28) 将式(9.28)与式(9.21)比较可以看出,式(9.28)除了 f t 自由外,与式(9.21) 完全相同,因而所推导出的结果除了因 f δt 是任意的而增加一个终端边界条件 方程外,其余结果完全相同。最优控制问题(9.7),(9.8)取极值的必要条 件为 正则方程 状态方程 λ λ ∂ ∂ = H(x, u, ,t) x& (9.29) 伴随方程 x H x u t ∂ ∂ = − ( , , λ, ) λ & (9.30) 控制方程 0 ( , , , ) = ∂ ∂ u H x u λ t (9.31) 边界条件与横截条件 0 0 x(t ) = x M[x(t f ),t f ] = 0 (9.32) f t t T f v x M x t = ∂ ∂ + ∂ ∂ ( ) = [ ( ) ] θ λ (9.33) [ ( , , , ) ] = 0 ∂ ∂ + ∂ ∂ + = f t t T t M v t H x u t θ λ (9.34) 例 9.3 已知系统的状态方程为 x&(t) = u(t) 初始条件为 0 x(0) = x ,终端时刻 f t 自由,终端约束条件为 0 x(t ) c f = (常数), 求最优控制u *(t) 和 x*(t) ,使性能指标 ∫ = + f t J x x dt 0 2 2 ( & ) 为最小。 解 本题为 f t 自由、终端受约束的可动边界最优控制问题。由于控制变量 不受约束,所以可以用变分法求解。构造哈密顿函数为 H x u λ t = x + x + λu = x + u + λu 2 2 2 2 ( , , , ) & 伴随方程为 λ &= −2x 控制方程为 2u + λ = 0 由伴随方程和控制方程得 x = u& 代入状态方程得 &x&= x 解上面的二阶微分方程得 t t x c e c e = 1 + 2 −
自动控制原理电子教案 因此 积分得 代入边界条件与横截条件,得 0 解得C1=0,c2=Co,或者c2=0,c1=C0。于是,最优控制和最优状态轨 线为 Xoe xo>c Xoe 表9.1不同终端状态边界条件下的边界条件与横截条件 终端时刻 终端状态 边界条件与横截条件 =x(t)-x=0 终端固定 x(0)=x 终端自由 tn) 给定终端部分固定、部/x(0)=x0x1()=x 分自由(x1(r)固 λ21(t)=-06 定、x2()自由 ax2() x(0)=x0 终端约束 Mx(r)=0 a0 aM tr自由 终端固定 x(t0) i(t-dc 终端自由 x(ty) () 浙江工业大学自动化研究所
自 动 控 制 原 理电 子 教 案 浙 江 工 业 大 学 自 动 化 研 究 所 7 因此 t t u xdt c e c e = = − 1 + 2 − ∫ t t x c e c e 1 2 = −2 = −2 − 2 − λ & 积分得 t t c e c e 1 2 = 2 − 2 − λ 代入边界条件与横截条件,得 1 2 0 c + c = c 0 c1c2 = 解得 0 c1 = , 2 0 c = c ,或者 0 c2 = , 1 0 c = c 。于是,最优控制和最优状态轨 线为 ⎩ ⎨ ⎧ − > < = − 0 0 0 0 0 0 , , *( ) x e x c x e x c u t t t ⎩ ⎨ ⎧ > < = − 0 0 0 0 0 0 , , *( ) x e x c x e x c x t t t 表 9.1 不同终端状态边界条件下的边界条件与横截条件 终端时刻 终端状态 边界条件与横截条件 终端固定 M = x(t f ) − x f = 0 0 0 x(t ) = x 终端自由 0 0 x(t ) = x ( ) ( ) f f x t t ∂ ∂ = θ λ 终端部分固定、部 分自由( ( ) 1 f x t 固 定、 ( ) 2 f x t 自由) 0 0 x(t ) = x f f x t x 1 1 ( ) = ( ) ( ) 2 2 f f x t t ∂ ∂ = θ λ f t 给定 终端约束 0 0 x(t ) = x M[x(t f )] = 0 f t T f v x M x (t ) [ ( ) ] ∂ ∂ + ∂ ∂ = θ λ 终端固定 0 0 x(t ) = x f f x(t ) = x f f t H t ∂ ∂ = − θ ( ) f t 自由 终端自由 0 0 x(t ) = x ( ) ( ) f f x t t ∂ ∂ = θ λ f f t H t ∂ ∂ = − θ ( )
自动控制原理电子教案 to )=xo MIr(tn),fl 终端约束x0y)=(8+(a)n (r)= 9.4极小值原理 控制变量v()受到限制时的最优控制问题,通常称为有约束最优控制问 题。对于有约束最优控制问题,不能应用变分法求解,而需要采用本节所介绍 的极小值原理求解。 9.41连续系统的极小值原理 设系统的状态方程为 求t)=fx(t),u(),n x(t0)=x0 (9.35) 式中,x∈Rn;u∈Ω∈RP;Ω为有界闭集。不等式约束为 G[x(t),u(1),≥0 (9.36) 其中,G为m维连续可微向量函数,m≤p。系统从初始状态x0转移到终端状 态x(),要求终端状态x(/)满足等式约束 M[x(),tf1=0 其中,M为q维连续可微向量函数,q≤n。性能指标为 J=Ol(g),91+L[x(o), u(o),r]dt (9.38) 最优控制问题就是寻找最优容许控制(),使目标函数J最小 为了将不等式约束问题转化为等式约束问题,引入两个新的向量: 1)引入一个新的p维控制变量o( d()=l() o(tl0)=0 (9.39) 这样,就可以容许(1)不连续。因为当()不连续时,o()也是连续的。而当u() 是分段连续函数时,o(1)也是分段光滑连续函数 2)引入另一个新的m维控制变量z(r) [鸢)=Gx(1),u(1),门 (9.40) 由于上式左边恒为非负,所以满足G是非负的要求。 通过以上变换,将上述有不等式约束的最优控制问 化为了下列具有 等式约束的条件极值问题,通常称为波尔扎( bolza)问题: 系统的状态方程为 )=fx(1),d,l (9.41) [)2=Gx(1),a,1 x(0)=x0,z(10)=0,o(to)=0 终端时刻t;未给定,终端状态约束为 Mx(t,),]=0 要求确定最优控制an),使性能指标 J=bxr,r+x(.减D.lt 浙江工业大学自动化研究所
自 动 控 制 原 理电 子 教 案 浙 江 工 业 大 学 自 动 化 研 究 所 8 终端约束 0 0 x(t ) = x M[x(t f ),t f ] = 0 f t T f v x M x (t ) [ ( ) ] ∂ ∂ + ∂ ∂ = θ λ f t T f t M v t H(t ) [ ] ∂ ∂ + ∂ ∂ = − θ 9.4 极小值原理 控制变量 u(t) 受到限制时的最优控制问题,通常称为有约束最优控制问 题。对于有约束最优控制问题,不能应用变分法求解,而需要采用本节所介绍 的极小值原理求解。 9.4.1 连续系统的极小值原理 设系统的状态方程为 x&(t) = f [x(t), u(t),t] 0 0 x(t ) = x (9.35) 式中, n x ∈ R ; p u ∈Ω∈ R ;Ω 为有界闭集。不等式约束为 G[x(t), u(t),t] ≥ 0 (9.36) 其中,G 为 m 维连续可微向量函数,m ≤ p 。系统从初始状态 0 x 转移到终端状 态 ( ) f x t ,要求终端状态 ( ) f x t 满足等式约束 M[x(t f ),t f ] = 0 (9.37) 其中, M 为 q 维连续可微向量函数, q ≤ n 。性能指标为 ∫ = + f t t f f J x t t L x t u t t dt 0 θ[ ( ), ] [ ( ), ( ), ] (9.38) 最优控制问题就是寻找最优容许控制u(t) ,使目标函数 J 最小。 为了将不等式约束问题转化为等式约束问题,引入两个新的向量: 1)引入一个新的 p 维控制变量ω(t) ω&(t) = u(t) , ω(t0 ) = 0 (9.39) 这样,就可以容许u(t) 不连续。因为当u(t) 不连续时,ω(t) 也是连续的。而当u(t) 是分段连续函数时,ω(t) 也是分段光滑连续函数。 2)引入另一个新的 m 维控制变量 z(t) [ ( )] [ ( ), ( ), ] 2 z&t = G x t u t t , z(t0 ) = 0 (9.40) 由于上式左边恒为非负,所以满足G 是非负的要求。 通过以上变换,将上述有不等式约束的最优控制问题,转化为了下列具有 等式约束的条件极值问题,通常称为波尔扎(Bolza)问题: 系统的状态方程为 x&(t) = f [x(t),ω&(t),t] (9.41) [ ( )] [ ( ), ( ), ] 2 z&t = G x t ω&t t (9.42) 0 0 x(t ) = x , z(t0 ) = 0 , ω(t0 ) = 0 终端时刻 f t 未给定,终端状态约束为 M[x(t f ),t f ] = 0 (9.43) 要求确定最优控制ω&(t) ,使性能指标 ∫ = + f t t f f J x t t L x t t t dt 0 θ[ ( ), ] [ ( ),ω&( ), ] (9.44)
自动控制原理电子教案 为极小。 引入拉格朗日乘子向量A及r,写出增广性能指标泛函为 J=Ox)1+yMx0,)1+-1小+(x0-+r(x=]m ox)+yMx(r)1+"{H减1-2r(x)-])d (9.45) 式中,哈密顿函数H(x,或A,1)定义为 H(x, d1, 1)=L(x, r)a' f(x, cr) (9.46) 为了简化问题,定义拉格朗日标量函数Φ为 Φ(x,A,,D)=H(x,或A,)-+G(x,1)- (9.47) 于是,J可以写成 Jn=x(r)y+yMx()1+x减元,, (9.48) 对J。取一阶变分,得 6,,rM at +iaei ax(tn) (9.49) 式中,为最优终端时刻。对上式积分项中的后三项分别进行分部积分,并利 用关系式 i()=()+61f (9.50) 可得 a。=[中- (9.51) ax ax 6x(t)+ + a d a d a d a dt add 根据泛函取极值的必要条件,应有aa=0。由于式(9.51)中8 a,bo和&都是任意的,并且相互独立,所以增广性能指标泛函J取极值 的必要条件为 op d a (9.52) d a d a 0 (9.53) dt ac oo 「如+y2 aM (9.54) arlo (9.55) a &ts,=0,a (9.56) 由式(9.47)得 浙江工业大学自动化研究所
自 动 控 制 原 理电 子 教 案 浙 江 工 业 大 学 自 动 化 研 究 所 9 为极小。 引入拉格朗日乘子向量λ 及Γ ,写出增广性能指标泛函为 ∫ = + + + − + Γ − f t t T T f f T a f f J x t t v M x t t L x t f x t x G x t z dt 0 [ ( ), ] [ ( ), ] { [ , , ] [ ( , , ) ] [ ( , , ) ]} 2 θ ω& λ ω& & ω& & ∫ = + + − + Γ − f t t T T f f T f f x t t v M x t t H x t x G x t z dt 0 [ ( ), ] [ ( ), ] { [ , , , ] [ ( , , ) ]} 2 θ ω&λ λ & ω& & (9.45) 式中,哈密顿函数 H(x,ω&, λ,t) 定义为 H(x, , ,t) L(x, ,t) f (x, ,t) T ω&λ = ω& + λ ω& (9.46) 为了简化问题,定义拉格朗日标量函数Φ 为 ( , , , , , , ) ( , , , ) [ ( , , ) ] 2 x x z t H x t x G x t z T T Φ &ω& &λ Γ = ω&λ − λ &+ Γ ω& − & (9.47) 于是, a J 可以写成 ∫ = + + Φ Γ f t t f f T a f f J x t t v M x t t x x z t dt 0 θ[ ( ), ] [ ( ), ] ( , &,ω&, &, λ, , ) (9.48) 对 a J 取一阶变分,得 ∫ ∂ ∂Φ + ∂ ∂Φ + ∂ ∂Φ + ∂ ∂Φ + ∂ ∂ + ∂ ∂ + ∂ ∂ + ∂ ∂ = Φ + = = f f f t t T T T T f t t T T f t t T a z dt z x x x x x t x M v x t t M v t J * * 0 * * [( ) ( ) ( ) ( ) ] [ ] [( ) ] ( ) & & & & & & δω δ ω δ δ δ θ δ θ δ (9.49) 式中, * f t 为最优终端时刻。对上式积分项中的后三项分别进行分部积分,并利 用关系式 f f f f x(t ) x(t ) x(t )δ t δ = δ * + & (9.50) 可得 ∫ ∂ ∂Φ − ∂ ∂Φ − ∂ ∂Φ − ∂ ∂Φ + ∂ ∂Φ + ∂ ∂Φ + ∂ ∂Φ + ∂ ∂ + ∂ ∂ + ∂ ∂ + ∂ ∂ + ∂ ∂Φ = Φ − = = = * 0 * * * [( ) δ ( ) ( ) δ ] [ ( ) ] δ ( ) [( ) δ ( ) δ ] [ ] δ * f f f f t t T T T t t T T f T t t T f t t T T a z dt dt z d dt d x dt x d x z z x t x v x M x t t M v x t J x & & & & & & & & δω ω ω ω θ θ δ (9.51) 根据泛函取极值的必要条件,应有δJ a = 0 。由于式(9.51)中 f δ t , ( ) * f δx t , δx ,δω 和δz 都是任意的,并且相互独立,所以增广性能指标泛函 a J 取极值 的必要条件为 = 0 ∂ ∂Φ − ∂ ∂Φ dt x d x & (9.52) = 0 ∂ ∂Φ dt ω& d , = 0 ∂ ∂Φ dt z d & (9.53) [ ( ) ] * = 0 ∂ ∂ + ∂ ∂ + ∂ ∂Φ Φ − = f t t T T t M v t x x θ & & (9.54) [ ( ) ] * = 0 ∂ ∂Φ + ∂ ∂ + ∂ ∂ = f t t T x v x M x & θ (9.55) ( ) * = 0 ∂ ∂Φ = f t t ω& , ( ) * = 0 ∂ ∂Φ = f t t z& (9.56) 由式(9.47)得 Γ ∂ ∂ + ∂ ∂ = ∂ ∂Φ T x G x H x ( )
自动控制原理电子教案 代入式(9.52),得 d2 ah aG or+(o'l &-0H-(aGr (9.57) 若不等式约束函数G内不含x,即为 G[u(1),n≥0 (9.58) 则由于一≡0,由式(9.57)得 由式(9.54)和(9.55),并注意到 ac ,可计算出t=t时的H及A值 H(r)= ae aM a(tr) (9.61) 当系统在最优控制u'(n)作用下,沿最优轨迹x()进行状态转移时的r即是最 优时刻r,略去式(960)和(961)中的符号(*),即得横截条件为 H(x,u,元,1)+ (9.62) (t)= 式(9.53)表明,在最优轨线上 都为常数。又由式(9.56)可知, 该常数为零,所以,沿最优轨迹 0 (9.64) ac ar 由于Φ中包含最,&和&,若将极值曲线上的&,&和或,分别用,或和 表示,则式(964)可以写成 aa 0 (9.65) a ar 上面得到了使性能指标J取极值的必要条件。为了使性能指标取极值, 还必须满足充分条件:维尔斯特拉斯函数E沿最优轨线为非负,即 E=Φ(x,成,r,1)-(x,,,,只,r,D)-()(如R) d(x,最,r,1)+A心(x,北,收,R,2,r,1)-2 =H(x‘,x,1)-H(x,&,A,1)≥0 (9.66) 以at)=l(t),d()=u·(n)代入上式得 H(x,‘,元,)≤H(x',u,,D) 浙江工业大学自动化研究所
自 动 控 制 原 理电 子 教 案 浙 江 工 业 大 学 自 动 化 研 究 所 10 = −λ ∂ ∂Φ x& 代入式(9.52),得 Γ ∂ ∂ + ∂ ∂ − = T x G x H dt d ( ) λ 即 Γ ∂ ∂ − ∂ ∂ = − T x G x H λ & ( ) (9.57) 若不等式约束函数G 内不含 x ,即为 G[u(t),t] ≥ 0 (9.58) 则由于 ≡ 0 ∂ ∂ x G ,由式(9.57)得 x H ∂ ∂ λ &= − (9.59) 由式(9.54)和(9.55),并注意到 = −λ ∂ ∂Φ x& ,可计算出 * f t = t 时的 H 及λ 值 * ( ) [ ] * f t t T f t M v t H t = ∂ ∂ − ∂ ∂ = − θ (9.60) * ( ) [ ( ) ] * f t t T f v x M x t = ∂ ∂ + ∂ ∂ = θ λ (9.61) 当系统在最优控制 ( ) * u t 作用下,沿最优轨迹 ( ) * x t 进行状态转移时的 f t 即是最 优时刻 * f t ,略去式(9.60)和(9.61)中的符号(*),即得横截条件为 [ ( , , , ) ( ) ] = 0 ∂ ∂ + ∂ ∂ + = f t t T v t M t H x u t θ λ (9.62) f t t T f v x M x t = ∂ ∂ + ∂ ∂ ( ) = [ ( ) ] θ λ (9.63) 式(9.53)表明,在最优轨线上, ∂ω& ∂Φ 和 ∂z& ∂Φ 都为常数。又由式(9.56)可知, 该常数为零,所以,沿最优轨迹 ∂ω& ∂Φ = ≡ 0 ∂ ∂Φ z& (9.64) 由于Φ 中包含 x&,ω&和 z&,若将极值曲线上的 x&,ω&和 z&,分别用 * x& , * ω& 和 * z& 表示,则式(9.64)可以写成 0 * * ≡ ∂ ∂Φ = ∂ ∂Φ ω& z& (9.65) 上面得到了使性能指标 a J 取极值的必要条件。为了使性能指标取极值, 还必须满足充分条件:维尔斯特拉斯函数 E 沿最优轨线为非负,即 ( , , , , , , ) ( , , , , , , ) ( ) ( ) * * * * * * * * * * * x x x E x x z t x x z t T & & & & & & & & & − ∂ ∂Φ = Φ ω λ Γ − Φ ω λ Γ − * * * * * * * * * * * * (x , x, , z, , ,t) x (x , x , , z , , ,t) x = Φ &ω& &λ Γ + λ T &− Φ & ω& & λ Γ − λ T & ( , , , ) ( , , , ) 0 * * * * * = H x ω&λ t − H x ω& λ t ≥ (9.66) 以ω&(t) = u(t) , ( ) ( ) * * ω& t = u t 代入上式得 ( , , , ) ( , , , ) * * * * * H x u λ t ≤ H x u λ t (9.67)