连续系统的费小值原理 两式相减可得这一段的6X(t) [X,+6U,t)-X,U,切dt (3-6) 可以对6X()的大小作估计 16X训≤a竖a优x+6U)-x,0,t-有+d 由于∈是微量,所以6X(t)也是微量,因而在精确到一阶微量的情况下, 下式成立 fX,+6U0=fX*,U+6U0+ SX (3-7) 将式(3-7)代入(3-6),并注意到微量6X在微小时间间隔上的积分是高阶 微量,即得 6X)=x,V+6U,)-x,0,训dt 第三章极小值原理及其应用 最优控制理论与系统 November 9,2016 11/67
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 连续系统的极小值原理 两式相减可得这一段的 δX(t) δX(t) = ∫ t t1−ϵ [f(X, U ∗ + δU, t) − f(X ∗ , U ∗ , t)] dt (3-6) 可以对 δX(t) 的大小作估计 |δX(t)| ≤ max t1−ϵ≤t≤t1 |f(X, U ∗ + δU, t) − f(X ∗ , U ∗ , t)|(t − t1 + ϵ) 由于 ϵ 是微量,所以 δX(t) 也是微量,因而在精确到一阶微量的情况下, 下式成立 f(X, U ∗ + δU) = f(X ∗ , U ∗ + δU) + ∂f ∂X X=X∗ δX (3-7) 将式(3-7)代入(3-6),并注意到微量 δX 在微小时间间隔上的积分是高阶 微量,即得 δX(t) = ∫ t t1−ϵ [f(X ∗ , U ∗ + δU, t) − f(X ∗ , U ∗ , t)] dt 第三章 极小值原理及其应用 最优控制理论与系统 November 9, 2016 11 / 67
连续系统的嫩小值原理 在第二段时间间隔的终点t=,则有 6X()=,+U)-X,U,切dt 或 6X(t)=[f(X;U+6U,t)-fX,U,t)]lte+o(e) (3-8) 其中o(e)表示二阶以上的微量。 3,t≤t≤t好 这时又有U三*,系统的状态方程为 X=X,U*,) 而状态变量6X()的变分满足方程 6X= af 5X XU=U (3-9) 1日。①,之·1三至分只C 第三章圾小位原理及其应 最优控制理论与系统 November 9,2016 12/67
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 连续系统的极小值原理 在第二段时间间隔的终点 t = t1,则有 δX(t1) = ∫ t1 t1−ϵ [f(X ∗ , U ∗ + δU, t) − f(X ∗ , U ∗ , t)] dt 或 δX(t1) = [f(X ∗ , U ∗ + δU, t) − f(X ∗ , U ∗ , t)]|t=t1 ϵ + o(ϵ) (3-8) 其中 o(ϵ) 表示二阶以上的微量。 3,t1 ≤ t ≤ tf 这时又有 U = U∗,系统的状态方程为 X˙ = f(X, U ∗ , t) 而状态变量 δX(t) 的变分满足方程 δX˙ = ∂f ∂X U=U∗ δX (3-9) 第三章 极小值原理及其应用 最优控制理论与系统 November 9, 2016 12 / 67
连续系统的椒小值原理 引入变量入*()及哈密顿函数H HX,心,A*,)=*TfX,,t) (3-10) X= a ∂x (3-11) OGT 入*(= 8o ax+ax切 (3-12) 显然,方程(3-9)和(3-11)为共轭方程,立即求得积分 入*r(d6X(t)=C 为常数,或 入*T(t封6X(t分=入*T()6X(6) (3-13) 即最终求得了由于6U的有限改变而引起的最优轨线的变化6X(),特别 是末值状态的变化6X()。 2a0 三章极小位原理及其应用 最优控制理论与系统 November 9,2016 13/67
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 连续系统的极小值原理 引入变量 λ ∗ (t) 及哈密顿函数 H H(X, U ∗ , λ∗ , t) = λ ∗Tf(X, U ∗ , t) (3-10) λ˙ ∗ = − ∂H ∂X U=U∗ λ=λ ∗ = − ( ∂f T ∂X ) U=U∗ λ ∗ (3-11) λ ∗ (tf) = ∂ϕ ∂X(tf) + ∂GT ∂X(tf) ν (3-12) 显然,方程(3-9)和(3-11)为共轭方程,立即求得积分 λ ∗T(t)δX(t) = C 为常数,或 λ ∗T(tf)δX(tf) = λ ∗T(t1)δX(t1) (3-13) 即最终求得了由于 δU 的有限改变而引起的最优轨线的变化 δX(t),特别 是末值状态的变化 δX(tf)。 第三章 极小值原理及其应用 最优控制理论与系统 November 9, 2016 13 / 67
连续系统的嫩小值原理 下面研究由6U引起的最优性能指标的改变量△J。由于 J=[X,+vrGX(),切 故有 8o acgr5xX纷+o0 △J=(8x+ax (3-14) 综合(3-8)、(3-12)、(3-13)和(3-14)等式,可以建立△J与有限改变量6U 之间的关系 △J=[A*TX,产+6U,t)-*Tx,U,tjl=he+o(e)≥0 已知∈[,中的任意时刻,并以U表示+6U,当e→0时,上 式变为 *TfX,,)≤入*rX,U,),Ue2,t∈[t, 三章极小原及其应用 最优控制理论与系统 November 9,2016 14/67
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 连续系统的极小值原理 下面研究由 δU 引起的最优性能指标的改变量 ∆J。由于 J = ϕ[X(tf), tf ] + ν TG[X(tf), tf ] 故有 ∆J = ( ∂ϕ ∂X(tf) + ∂GT ∂X(tf) ν) TδX(tf) + o(ϵ) (3-14) 综合(3-8)、(3-12)、(3-13)和(3-14)等式,可以建立 ∆J 与有限改变量 δU 之间的关系 ∆J = [λ ∗Tf(X ∗ , U ∗ + δU, t) − λ ∗Tf(x ∗ , U ∗ , t)]|t=t1 ϵ + o(ϵ) ≥ 0 已知 t1 ∈ [t0, tf ] 中的任意时刻,并以 U 表示 U∗ + δU,当 ϵ → 0 时,上 式变为 λ ∗Tf(X ∗ , U ∗ , t) ≤ λ ∗Tf(X ∗ , U, t), U ∈ Ω, t ∈ [t0, tf ] 第三章 极小值原理及其应用 最优控制理论与系统 November 9, 2016 14 / 67
连续系统的费小值原理 或用哈密顿函数H的表达式(3-10)表示可得 HX,入*,U,)≤H(X,入,U, (3-15) 或 X,X,U,)=N,,,) 于是定常系统、末值型性能指标、+固定、末端受约束情况下极小值原 理得以证明。 口·40,4工1三型分0C 第三章极小值原理及其应用 最优控制理论与系统 November 9,2016 15/67
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 连续系统的极小值原理 或用哈密顿函数 H 的表达式(3-10)表示可得 H(X ∗ , λ∗ , U ∗ , t) ≤ H U∈Ω (X ∗ , λ∗ , U, t) (3-15) 或 min U∈Ω H(X ∗ , λ∗ , U, t) = H(X ∗ , λ∗ , U ∗ , t) 于是定常系统、末值型性能指标、tf 固定、末端受约束情况下极小值原 理得以证明。 第三章 极小值原理及其应用 最优控制理论与系统 November 9, 2016 15 / 67