第36卷第3期 北京科技大学学报 Vol.36 No.3 2014年3月 Journal of University of Science and Technology Beijing Mar.2014 基于状态观测器的线性离散时间系统的最优预见控制 廖福成,陈 平 北京科技大学数理学院,北京100083 ☒通信作者,E-mail:feliao(@usth.cdu.cn 摘要研究了带有预见信息的线性离散时间系统的状态观测器,并将其应用到预见控制系统.为了满足设计观测器的需 要,首先导出了包含可预见的目标值信号和干扰信号的扩大误差系统,并由此得到最优预见控制器.在设计状态观测器时,通 过改写输出方程充分利用了可预见的目标值信号和干扰信号.设计的状态观测器针对原系统是全维观测器,而针对扩大误差 系统则是降维观测器.最后通过数值仿真证明了所设计的状态观测器的有效性. 关键词离散时间系统:状态估计:预见控制:最优控制 分类号TP273 Optimal preview control based on state observers for linear discrete-time systems LIAO Fu-cheng,CHEN Ping School of Mathematics and Physics,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:feliao@ustb.edu.cn ABSTRACT A state observer with preview information for linear discrete-time systems was studied and applied to preview control systems.To design the state observer,an augmented error system with previewable desired tracking and disturbance signals was derived first,which leads to obtaining an optimal preview controller.While in designing the state observer,previewable desired tracking and disturbance signals were fully utilized through reformulation of the output equation.The state observer is a full-order dimensional ob- server with respect to the original system;whereas it is a reduced-order observer with respect to the augmented error system.Numerical simulation verifies the effectiveness of the state observer. KEY WORDS discrete time control systems;state estimation:preview control;optimal control 在实际问题中,很多系统的目标值信号或干扰 广义系统的预见控制等问题的研究见文献21一 信号是已知的.在这种情况下,人们利用这些已知 23]. 的或称为可预见的目标值信号或干扰信号设计预见 在系统状态变量的一些分量不能够用于状态反 控制系统,使得闭环系统的跟踪性能得以提高.预 馈时,可以采用Luenberger观测器估计这些状态分 见控制概念从提出至今有近50年,己经有了一整套 量,然后用于状态反馈4-).本文研究常系数线性 的理论和方法.针对常系数线性系统的最优预 预见控制系统的观测器.首先构造包含可预见的目 见控制问题研究得最为深刻59.预见控制系统的 标值信号和干扰信号的统一的扩大误差系统,并由 鲁棒性问题也得到了较为充分的研究0-四.从 此出发设计系统的最优预见控制器.然后把可预见 2003年起,廖福成及其研究团队对预见控制理论进 的目标值信号和干扰信号的信息加入扩大误差系统 行了扩展.例如,文献3]提出多采样率系统的预 的观测量,设计出状态观测器.为了简便,所设计的 见控制问题,并通过文献4-16]进行了推广;文献 是关于原系统的全维状态观测器,而针对扩大误差 系统而言,则是降维状态观测器.这些结果容易推 7-20]研究了时变线性系统的预见控制问题,而 收稿日期:201301-03 DOI:10.13374/j.issn1001-053x.2014.03.018:http://jourals.ustb.edu.cn
第 36 卷 第 3 期 2014 年 3 月 北京科技大学学报 Journal of University of Science and Technology Beijing Vol. 36 No. 3 Mar. 2014 基于状态观测器的线性离散时间系统的最优预见控制 廖福成,陈 平 北京科技大学数理学院,北京 100083 通信作者,E-mail: fcliao@ ustb. edu. cn 摘 要 研究了带有预见信息的线性离散时间系统的状态观测器,并将其应用到预见控制系统. 为了满足设计观测器的需 要,首先导出了包含可预见的目标值信号和干扰信号的扩大误差系统,并由此得到最优预见控制器. 在设计状态观测器时,通 过改写输出方程充分利用了可预见的目标值信号和干扰信号. 设计的状态观测器针对原系统是全维观测器,而针对扩大误差 系统则是降维观测器. 最后通过数值仿真证明了所设计的状态观测器的有效性. 关键词 离散时间系统; 状态估计; 预见控制; 最优控制 分类号 TP 273 Optimal preview control based on state observers for linear discrete-time systems LIAO Fu-cheng ,CHEN Ping School of Mathematics and Physics,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail: fcliao@ ustb. edu. cn ABSTRACT A state observer with preview information for linear discrete-time systems was studied and applied to preview control systems. To design the state observer,an augmented error system with previewable desired tracking and disturbance signals was derived first,which leads to obtaining an optimal preview controller. While in designing the state observer,previewable desired tracking and disturbance signals were fully utilized through reformulation of the output equation. The state observer is a full-order dimensional observer with respect to the original system; whereas it is a reduced-order observer with respect to the augmented error system. Numerical simulation verifies the effectiveness of the state observer. KEY WORDS discrete time control systems; state estimation; preview control; optimal control 收稿日期: 2013--01--03 DOI: 10. 13374 /j. issn1001--053x. 2014. 03. 018; http: / /journals. ustb. edu. cn 在实际问题中,很多系统的目标值信号或干扰 信号是已知的. 在这种情况下,人们利用这些已知 的或称为可预见的目标值信号或干扰信号设计预见 控制系统,使得闭环系统的跟踪性能得以提高. 预 见控制概念从提出至今有近 50 年,已经有了一整套 的理论和方法[1--6]. 针对常系数线性系统的最优预 见控制问题研究得最为深刻[5--9]. 预见控制系统的 鲁棒性问题也得到了较为充分的研究[10--12]. 从 2003 年起,廖福成及其研究团队对预见控制理论进 行了扩展. 例如,文献[13]提出多采样率系统的预 见控制问题,并通过文献[14--16]进行了推广; 文献 [17--20]研究了时变线性系统的预见控制问题,而 广义系统的预见控制等问题的研究见文献[21-- 23]. 在系统状态变量的一些分量不能够用于状态反 馈时,可以采用 Luenberger 观测器估计这些状态分 量,然后用于状态反馈[24--25]. 本文研究常系数线性 预见控制系统的观测器. 首先构造包含可预见的目 标值信号和干扰信号的统一的扩大误差系统,并由 此出发设计系统的最优预见控制器. 然后把可预见 的目标值信号和干扰信号的信息加入扩大误差系统 的观测量,设计出状态观测器. 为了简便,所设计的 是关于原系统的全维状态观测器,而针对扩大误差 系统而言,则是降维状态观测器. 这些结果容易推
第3期 磨福成等:基于状态观测器的线性离散时间系统的最优预见控制 ·391· 广到连续时间预见控制系统、时变预见控制系统、多 目标值预见,而文献2]分别考虑目标值预见和干 采样率预见控制系统及广义预见控制系统.最后, 扰预见,然后把控制器中的目标值预见项和干扰预 本文把状态观测器用于预见控制系统中,并通过数 见项简单相加作为一般结果.为了利用可预见信息 值仿真验证其有效性 构造观测器,需要同时设计目标值预见项和干扰预 1基本假设与数学模型 见项.因此,本文首先构造统一的扩大误差系统,然 后设计最优预见控制器,最后设计观测器,给出利用 考虑线性离散时间系统 观测器的闭环控制系统 [x(k+1)=Ax(k)+Bu (k)+Ed(k), (1) Ly(k)=Cx(k). 2基于状态观测器的最优预见控制器 式中:x()eR",u(k)∈R',y(k)∈Rm,d(k)∈R 2.1包含可预见信号的扩大误差系统及带有预见 分别是系统的状态向量、输入向量、输出向量和干扰 作用的控制器 向量;:A、B、C和E是具有相应维数的常数矩阵.设 采用类似于文献2-4,12,14]的方法,用差分 目标值信号为R(k)∈R. 算子△(△x(k)=x(k)-x(k-1))作用到误差向量 对系统(1)作如下假设 e(k+1)上,并作用到系统方程(1)两边,可以得到 假设1设系统(1)可镇定、可检测. 扩大误差系统 假设2设目标值信号R(k)的可预见步数为 X(k+1)=ΦX。(k)+G△u(k)+GR△R(k+1)+ Me,即设在当前时刻k,R(k)的当前值和MR步未来 Ga△d() (5) 值R(),R(k+1),R(k+2),…,R(k+MR)为己知, 其中 Me步之后认为它是常数,即 R(k+j)=R(k+MR),j=Mg+1,Mg +2,. x因]m-[64c=g 假设3设干扰信号d()的可预见步数为M, 即设在当前时刻k,d(k)的当前值和M步未来值 a-616,=g1 d(k),d(k+1),d(k+2),…,d(k+M)为己知,M4 考虑到系统方程(1)的输出方程y(k)=Cx(k),式 步之后认为它是常数,即 (5)的输出方程可以取为 d(k+j)=d(k+Ma),j=Ma+1,Ma+2,... e(k)=CoXo(k) 假设1是对控制系统的基本要求,假设2和假 式中,C。=m0]. 设3分别是关于目标值信号和干扰信号可预见性的 假设.理论研究和真实实例均表明,距离当前时刻 然后再对目标值信号R(k)和干扰信号d(k)进 较远的未来目标值信号和未来干扰信号对系统性能 行类似操作,并令 的影响不大,所以一般都假设可预见步数之外它们 △R(k) △d(k) 的值等于常数一.事实上,普通的反馈控制系统 △R(k+1) △d(k+1) XR()= ,X(k)= 不利用可预见信号,相当于取预见步数为零 定义误差信号 △R(k+MR) △d(k+M) e(k)=R(k)-y() (2) 0 01 我们希望设计一个控制器,使输出向量y(k)无静态 误差地跟踪目标值信号R(),即 AR= 0 lime(k)lim [R(k)-y(]=0. (3) I 引入二次型性能指标函数 0 0 m(Mg+1)×m(.MR+I) I. 0 0、 ,[e'(k)Q.e(k)+△(k)H△u()]. (4) A= 0 其中,Q.>0,H>0.按照文献B4]的结论,在性能 指标函数中包含△“(k)可以使得闭环系统包含积 LO 0J)xM+) 分器,从而有利于消除静态误差. 从假设2和假设3知有XR(k+1)=AXe(k), 对于预见控制模型,文献B-4,6]仅仅考虑了 X,(k+1)=AX(k).把这两个关系式与式(5)结
第 3 期 廖福成等: 基于状态观测器的线性离散时间系统的最优预见控制 广到连续时间预见控制系统、时变预见控制系统、多 采样率预见控制系统及广义预见控制系统. 最后, 本文把状态观测器用于预见控制系统中,并通过数 值仿真验证其有效性. 1 基本假设与数学模型 考虑线性离散时间系统 x( k + 1) = Ax( k) + Bu( k) + Ed( k) , {y( k) = Cx( k) . ( 1) 式中: x( k) ∈Rn ,u( k) ∈Rr ,y( k) ∈Rm,d( k) ∈Rq 分别是系统的状态向量、输入向量、输出向量和干扰 向量; A、B、C 和 E 是具有相应维数的常数矩阵. 设 目标值信号为 R( k) ∈Rm . 对系统( 1) 作如下假设. 假设 1 设系统( 1) 可镇定、可检测. 假设 2 设目标值信号 R( k) 的可预见步数为 MR,即设在当前时刻 k,R( k) 的当前值和 MR 步未来 值R( k) ,R( k + 1) ,R( k + 2) ,…,R( k + MR ) 为已知, MR 步之后认为它是常数,即 R( k + j) = R( k + MR ) ,j = MR + 1,MR + 2,…. 假设 3 设干扰信号 d( k) 的可预见步数为 Md, 即设在当前时刻 k,d( k) 的当前值和 Md 步未来值 d( k) ,d( k + 1) ,d( k + 2) ,…,d( k + Md ) 为已知,Md 步之后认为它是常数,即 d( k + j) = d( k + Md ) ,j = Md + 1,Md + 2,…. 假设 1 是对控制系统的基本要求,假设 2 和假 设 3 分别是关于目标值信号和干扰信号可预见性的 假设. 理论研究和真实实例均表明,距离当前时刻 较远的未来目标值信号和未来干扰信号对系统性能 的影响不大,所以一般都假设可预见步数之外它们 的值等于常数[2--4,13]. 事实上,普通的反馈控制系统 不利用可预见信号,相当于取预见步数为零. 定义误差信号 e( k) = R( k) - y( k) . ( 2) 我们希望设计一个控制器,使输出向量 y( k) 无静态 误差地跟踪目标值信号 R( k) ,即 lim k→∞ e( k) = limk→∞ [R( k) - y( k) ]= 0. ( 3) 引入二次型性能指标函数 J = ∑ ∞ k = 1 [eT ( k) Qee( k) + ΔuT ( k) HΔu( k) ]. ( 4) 其中,Qe > 0,H > 0. 按照文献[3--4]的结论,在性能 指标函数中包含 Δu( k) 可以使得闭环系统包含积 分器,从而有利于消除静态误差. 对于预见控制模型,文献[3--4,6]仅仅考虑了 目标值预见,而文献[2]分别考虑目标值预见和干 扰预见,然后把控制器中的目标值预见项和干扰预 见项简单相加作为一般结果. 为了利用可预见信息 构造观测器,需要同时设计目标值预见项和干扰预 见项. 因此,本文首先构造统一的扩大误差系统,然 后设计最优预见控制器,最后设计观测器,给出利用 观测器的闭环控制系统. 2 基于状态观测器的最优预见控制器 2. 1 包含可预见信号的扩大误差系统及带有预见 作用的控制器 采用类似于文献[2--4,12,14]的方法,用差分 算子 Δ( Δx( k) = x( k) - x( k - 1) ) 作用到误差向量 e( k + 1) 上,并作用到系统方程( 1) 两边,可以得到 扩大误差系统 X0 ( k + 1) = ΦX0 ( k) + GΔu( k) + GRΔR( k + 1) + GdΔd( k) . ( 5) 其中 X0 ( k) = e( k) Δx( k [ ] ) ,Φ = Im - CA 0 [ ] A ,G = - CB [ B ] , GR = Im [ ] 0 ,Gd = - CE [ E ]. 考虑到系统方程( 1) 的输出方程 y( k) = Cx( k) ,式 ( 5) 的输出方程可以取为 e( k) = C0X0 ( k) . 式中,C0 =[Im 0]. 然后再对目标值信号 R( k) 和干扰信号 d( k) 进 行类似操作,并令 XR ( k) = ΔR( k) ΔR( k + 1) ΔR( k + MR ) ,Xd ( k) = Δd( k) Δd( k + 1) Δd( k + Md ) , AR = 0 Im 0 … 0 0 Im 0 … … … 0 m( MR + 1) × m( MR + 1) , Ad = 0 Iq 0 … 0 0 Iq 0 … … … 0 q( Md + 1) × q( Md + 1) . 从假设 2 和假设 3 知有 XR ( k + 1 ) = ARXR ( k) , Xd ( k + 1) = AdXd ( k) . 把这两个关系式与式( 5) 结 · 193 ·
·392· 北京科技大学学报 第36卷 合,得到 X(k+1)=ΦX(k)+Gx△u(k). (6) J= K(k)Qx(k)+△uT(k)H△u(A]. 其中 (9) e() 「X(k)1 △x(k) X(k)= Xg(k) Xx (k) Q为m+n+m(MR+1)+g(M:+1)阶方阵 X(k) x (k) 引理2如果以下条件满足 G (①)(A,B)可镇定,且矩阵A-IB1 行满秩, x=0AR c o 0 0 L00 0 (2)(C,A)可检测, A G。=DGg0… O]∈Rm+a×m(MR+i), (3)2.>0, 则系统(8)的使性能指标函数(9)取最小值的带有 Gx=[G。00…0]∈Ra+dxg(w4+D 预见前馈作用的最优输入为 同时还有 e(k)=CX(k). (7) △u(k)=FaX(k)+ 三F,月△Rk+切+ 其中 C,=[C00]= 0]ERxEm+n+m(Mg+)M+D] E,△ak+D=F,e()+F.ar( 综合式(6)和(7),得到系统 (X(k+1)=x(k)+GxAu(k), 三F分△Rk+n+言E,分auk+n 三0 (8) le(k)=CX(k). (10) 这就是所需要的扩大误差系统 式中, 如果(8)的闭环系统渐近稳定,就能够使式(3) F。=F.F]=-H+GPG]-'GPΦ, 成立.因此问题转变为研究形式系统(8)的控制问 (11) 题.为了下面证明方便,对④x和Gx进行如下 Fk()=-H+GPG]G ()PGR 分块: (=1,2,,M), (12) [I -CA -CBT F (j)=-[H+GPG]GT ()PG 0 A :0 Giz B (=0,1,2,…,M), (13) x= Gx= 0 0 专=重+GFo- (14) 00 0A 0 P是如下代数Riccati方程的解: P=Q+Φ'PΦ-ΦPGH+GPG]-GPΦ. 式中, (15) Gg=01n0…0], (MR-1)个0陆xm 2.2状态观测器的设计 G4=[-CE00…0], 如果有部分状态变量不能直接用于反馈,我们 M个dmxg Gh=E00…0] 可以设计状态观测器.原系统部分状态变量不能直 M个0nx9 接用于反馈相当于式(10)中X。的部分向量△x(k) 首先,需要知道系统(1)满足什么条件时系统 有一些分量不能直接用于反馈.为简单起见,设计 (8)是可镇定和可检测的.下面的两个引理可以用 针对△x(k)的状态观测器.由于这里的控制输入是 类似于文献4,13]的方法证明,此处从 从扩大误差系统(8)出发确定的,所以利用系统(8) 引理1若(A,B)可镇定且矩阵 A-IB1行 来设计观测器,这相当于系统(8)的降维观测器. c o 系统(8)的状态向量中包括XR(k)和X(k), 满秩,则系统(8)可镇定.若(C,A)可检测,则系统 而这是可预见的量,因此在设计观测器时可以利用. (8)可检测. 为此,把观测方程改为 其次,把性能指标函数转化为用系统(8)的有 Z(k)=C,X(k). (16) 关量表示: 其中
北 京 科 技 大 学 学 报 第 36 卷 合,得到 X( k + 1) = ΦXX( k) + GXΔu( k) . ( 6) 其中 X( k) = X0 ( k) XR ( k) Xd ( k ) = e( k) Δx( k) XR ( k) Xd ( k ) , ΦX = Φ GXR GXd 0 AR 0 0 0 A d ,GX = G 0 0 , GXR =[0 GR 0 … 0]∈R( m + n) × m( MR + 1) , GXd =[Gd 0 0 … 0]∈R( m + n) × q( Md + 1) . 同时还有 e( k) = C1X( k) . ( 7) 其中 C1 =[C0 0 0]= [Im 0]∈Rm ×[m + n + m( MR + 1) + q( Md + 1) ]. 综合式( 6) 和( 7) ,得到系统 X( k + 1) = ΦXX( k) + GXΔu( k) , {e( k) = C1X( k) . ( 8) 这就是所需要的扩大误差系统. 如果( 8) 的闭环系统渐近稳定,就能够使式( 3) 成立. 因此问题转变为研究形式系统( 8) 的控制问 题. 为了下面证明方便,对 ΦX 和 GX 进行 如 下 分块: ΦX = Im - CA GR1 Gd1 0 A 0 Gd2 0 0 AR 0 0 0 0 A d ,GX = - CB B 0 0 . 式中, GR1 =[0 Im 0 …{0 ( MR - 1) 个0m × m ], Gd1 =[- CE 0 0 … 0 Md个0m × q ], Gd2 =[E 0 0 … 0 Md个0n × q ]. 首先,需要知道系统( 1) 满足什么条件时系统 ( 8) 是可镇定和可检测的. 下面的两个引理可以用 类似于文献[4,13]的方法证明,此处从略. 引理 1 若( A,B) 可镇定且矩阵 A - I B [ C ] 0 行 满秩,则系统( 8) 可镇定. 若( C,A) 可检测,则系统 ( 8) 可检测. 其次,把性能指标函数转化为用系统( 8) 的有 关量表示: J = ∑ ∞ k = 1 [XT ( k) QX( k) + ΔuT ( k) HΔu( k) ]. ( 9) 其中 Q = ^ Q 0 [ ] 0 0 ,^ Q = Qe 0 [ ] 0 0 ,^ Q 为 m + n 阶方阵, Q 为 m + n + m( MR + 1) + q( Md + 1) 阶方阵. 引理 2 如果以下条件满足 ( 1) ( A,B) 可镇定,且矩阵 A - I B [ C ] 0 行满秩, ( 2) ( C,A) 可检测, ( 3) Qe > 0, 则系统( 8) 的使性能指标函数( 9) 取最小值的带有 预见前馈作用的最优输入为 Δu( k) = F0X0 ( k) + ∑ MR j = 1 FR ( j) ΔR( k + j) + ∑ Md j = 0 Fd ( j) Δd( k + j) = Fee( k) + FxΔx( k) + ∑ MR j = 1 FR ( j) ΔR( k + j) + ∑ Md j = 0 Fd ( j) Δd( k + j) . ( 10) 式中, F0 =[Fe Fx]= -[H + GT PG]- 1GT PΦ, ( 11) FR ( j) = -[H + GT PG]- 1GT ( ξT ) j - 1PGR ( j = 1,2,…,MR ) , ( 12) Fd ( j) = -[H + GT PG]- 1GT ( ξT ) j PGd ( j = 0,1,2,…,Md ) , ( 13) ξ = Φ + GF0 . ( 14) P 是如下代数 Riccati 方程的解: P = ^ Q + ΦT PΦ - ΦT PG[H + GT PG]- 1GT PΦ. ( 15) 2. 2 状态观测器的设计 如果有部分状态变量不能直接用于反馈,我们 可以设计状态观测器. 原系统部分状态变量不能直 接用于反馈相当于式( 10) 中 X0 的部分向量 Δx( k) 有一些分量不能直接用于反馈. 为简单起见,设计 针对 Δx( k) 的状态观测器. 由于这里的控制输入是 从扩大误差系统( 8) 出发确定的,所以利用系统( 8) 来设计观测器,这相当于系统( 8) 的降维观测器. 系统( 8) 的状态向量中包括 XR ( k) 和 Xd ( k) , 而这是可预见的量,因此在设计观测器时可以利用. 为此,把观测方程改为 Z( k) = CZX( k) . ( 16) 其中 · 293 ·
第3期 廖福成等:基于状态观测器的线性离散时间系统的最优预见控制 ·393· 0 0 0 0 -2C 0 0 Cz= 0 0 Im(Mg+1) 0 0 A-zl 0 0 0 0 +D) 0 0 0 0 0 0 0 0 考虑系统 rX(k+1)=ΦxX(k)+Gx△u(k), In 0 0 0 (17) 0 0 In(WR+D 0 Z (k)=CzX(k). 按照状态观测器理论,需要(Cz,④,)可观测. 0 0 Ig+D) 定理1当(C,A)可观测且A可逆时,系统 (1)当z=0时, (17)可观测. Γ00 0 0 证明:由PBH判别法,只要证明对所有的z,可 0A 0 0 Φx一 00 0 0 观测矩阵U。= 列满秩对U。进行初等变 rank (U)rank 00 0 0 换得到 I 0 0 0 (1 -z)1m -CA G 00 In(g+1) 0 0 A-2I 0 Gi L00 0 I) 0 0 Ag-2I 0 m+m (Mg +1)+(M+1)+rank(A). Uo= 0 0 0 A-zI 所以A可逆时,U。列满秩 0 0 0 (2)当z≠0时, 0 0 「0 -2C 0 0 0 I 0 0 1 A-2l 0 0 0 0 0 0 0 0 0 -CA 00 0 0 0 A-zI, 0 Gi rank (U)=rank 0 0 0 0 0 Ag-zI 0 0 0 0 0 0 A-2I Im(g+1) 0 0 0 0 0 0 IgOM+D 0 0 I 0 mm (Mg +1)+q(M +1)rank A-. 0 0 0 C I 「0 -CA 0 因此,当(C,A)可观测时,U。列满秩 结合(1)、(2)两步,本定理得证 0A-zl。 0 补充假设: 0 0 0 0 假设4设系统(1)可观测,并且矩阵A可逆 0 0 0A-z 把系统(17)重新分块.令 0 0 0 -CA:A13 -CB 0 0 I ④x= 0A Gx B 0 0 0 I 00A3J 0 0 -CA007 rI0 0 A-l.00 -[C90C], 0 0 00 C= 0 0 00 Xk(k) 0 00 xu(因=x,()J 0 I 0 其中 0 0 01 A1=[Gk 614-pc1A=W
第 3 期 廖福成等: 基于状态观测器的线性离散时间系统的最优预见控制 CZ = Im 0 0 0 0 0 Im( MR + 1) 0 0 0 0 Iq( Md + 1 ) . 考虑系统 X( k + 1) = ΦXX( k) + GXΔu( k) , {Z( k) = CZX( k) . ( 17) 按照状态观测器理论,需要( CZ,ΦX ) 可观测. 定理 1 当( C,A) 可观测且 A 可逆时,系统 ( 17) 可观测. 证明: 由 PBH 判别法,只要证明对所有的 z,可 观测矩阵 U0 = ΦX - zI [ C ] Z 列满秩. 对 U0 进行初等变 换得到 U0 = ( 1 - z) Im - CA GR1 Gd1 0 A - zIn 0 Gd2 0 0 AR - zI 0 0 0 0 Ad - zI Im 0 0 0 0 0 I 0 0 0 0 I → 0 - CA GR1 Gd1 0 A - zIn 0 Gd2 0 0 AR - zI 0 0 0 0 Ad - zI Im 0 0 0 0 0 I 0 0 0 0 I → 0 - CA 0 Gd1 0 A - zIn 0 Gd2 0 0 0 0 0 0 0 Ad - zI Im 0 0 0 0 0 I 0 0 0 0 I → 0 - CA 0 0 0 A - zIn 0 0 0 0 0 0 0 0 0 0 Im 0 0 0 0 0 I 0 0 0 0 I → 0 - zC 0 0 0 A - zIn 0 0 0 0 0 0 0 0 0 0 Im 0 0 0 0 0 Im( MR + 1) 0 0 0 0 Iq( Md + 1 ) . ( 1) 当 z = 0 时, rank( U0 ) = rank 0 0 0 0 0 A 0 0 0 0 0 0 0 0 0 0 Im 0 0 0 0 0 Im( MR + 1) 0 0 0 0 Iq( Md + 1 ) = m + m( MR + 1) + q( Md + 1) + rank( A) . 所以 A 可逆时,U0 列满秩. ( 2) 当 z≠0 时, rank( U0 ) = rank 0 - zC 0 0 0 A - zIn 0 0 0 0 0 0 0 0 0 0 Im 0 0 0 0 0 Im( MR + 1) 0 0 0 0 Iq( Md + 1 ) = m + m( MR + 1) + q( Md + 1) + rank A - zIn [ ] C . 因此,当( C,A) 可观测时,U0 列满秩. 结合( 1) 、( 2) 两步,本定理得证. 补充假设: 假设 4 设系统( 1) 可观测,并且矩阵 A 可逆. 把系统( 17) 重新分块. 令 ΦX = Im - CA A13 0 A A23 0 0 A 33 ,GX = - CB B 0 , CZ = Im 0 0 0 0 Im( MR + 1) + q( Md + 1 [ ) ] = C( 1) Z 0 C( 3) [ Z ], XRd ( k) = XR ( k) Xd ( k [ ] ) . 其中 A13 = GR1 [ Gd1 ],A23 = [ 0 Gd2 ],A33 = AR 0 [ 0 A ] d , · 393 ·
·394 北京科技大学学报 第36卷 C= 0m(g+)+(M4+0]×m 4∈Rx(we+》+9w+],则A+M[)]= A- M,CA,因此在设计观测器时,只须进行n阶矩阵的 C9= [0m×m(MR+)+gWa+0] 特征值配置,并不增加特征值配置的难度.M2可以 IMg+)+(M+) 91 根据需要选取 于是,系统(17)可以写为 这里的观测器与对系统 re (k +1)=e(k)+AX (k)-CAAx(k)- x(k+1)=Ax(k)+Bu(), CBAu(k), Ly(k)=Cx(k) Xm (k +1)=A3Xga(k), 直接设计全维观测器完全不同.事实上,对此系统 △r(k+1)=AaXa(k)+A△r(k)+B△u(k). 直接设计全维观测器需要选择G使得矩阵A+GC 即 的特征值在复平面的单位圆内.可见,此处的预 e(k+1)1 「I A13 -CA e(k) 见控制系统观测器是一种全新的观测器 Xra(k+1) 0A3 0 Xga (k) 2.3基于状态观测器的闭环系统 △x(k+1) 0A23 △r(k) 如果系统(1)的状态向量不全能够用于状态反 馈,可以按第2.2节的方法设计关于△x(k)的状态 -CB 观测器,用△F(k)代替式(10)中的△x(k),则有: 0 △u(k), B 定理3如果以下条件满足 [A-I B e(k) (1)(A,B)可镇定,且矩阵 e (k) 行满秩, 1「 0:01 0 x(]=0 Xga (k) I:O] (2)(C,A)可观测且A可逆, △r(k) (3)0.>0, (18) 则系统(7)的带有预见前馈补偿的最优输入为 因为系统(17)经非退化线性变换可以得到系 统(18),所以(17)和(18)有相同的可观测性.即当 △u(k)=F.e(k)+F,△E(k)+∑FR)△R(k+ (C,A)可观测且A可逆时,系统(18)可观测. 按照控制理论知识和离散时间系统观测器理 力+龙F,行u4+. (20) 论-,如果系统(17)完全能观测,则存在降维观 =0 其中F。、F、Fe)(G=1,2,…,Mx)和F)G=0, 测器.因此得到: 1,…,M)由式(11)~(14)确定,△r(k)是系统 定理2如果假设4成立,则存在关于△x(k) 的观测器,可以取为 19的输出,其中M使得A+M] CA 的特征值 w&+=(a+。4])w因+ 在复平面的单位圆内 证明:(C,A)可观测可以保证(C,A)可检测, 8+0ja0+{D A+ 从而引理2的条件全部满足.(C,A)可观测且A可 逆保证了定理2的条件满足.这样,就存在式(10) 6A]-a+m-g48 的最优控制输入和(19)式所示的观测器.另外,根 据带有观测器的反馈控制系统的闭环极点设计的分 离定理P6-),观测器的极点配置是通过M使A+M 0]的特征值在复平面的单位圆内实现的,而状 -CA] (19) 态反馈是通过最优预见控制器的反馈控制律得到 其中M∈R×m+m(+)+gW+]为观测器的增益矩 的,所以此闭环系统是渐近稳定的 阵,它使得A+。门 的特征值在复平面的单位 从式(20)解出u(k),即可得到系统(1)的基于 状态观测器的最优预见控制输入,作法可以参考文 圆内 献4,13].具体实现控制律时,可以采用递归的 附注:如果令M=M1M2],其中M1∈R"xm, 方法
北 京 科 技 大 学 学 报 第 36 卷 C( 1) Z = Im [ 0[m( MR + 1) + q( Md + 1) ]× ] m = def I [ ] 0 , C( 3) Z = 0m ×[m( MR + 1) + q( Md + 1) ] Im( MR + 1) + q( Md + 1 [ ] ) = def 0 [ ] I . 于是,系统( 17) 可以写为 e( k + 1) = e( k) +A13XRd ( k) -CAΔx( k) - CBΔu( k) , XRd ( k + 1) =A33XRd ( k) , Δx( k + 1) =A23XRd ( k) +AΔx( k) +BΔu( k) . 即 e( k + 1) XRd ( k + 1) Δx( k + 1 ) = I A13 - CA 0 A33 0 0 A23 A e( k) XRd ( k) Δx( k ) + - CB 0 B Δu( k) , e( k) XRd [ ( k) ] = I 0 0 0 I [ ] 0 e( k) XRd ( k) Δx( k ) . ( 18) 因为系统( 17) 经非退化线性变换可以得到系 统( 18) ,所以( 17) 和( 18) 有相同的可观测性. 即当 ( C,A) 可观测且 A 可逆时,系统( 18) 可观测. 按照控制理论知识和离散时间系统观测器理 论[26--27],如果系统( 17) 完全能观测,则存在降维观 测器. 因此得到: 定理 2 如果假设 4 成立,则存在关于 Δx( k) 的观测器,可以取为 W( k + 1) = A + M - CA ( [ ] ) 0 W( k) + B + M - CB ( [ ] ) 0 Δu( k) { + [0 A23]+ M I A13 [ 0 A ] 33 - A + M - CA ( [ ] ) 0 } M e( k) XRd [ ( k) ] , Δx^( k) = W( k) - M e( k) XRd [ ( k) ] . ( 19) 其中 M∈Rn ×[m + m( MR + 1) + q( Md + 1) ]为观测器的增益矩 阵,它使得 A + M - CA [ ] 0 的特征值在复平面的单位 圆内. 附注: 如果令 M =[M1 M2],其中 M1∈Rn × m, M2 ∈Rn ×[m( MR + 1) + q( Md + 1) ],则 A + M - CA [ ] 0 = A - M1CA,因此在设计观测器时,只须进行 n 阶矩阵的 特征值配置,并不增加特征值配置的难度. M2 可以 根据需要选取. 这里的观测器与对系统 x( k + 1) = Ax( k) + Bu( k) , {y( k) = Cx( k) 直接设计全维观测器完全不同. 事实上,对此系统 直接设计全维观测器需要选择 G 使得矩阵 A + GC 的特征值在复平面的单位圆内[26]. 可见,此处的预 见控制系统观测器是一种全新的观测器. 2. 3 基于状态观测器的闭环系统 如果系统( 1) 的状态向量不全能够用于状态反 馈,可以按第 2. 2 节的方法设计关于 Δx( k) 的状态 观测器,用 Δx^( k) 代替式( 10) 中的 Δx( k) ,则有: 定理 3 如果以下条件满足 ( 1) ( A,B) 可镇定,且矩阵 A - I B [ C ] 0 行满秩, ( 2) ( C,A) 可观测且 A 可逆, ( 3) Qe > 0, 则系统( 7) 的带有预见前馈补偿的最优输入为 Δu( k) = Fee( k) + FxΔx^( k) + ∑ MR j = 1 FR ( j) ΔR( k + j) + ∑ Md j = 0 Fd ( j) Δd( k + j) . ( 20) 其中 Fe、Fx、FR ( j) ( j = 1,2,…,MR ) 和 Fd ( j) ( j = 0, 1,…,Md ) 由式( 11) ~ ( 14 ) 确 定,Δx^ ( k) 是 系 统 ( 19) 的输出,其中 M 使得 A + M - CA [ ] 0 的特征值 在复平面的单位圆内. 证明: ( C,A) 可观测可以保证( C,A) 可检测, 从而引理 2 的条件全部满足. ( C,A) 可观测且 A 可 逆保证了定理 2 的条件满足. 这样,就存在式( 10) 的最优控制输入和( 19) 式所示的观测器. 另外,根 据带有观测器的反馈控制系统的闭环极点设计的分 离定理[26--27],观测器的极点配置是通过 M 使 A + M - CA [ ] 0 的特征值在复平面的单位圆内实现的,而状 态反馈是通过最优预见控制器的反馈控制律得到 的,所以此闭环系统是渐近稳定的. 从式( 20) 解出 u( k) ,即可得到系统( 1) 的基于 状态观测器的最优预见控制输入,作法可以参考文 献[4,13]. 具体实现控制律时,可以采用递归的 方法. · 493 ·