工程科学学报.第42卷,第2期:135-143.2020年2月 Chinese Journal of Engineering,Vol.42,No.2:135-143,February 2020 https://doi.org/10.13374/j.issn2095-9389.2019.02.25.006;http://cje.ustb.edu.cn 多模型自适应控制理论及应用 张玉振,李擎区,张维存,杨宇航 北京科技大学自动化学院,北京100083 ☒通信作者,E-mail:liging@ies.ustb.edu.cn 摘要作为对经典自适应控制改进的控制方法,多模型自适应控制是解决复杂的大范围参数不确定系统的一种有效途径, 并在理论和实践中取得了丰富成果。依据控制器集的不同综合策略,其被分为多种类型,本文旨在对加权型的多模型自适应 控制进行综述.加权多模型自适应控制的基本思路是采用“分而治之”的办法,离线建立多个局部模型和对应的多个局部控 制器,在线加权融合各个局部控制器的控制输出,从而形成全局控制,是实现鲁棒自适应控制的一类重要方法.首先比较详 细地介绍了加权多模型自适应控制研究的历史及现状,然后给出相关研究的新进展和一些观点,包括新的加权算法和相应的 加权多模型自适应控制系统的稳定性结果等,最后指出未来的几个研究方向 关键词加权算法:多模型自适应控制:稳定性:收敛性:虚拟等价系统 分类号TP273 Survey of multi-model adaptive control theory and its applications ZHANG Yu-zhen,LI Qing,ZHANG Wei-cun.YANG Yu-hang School of Automation and Electrical Engineering,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:liqing@ies.ustb.edu.cn ABSTRACT Multi-model adaptive control,as an improved method of classical adaptive control,can effectively solve the control performance issues for the complex systems with large parameter uncertainties.It has attracted increasing attention from scholars,and a vast array of research results have been achieved in theory and practice.According to the different synthesis methods of multiple local controllers corresponding to the multiple local models,the multi-model adaptive control scheme can be divided into different categories. This paper provides a survey of weighted multi-model adaptive control (WMMAC).The basic idea of the WMMAC is to adopt the method of "divide and conquer";multiple local models and corresponding multiple local controllers are established offline,and the control outputs of local controllers are integrated online,such that the global control law can be formed.The WMMAC is a promising method to achieve strong robustness and a self-adaptive ability for control systems.First,we presented the development process and the main problems of the WMMAC.Then,the research status of control systems and the latest progress were shown,including model set construction and weighting algorithm design.To improve the rationality of model set construction,WMMACs with self-tuning model and even a dynamic model set have been developed.Meanwhile,to reduce the calculation burden,a new weighting algorithm has been designed,which is based on the model output errors of the multi-model adaptive control system.Especially for system stability analysis, which has always been a recognized problem in the WMMAC system,some research results have been obtained.The proof of system stability in the general sense has been given preliminarily by introducing the theory of virtual equivalent system.This paper gave a review of WMMAC in the order of the variation on the structure,the development of algorithms and its applications.Furthermore,the main problems in the control system were analyzed,and some potential research directions,which are the difficulties and emphases of 收稿日期:2019-02-25 基金项目:国家自然科学基金资助项目(61673098.61603034):北京市自然科学基金资助项目(3182027):中央高校基本科研业务费(FRF- GF-17-B44)
多模型自适应控制理论及应用 张玉振,李 擎苣,张维存,杨宇航 北京科技大学自动化学院,北京 100083 苣通信作者,E-mail:liqing@ies.ustb.edu.cn 摘 要 作为对经典自适应控制改进的控制方法,多模型自适应控制是解决复杂的大范围参数不确定系统的一种有效途径, 并在理论和实践中取得了丰富成果. 依据控制器集的不同综合策略,其被分为多种类型,本文旨在对加权型的多模型自适应 控制进行综述. 加权多模型自适应控制的基本思路是采用“分而治之”的办法,离线建立多个局部模型和对应的多个局部控 制器,在线加权融合各个局部控制器的控制输出,从而形成全局控制,是实现鲁棒自适应控制的一类重要方法. 首先比较详 细地介绍了加权多模型自适应控制研究的历史及现状,然后给出相关研究的新进展和一些观点,包括新的加权算法和相应的 加权多模型自适应控制系统的稳定性结果等,最后指出未来的几个研究方向. 关键词 加权算法;多模型自适应控制;稳定性;收敛性;虚拟等价系统 分类号 TP273 Survey of multi-model adaptive control theory and its applications ZHANG Yu-zhen,LI Qing苣 ,ZHANG Wei-cun,YANG Yu-hang School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing 100083, China 苣 Corresponding author, E-mail: liqing@ies.ustb.edu.cn ABSTRACT Multi-model adaptive control, as an improved method of classical adaptive control, can effectively solve the control performance issues for the complex systems with large parameter uncertainties. It has attracted increasing attention from scholars, and a vast array of research results have been achieved in theory and practice. According to the different synthesis methods of multiple local controllers corresponding to the multiple local models, the multi-model adaptive control scheme can be divided into different categories. This paper provides a survey of weighted multi-model adaptive control (WMMAC). The basic idea of the WMMAC is to adopt the method of “divide and conquer”; multiple local models and corresponding multiple local controllers are established offline, and the control outputs of local controllers are integrated online, such that the global control law can be formed. The WMMAC is a promising method to achieve strong robustness and a self-adaptive ability for control systems. First, we presented the development process and the main problems of the WMMAC. Then, the research status of control systems and the latest progress were shown, including model set construction and weighting algorithm design. To improve the rationality of model set construction, WMMACs with self-tuning model and even a dynamic model set have been developed. Meanwhile, to reduce the calculation burden, a new weighting algorithm has been designed, which is based on the model output errors of the multi-model adaptive control system. Especially for system stability analysis, which has always been a recognized problem in the WMMAC system, some research results have been obtained. The proof of system stability in the general sense has been given preliminarily by introducing the theory of virtual equivalent system. This paper gave a review of WMMAC in the order of the variation on the structure, the development of algorithms and its applications. Furthermore, the main problems in the control system were analyzed, and some potential research directions, which are the difficulties and emphases of 收稿日期: 2019−02−25 基金项目: 国家自然科学基金资助项目(61673098,61603034);北京市自然科学基金资助项目(3182027);中央高校基本科研业务费(FRFGF-17-B44) 工程科学学报,第 42 卷,第 2 期:135−143,2020 年 2 月 Chinese Journal of Engineering, Vol. 42, No. 2: 135−143, February 2020 https://doi.org/10.13374/j.issn2095-9389.2019.02.25.006; http://cje.ustb.edu.cn
·136 工程科学学报,第42卷,第2期 future research including model set,weight calculation,disturbance rejection,stability,were pointed out. KEY WORDS weighting algorithm;multi-model adaptive control;stability;convergence;virtual equivalent system 鲁棒和自适应两个性能是控制理论追求的最 先采用的多重药物控制器更佳的性能四此外,在 高境界-),多模型方法是实现鲁棒自适应控制的 复杂多变的太空环境下,空间机器人是具有高度 一个重要途径,多模型自适应控制主要包括切换 非线性、强耦合和大范围不确定性的复杂系统,通 和加权两大类综合方式,其不同的综合策略关系 过对柔性机械臂的加权多模型自适应控制,实现 着多模型的分解以及系统框架的构建.考虑到切 对运动位置的精确跟踪以及柔性结构的振动抑 换多模型自适应控制的研究已经比较成熟,比如 制,满足其精确灵活、强适应性的现实需求 稳定性分析、镇定控制设计等方面,均取得了 加权型多模型自适应控制系统的稳定性问题曾 丰富的研究成果相较而言,加权多模型自适应 经是一个公认的难题,相关论述见文献[1,25-28,31,33] 控制仍然存在较多问题,所以本文只关注加权多 2010年以来,各种加权多模型自适应控制系统的稳 模型自适应控制.多模型的思想最初于20世纪 定性结果相继出现,尤其是基于虚拟等价系统理论 60年代由Magill提出)并被应用于含不确定参数 的一般意义下的稳定性分析,取得了一些进展 的随机系统的状态估计,即加权多模型自适应估 关于经典加权算法收敛性的理论研究见文 (multiple model adaptive estimation,MMAE). 献[34-36],Lainiotis分割算法收敛性能分析见文 后,Lainiotis和Athans等8-lo提出用多模型方法进 献[37],但由于经典加权算法是基于Kalman滤 行自适应控制,即加权多模型自适应控制(multiple 波、动态假设检验以及贝叶斯后验概率公式进行 model adaptive control,.MMAC),其局部控制器采 递推计算的,因此分析复杂且要求条件比较苛刻, 用线性二次高斯(linear quadratic Gaussian,.LQG)控 可以大致归纳为:各个模型所产生的输出误差信 制.之后其应用范围不断扩大,包括在故障诊 号需要满足平稳性、遍历性,以及模型输出误差之 断山、医疗②、目标跟踪)、航空、过程控制 间可以区分,细节见文献[】 等领域的应用,且又不断有一些相关的理论研究 本文首先介绍加权多模型自适应控制的发展 成果出现61】近年来加权多模型自适应控制的 历史,然后给出最新的相关研究进展及其代表性 研究又越来越多地受到人们的关注,比如,通过设 工作,最后指出需要继续研究的一些问题. 计鲁棒控制器作为其局部控制器,进而构成鲁棒 1常规多模型自适应控制 多模型自适应控制方法山,1(包括收敛性分析20、 模型集四、性能指标四以及应用2]等方面研究), 1.1经典多模型自适应控制 以及采用模糊规则的多模型自适应融合控制-2, 经典多模型自适应控制(classical multiple model 等等.从国内来讲,学者们对加权多模型自适应控 adaptive control..CMMAC)指的是早期出现的加权 制的理论及相关应用的研究比较晚,特别是80年 多模型自适应控制,其采用LQG策略设计局部控 代以前几乎是空白,1988年以后才有相关研究成 制器.其最主要的特点是系统状态估计与控制是 果出现,后续不断有相关应用成果7-9及理论 绑定的,具体而言,其局部控制器乃至全局控制器 研究进展0-划 都要依赖于状态估计进行设计.具体的系统原 加权多模型自适应控制,作为一种对切换型 理四如图1所示. 方法的延展,即“软切换”,其与增益调度控制或基 图中KF,(Kalman filter)代表卡尔曼滤波器, 于Takagi--Sugeno(T-S)模型的模糊控制在某种程 i=1,·,N.由各局部的卡尔曼滤波器给出各自的状 度上相类似.该方法对于存在有限多个参数不确 态估计),而整体的状态估计为)=P()0. 定的随机系统的控制非常适宜,并逐渐在各种领 各个局部控制器按照线性二次增益计算各自的局 域开展研究,尤其是在航空领域的飞行控制,汽车 部控制量()=-G·(①),-G为线性二次增益.而 领域的主动悬架控制和医疗领域的药物输入控制 整体控制量为u)=∑P()(),系统输出为() 等方面应用,比如通过对输入药物速率进行加权 后验概率估计器(posterior probability estimator,.PPE) 多模型自适应控制,以达到调节患者平均动脉压 用于计算加权值P(刀.图1中,S:为离线计算得 以及心输出量的目的,并在动物试验中获得比早 到的第个卡尔曼滤波器的稳态残差:(t)的方差矩
future research including model set, weight calculation, disturbance rejection, stability, were pointed out. KEY WORDS weighting algorithm;multi-model adaptive control;stability;convergence;virtual equivalent system 鲁棒和自适应两个性能是控制理论追求的最 高境界[1−2] ,多模型方法是实现鲁棒自适应控制的 一个重要途径,多模型自适应控制主要包括切换 和加权两大类综合方式,其不同的综合策略关系 着多模型的分解以及系统框架的构建. 考虑到切 换多模型自适应控制的研究已经比较成熟,比如 稳定性分析、镇定控制设计等方面[3−5] ,均取得了 丰富的研究成果[6] . 相较而言,加权多模型自适应 控制仍然存在较多问题,所以本文只关注加权多 模型自适应控制. 多模型的思想最初于 20 世纪 60 年代由 Magill 提出[7] 并被应用于含不确定参数 的随机系统的状态估计,即加权多模型自适应估 计 (multiple model adaptive estimation,MMAE) . 随 后,Lainiotis 和 Athans 等[8−10] 提出用多模型方法进 行自适应控制,即加权多模型自适应控制(multiple model adaptive control,MMAC),其局部控制器采 用线性二次高斯(linear quadratic Gaussian,LQG)控 制. 之后其应用范围不断扩大 ,包括在故障诊 断[11]、医疗[12]、目标跟踪[13]、航空[14]、过程控制[15] 等领域的应用,且又不断有一些相关的理论研究 成果出现[16−18] . 近年来加权多模型自适应控制的 研究又越来越多地受到人们的关注,比如,通过设 计鲁棒控制器作为其局部控制器,进而构成鲁棒 多模型自适应控制方法[1, 19] (包括收敛性分析[20]、 模型集[21]、性能指标[22] 以及应用[23] 等方面研究), 以及采用模糊规则的多模型自适应融合控制[24−25] , 等等. 从国内来讲,学者们对加权多模型自适应控 制的理论及相关应用的研究比较晚,特别是 80 年 代以前几乎是空白,1988 年以后才有相关研究成 果出现[26] ,后续不断有相关应用成果[27−29] 及理论 研究进展[30−32] . 加权多模型自适应控制,作为一种对切换型 方法的延展,即“软切换”,其与增益调度控制或基 于 Takagi-Sugeno(T-S)模型的模糊控制在某种程 度上相类似. 该方法对于存在有限多个参数不确 定的随机系统的控制非常适宜,并逐渐在各种领 域开展研究,尤其是在航空领域的飞行控制,汽车 领域的主动悬架控制和医疗领域的药物输入控制 等方面应用,比如通过对输入药物速率进行加权 多模型自适应控制,以达到调节患者平均动脉压 以及心输出量的目的,并在动物试验中获得比早 先采用的多重药物控制器更佳的性能[12] . 此外,在 复杂多变的太空环境下,空间机器人是具有高度 非线性、强耦合和大范围不确定性的复杂系统,通 过对柔性机械臂的加权多模型自适应控制,实现 对运动位置的精确跟踪以及柔性结构的振动抑 制,满足其精确灵活、强适应性的现实需求. 加权型多模型自适应控制系统的稳定性问题曾 经是一个公认的难题,相关论述见文献[1,25−28,31,33]. 2010 年以来,各种加权多模型自适应控制系统的稳 定性结果相继出现,尤其是基于虚拟等价系统理论 的一般意义下的稳定性分析,取得了一些进展. 关于经典加权算法收敛性的理论研究见文 献 [34−36],Lainiotis 分割算法收敛性能分析见文 献 [37],但由于经典加权算法是基 于 Kalman 滤 波、动态假设检验以及贝叶斯后验概率公式进行 递推计算的,因此分析复杂且要求条件比较苛刻, 可以大致归纳为:各个模型所产生的输出误差信 号需要满足平稳性、遍历性,以及模型输出误差之 间可以区分,细节见文献 [1]. 本文首先介绍加权多模型自适应控制的发展 历史,然后给出最新的相关研究进展及其代表性 工作,最后指出需要继续研究的一些问题. 1 常规多模型自适应控制 1.1 经典多模型自适应控制 经典多模型自适应控制(classical multiple model adaptive control,CMMAC)指的是早期出现的加权 多模型自适应控制,其采用 LQG 策略设计局部控 制器. 其最主要的特点是系统状态估计与控制是 绑定的,具体而言,其局部控制器乃至全局控制器 都要依赖于状态估计进行设计. 具体的系统原 理[1] 如图 1 所示. i = 1,··· ,N xˆi(t) xˆ(t) = ∑N i=1 Pi(t)· xˆi(t) ui(t) = −Gi · xˆi(t) −Gi u(t) = ∑N i=1 Pi(t)· ui(t) y(t) Pi(t) Si i ri(t) 图中 KFi( Kalman filter)代表卡尔曼滤波器 , . 由各局部的卡尔曼滤波器给出各自的状 态估计 ,而整体的状态估计为 . 各个局部控制器按照线性二次增益计算各自的局 部控制量 , 为线性二次增益. 而 整体控制量为 ,系统输出为 . 后验概率估计器(posterior probability estimator,PPE) 用于计算加权值 [1, 7] . 图 1 中, 为离线计算得 到的第 个卡尔曼滤波器的稳态残差 的方差矩 · 136 · 工程科学学报,第 42 卷,第 2 期
张玉振等:多模型自适应控制理论及应用 137 过程噪声)(量测噪声 u(1) t 未知被控对象 () 4(0 KF -G1 0 4(t) KF2 -G1 ) ud(r) KFx -Gx rx rt) r() ★女 P() 后验概 率估计 差 (PPE) P(1 Px(1) 图1经典加权多模型自适应控制系统框图 Fig.1 Block diagram for CMMAC 阵.实际上,经典多模型自适应控制的加权算法完 到P,),必须经过(零阶)保持器才能得到连续的 全继承了加权多模型自适应估计的加权算法 加权值P(t). 1.2鲁棒多模型自适应控制 RMMAC和经典加权自适应控制一样,存在以 鲁棒多模型自适应控制(robust multiple model 下问题: adaptive control,,RMMAC)仍然属于加权多模型自 (1)由于采用了多个卡尔曼滤波器.使得计算 适应控制,具体来说,它是在CMMAC的基础上, 过程繁琐,并且需依赖于初始条件: 结合了现代鲁棒控制系统设计方法(包括H鲁棒 (2)闭环稳定性难以分析; 控制器设计方法,“综合法鲁棒控制器设计方法等 (3)加权算法的收敛条件苛刻 最新成果,其中H,为定义在Hardy空间上的范数, 加权算法的收敛性难以分析并且要求条件较 u为结构奇异值)并利用MATLAB的相关工具来 多,这并非RMMAC独有的缺点,而是只要采用经 设计局部控制器,并对CMMAC的结构做了如下 典加权算法都会有此问题存在 修改:CMMAC的局部控制器采用的是状态反馈 13基于模糊融合的多模型自适应控制 来产生局部控制量,而RMMAC的局部控制器采 为了克服基于Kalman波器、动态假设检验 用的是基于:综合法设计的动态输出反馈来产生 以及贝叶斯后验概率公式的权值算法中存在的上 局部控制量,从另一个方面来说,CMMAC中的卡 述缺点,Kuipers和Baldi等提出采用模糊规则取代 尔曼滤波器既用于权值的计算(利用其产生的残 基于Kalman滤波和动态假设检验来计算权值的 差序列),也用于局部控制器的状态反馈控制(利 办法,直接依据隶属度函数来计算权值24-2),此类 用其状态估计结果),而RMMAC中的卡尔曼滤波 方法实质上是多个控制器间的“模糊融合(FuZ 器只用于加权值的计算,而与局部控制器无关,这 Fusion)”,其计算量相对减少,易于实现 样一来使得估计(辨识)子系统与控制部分隔离开 该类方法根据参数辨识结果和模糊规则计算 来.RMMAC系统的原理山如图2所示,图中, 出加权值,再将加权值与各个局部控制器产生的 K(0为局部控制器,i=1,…,N. 局部控制信号进行加权融合,得到全局的控制输 值得指出的是,RMMAC的加权算法与CMMAC 出.每个局部控制器的设计与RMMAC一样,也是 的加权算法是完全一样的,当然也和MMAE的加 基于H鲁棒控制器设计方法或综合法鲁棒控制 权算法完全一致 器设计方法来设计的动态输出补偿器(控制器). 文献[]的RMMAC结构图及相关论述中,都 采用模糊融合方法的MMAC系统原理P如图3 忽略了一点:加权值只能在离散时刻进行计算得 所示,图中,()为系统辨识参数
阵. 实际上,经典多模型自适应控制的加权算法完 全继承了加权多模型自适应估计的加权算法. 1.2 鲁棒多模型自适应控制 H∞ Ki(t) i = 1,··· ,N 鲁棒多模型自适应控制(robust multiple model adaptive control,RMMAC)仍然属于加权多模型自 适应控制,具体来说,它是在 CMMAC 的基础上, 结合了现代鲁棒控制系统设计方法(包括 鲁棒 控制器设计方法,μ 综合法鲁棒控制器设计方法等 最新成果,其中 H∞为定义在 Hardy 空间上的范数, μ 为结构奇异值)并利用 MATLAB 的相关工具来 设计局部控制器,并对 CMMAC 的结构做了如下 修改:CMMAC 的局部控制器采用的是状态反馈 来产生局部控制量,而 RMMAC 的局部控制器采 用的是基于 μ 综合法设计的动态输出反馈来产生 局部控制量,从另一个方面来说,CMMAC 中的卡 尔曼滤波器既用于权值的计算(利用其产生的残 差序列),也用于局部控制器的状态反馈控制(利 用其状态估计结果),而 RMMAC 中的卡尔曼滤波 器只用于加权值的计算,而与局部控制器无关,这 样一来使得估计(辨识)子系统与控制部分隔离开 来 . RMMAC 系统的原理 [1] 如 图 2 所示 ,图中 , 为局部控制器, . 值得指出的是,RMMAC 的加权算法与 CMMAC 的加权算法是完全一样的,当然也和 MMAE 的加 权算法完全一致. 文献 [1] 的 RMMAC 结构图及相关论述中,都 忽略了一点:加权值只能在离散时刻进行计算得 Pi(k) Pi(t) 到 ,必须经过(零阶)保持器才能得到连续的 加权值 . RMMAC 和经典加权自适应控制一样,存在以 下问题: (1)由于采用了多个卡尔曼滤波器,使得计算 过程繁琐,并且需依赖于初始条件; (2)闭环稳定性难以分析; (3)加权算法的收敛条件苛刻. 加权算法的收敛性难以分析并且要求条件较 多,这并非 RMMAC 独有的缺点,而是只要采用经 典加权算法都会有此问题存在. 1.3 基于模糊融合的多模型自适应控制 为了克服基于 Kalman 滤波器、动态假设检验 以及贝叶斯后验概率公式的权值算法中存在的上 述缺点,Kuipers 和 Baldi 等提出采用模糊规则取代 基于 Kalman 滤波和动态假设检验来计算权值的 办法,直接依据隶属度函数来计算权值[24−25] ,此类 方法实质上是多个控制器间的“模糊融合(Fuzzy Fusion)”,其计算量相对减少,易于实现. H∞ µ θ(t) 该类方法根据参数辨识结果和模糊规则计算 出加权值,再将加权值与各个局部控制器产生的 局部控制信号进行加权融合,得到全局的控制输 出. 每个局部控制器的设计与 RMMAC 一样,也是 基于 鲁棒控制器设计方法或 综合法鲁棒控制 器设计方法来设计的动态输出补偿器(控制器). 采用模糊融合方法的 MMAC 系统原理[24] 如图 3 所示,图中, 为系统辨识参数. … … … … … … 未知被控对象 KF1 KF2 KFN 后验概 率估计 (PPE) 过程噪声ζ(t) ω(t)量测噪声 u(t) −G1 −G2 −GN u2 (t) u1 (t) u(t) y(t) x1 (t) x2 (t) uN (t) r2 (t) r1 (t) S1 S2 SN rN (t) P2 (t) P1 (t) PN (t) xN (t) 残差方差 图 1 经典加权多模型自适应控制系统框图 Fig.1 Block diagram for CMMAC 张玉振等: 多模型自适应控制理论及应用 · 137 ·
·138 工程科学学报,第42卷.第2期 过程噪声)a)量测噪声 u(1) ) 未知被控对象 局部控制器 KFs r(1) K(s) 1山(t) KF (0) u(1) KF: r() K.(s) KF K(s) +8 P(0 后验概 率估计 (PPE) P2(0 P() 图2鲁棒多模型自适应控制系统框图 Fig.2 Block diagram for RMMAC 过程噪声《) (t)量测噪声 u() Mi) 未知被控对象 局部控制器 4(t) 参数辨识 K (s) + A(r) (t) K2(s) 模糊规则 K(s) 4t) P() … P(1) Pi(1) 图3采用模糊融合的多模型自适应控制系统框图 Fig.3 Block diagram for MMAC using fuzzy fusion 但是,此类方法也有一定的问题存在,首先是 在此基础上设计了若干个在线辨识的模型和一个 离线获取准确的模糊规则隶属度函数并非易事; 固定的模型,通过仿真研究验证了控制系统的优 其次是该方法需要在线参数估计,因此为了参数 异性.此外,文献[40-42]针对含有参数大范围不 估计的一致收敛性,需要附加持续激励信号,这是 确定性的随机系统提出了新的加权算法和相应的 控制系统所不希望的 加权多模型自适应控制系统,并在文献[43-44]中 对该控制系统的稳定性进行了分析,取得了令人 2其他多模型自适应控制 满意的仿真效果.同时,文献[45]给出了相应获得 近年来,Zhuo和Narendra提出了在被控对象 的实际应用成果 的多个模型参数上进行加权融合(凸组合),这可 随着多模型和神经网络的不断发展,文献[46] 以理解为第一层自适应;然后根据融合后的模型 提出了一种基于多模型和神经网络的非线性控制 设计自适应控制器,这是第二层自适应.这类方法 系统框架,但该系统全局输人输出有界的稳定性 实际上是在参数估计的层面上引进了加权思想, 条件较为苛刻,文献[47-48]拓展了此类多模型自 也取得了很好的理论和仿真实验结果网,文献[39) 适应控制的适用范围,文献[49-50]针对一类非线
但是,此类方法也有一定的问题存在,首先是 离线获取准确的模糊规则隶属度函数并非易事; 其次是该方法需要在线参数估计,因此为了参数 估计的一致收敛性,需要附加持续激励信号,这是 控制系统所不希望的. 2 其他多模型自适应控制 近年来,Zhuo 和 Narendra 提出了在被控对象 的多个模型参数上进行加权融合(凸组合),这可 以理解为第一层自适应;然后根据融合后的模型 设计自适应控制器,这是第二层自适应. 这类方法 实际上是在参数估计的层面上引进了加权思想, 也取得了很好的理论和仿真实验结果[38] . 文献 [39] 在此基础上设计了若干个在线辨识的模型和一个 固定的模型,通过仿真研究验证了控制系统的优 异性. 此外,文献 [40−42] 针对含有参数大范围不 确定性的随机系统提出了新的加权算法和相应的 加权多模型自适应控制系统,并在文献 [43−44] 中 对该控制系统的稳定性进行了分析,取得了令人 满意的仿真效果. 同时,文献 [45] 给出了相应获得 的实际应用成果. 随着多模型和神经网络的不断发展,文献 [46] 提出了一种基于多模型和神经网络的非线性控制 系统框架,但该系统全局输入输出有界的稳定性 条件较为苛刻,文献 [47−48] 拓展了此类多模型自 适应控制的适用范围,文献 [49−50] 针对一类非线 未知被控对象 KF1 KF2 KFN KFs 局部控制器 过程噪声ζ(t) ω(t)量测噪声 u(t) y(t) K1 (s) K2 (s) KN (s) u2 (t) u(t) u1 (t) uN (t) P2 (t) P1 (t) PN (t) r2 (t) r1 (t) rN (t) 后验概 率估计 (PPE) S1 S2 SN 残差方差 … … … … … … … 图 2 鲁棒多模型自适应控制系统框图 Fig.2 Block diagram for RMMAC 未知被控对象 模糊规则 参数辨识 局部控制器 过程噪声ζ(t) ω(t)量测噪声 u(t) y(t) K1 (s) K2 (s) KN (s) u2 (t) u(t) θ(t) u1 (t) uN (t) P2 (t) P1 P (t) N (t) … … … 图 3 采用模糊融合的多模型自适应控制系统框图 Fig.3 Block diagram for MMAC using fuzzy fusion · 138 · 工程科学学报,第 42 卷,第 2 期
张玉振等:多模型自适应控制理论及应用 139· 性离散时间系统,基于鲁棒控制方法和神经网络 的鲁棒控制策略,实际上任意具有一定鲁棒性的 设计相应的非线性自适应控制器,形成一种新型 控制策略都可以被采用,鉴于涉及内容太过广泛, 的多模型自适应控制,放宽了系统非线性项的条 此部分不做过多阐述.对于模型集的选择,其属于 件.此外,文献[51-53]给出了采用不同的神经网 建模问题,对此问题的研究主要涉及到模型差异 络结构设计相应的多模型自适应控制系统,通过 度的度量问题6例另外,简单实用的加权算法和一 神经网络辨识未知动态系统,建立自适应模型,然 般意义下的稳定性分析也是系统的重要研究内容. 后将其与固定模型进行不同形式的组合,组成模 (1)模型集 型集,经仿真实验对比,体现了控制性能的提高 关于模型集的建立,其构成形式由全部固定 在上述的多模型自适应控制系统中,神经网络基 模型发展到含有自校正模型的模型库,其建立策 本都被用于辨识,然后据此设计控制器,取得了一 略也从根据先验数据离线建模发展到通过在线学 定的研究成果.然而,当神经网络直接作为控制器 习动态优化模型库,从而在不断更新模型库的同 时,控制系统也能获得良好性能,因此,通过对局 时,有效控制模型数量,防止模型冗余6其中,利 部模型设计相应的神经控制器,以加权和的形式 用模糊聚类学习算法是建立局部模型的一类重要 进行融合,构成多神经网络自适应控制,虽然该方 方法64-6的,在此基础上,文献[67利用在线数据进 法仍然存在一些问题,但其是多模型自适应控制 而实现局部模型参数的修正.此外,文献[68]采用 解决更加复杂的非线性系统的一种重要方法. 自适应混沌差分进化算法对模型数量和模型参数 对于自适应容错控制而言,当故障发生时,保 同时优化,文献[69]基于参数定位思想设计最优 证瞬态性能的良好是其控制系统的挑战性问题, 参数子集,从而达到降低模型数量的目的.上述各 多模型自适应容错控制系统是一种改善系统瞬态 种策略,实际上都是为了使模型集能够有效地覆 性能的重要方法[,其通过适当的加权算法或切 盖并逼近被控对象而不断发展的 换规则,确保故障后获得最适宜的控制器5s-s刃,有 (2)加权算法 效补偿各种故障造成的不良影响,并不断在飞行 在加权算法方面,从早期的加权算法,刀到后 器控制中得到应用58-.文献【60]提出了一种多 来的模糊融合算法24-2,以及不断改进的算法0 层级多模型自适应方法,当故障发生时进行补偿 都可以被采用,文献[40]提出了新的加权算法,不 控制,通过不同层级覆盖不同的故障模式(结构), 再依靠Kalman滤波器和贝叶斯后验概率公式,而 参数区间和局部控制器的自适应增益更新,并在 是直接依据各个“局部”模型的在线“表现”(即模 波音747系统的仿真中获得了优良的控制性能. 型输出误差)来计算权值,基本上克服了经典加权 文献[61]针对直升机飞行操控系统,采用基于多 算法的一些缺点,其简单结构如图4所示.图中, 模型思想的直接自修复方法,保证了系统性能,并 y,(①为系统参考输入,w()为系统扰动.计算权值 且在数值仿真和试验平台上取得了较好的控制 P()的加权算法细节见文献[40],每个局部控制器 效果 K(s针对其相应的局部模型按极点配置或鲁棒控 3建模、加权算法与稳定性分析 制等方法进行设计.在此基础上,文献[41]在加权 算法中迭代计算的快速收敛方面进行了改进,提 加权多模型自适应控制系统主要由模型集、 高了加权算法的时效性 加权算法以及局部控制器三部分组成.其中,局部 加权多模型自适应控制与基于T-S模型的模 控制策略经历了从早期的LQG控制策略到现在 糊控制(采用并行补偿算法)相比,二者都是根据 K (s) p(s) w(t)) 以(t) P( 被控 K(s) 对象 Ks) P() 图4加权多模型自适应控制系统框图 Fig.4 Block diagram for WMMAC
性离散时间系统,基于鲁棒控制方法和神经网络 设计相应的非线性自适应控制器,形成一种新型 的多模型自适应控制,放宽了系统非线性项的条 件. 此外,文献 [51−53] 给出了采用不同的神经网 络结构设计相应的多模型自适应控制系统,通过 神经网络辨识未知动态系统,建立自适应模型,然 后将其与固定模型进行不同形式的组合,组成模 型集,经仿真实验对比,体现了控制性能的提高. 在上述的多模型自适应控制系统中,神经网络基 本都被用于辨识,然后据此设计控制器,取得了一 定的研究成果. 然而,当神经网络直接作为控制器 时,控制系统也能获得良好性能,因此,通过对局 部模型设计相应的神经控制器,以加权和的形式 进行融合,构成多神经网络自适应控制,虽然该方 法仍然存在一些问题,但其是多模型自适应控制 解决更加复杂的非线性系统的一种重要方法. 对于自适应容错控制而言,当故障发生时,保 证瞬态性能的良好是其控制系统的挑战性问题. 多模型自适应容错控制系统是一种改善系统瞬态 性能的重要方法[54] ,其通过适当的加权算法或切 换规则,确保故障后获得最适宜的控制器[55−57] ,有 效补偿各种故障造成的不良影响,并不断在飞行 器控制中得到应用[58−59] . 文献 [60] 提出了一种多 层级多模型自适应方法,当故障发生时进行补偿 控制,通过不同层级覆盖不同的故障模式(结构), 参数区间和局部控制器的自适应增益更新,并在 波音 747 系统的仿真中获得了优良的控制性能. 文献 [61] 针对直升机飞行操控系统,采用基于多 模型思想的直接自修复方法,保证了系统性能,并 且在数值仿真和试验平台上取得了较好的控制 效果. 3 建模、加权算法与稳定性分析 加权多模型自适应控制系统主要由模型集、 加权算法以及局部控制器三部分组成. 其中,局部 控制策略经历了从早期的 LQG 控制策略到现在 的鲁棒控制策略,实际上任意具有一定鲁棒性的 控制策略都可以被采用,鉴于涉及内容太过广泛, 此部分不做过多阐述. 对于模型集的选择,其属于 建模问题,对此问题的研究主要涉及到模型差异 度的度量问题[62] . 另外,简单实用的加权算法和一 般意义下的稳定性分析也是系统的重要研究内容. (1)模型集. 关于模型集的建立,其构成形式由全部固定 模型发展到含有自校正模型的模型库,其建立策 略也从根据先验数据离线建模发展到通过在线学 习动态优化模型库,从而在不断更新模型库的同 时,有效控制模型数量,防止模型冗余[63] . 其中,利 用模糊聚类学习算法是建立局部模型的一类重要 方法[64−66] ,在此基础上,文献 [67] 利用在线数据进 而实现局部模型参数的修正. 此外,文献 [68] 采用 自适应混沌差分进化算法对模型数量和模型参数 同时优化,文献 [69] 基于参数定位思想设计最优 参数子集,从而达到降低模型数量的目的. 上述各 种策略,实际上都是为了使模型集能够有效地覆 盖并逼近被控对象而不断发展的. (2)加权算法. yr(t) w(t) pi(t) Ki(s) 在加权算法方面,从早期的加权算法[1, 7] 到后 来的模糊融合算法[24−25] ,以及不断改进的算法[70−71] 都可以被采用,文献 [40] 提出了新的加权算法,不 再依靠 Kalman 滤波器和贝叶斯后验概率公式,而 是直接依据各个“局部”模型的在线“表现”(即模 型输出误差)来计算权值,基本上克服了经典加权 算法的一些缺点,其简单结构如图 4 所示. 图中, 为系统参考输入, 为系统扰动. 计算权值 的加权算法细节见文献 [40],每个局部控制器 针对其相应的局部模型按极点配置或鲁棒控 制等方法进行设计. 在此基础上,文献 [41] 在加权 算法中迭代计算的快速收敛方面进行了改进,提 高了加权算法的时效性. 加权多模型自适应控制与基于 T-S 模型的模 糊控制(采用并行补偿算法)相比,二者都是根据 被控 对象 − + + K1 (s) yr (t) p1 (s) Ki (s) pi (t) u(t) y(t) w(t) pN K (t) N (s) … … 图 4 加权多模型自适应控制系统框图 Fig.4 Block diagram for WMMAC 张玉振等: 多模型自适应控制理论及应用 · 139 ·