第15卷第2期 智能系统学报 Vol.15 No.2 2020年3月 CAAI Transactions on Intelligent Systems Mar.2020 D0:10.11992tis.201809047 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20190828.1821.014.html 基于自适应神经模糊推理系统的船舶航向自抗扰控制 秦贝贝,陈增强2,孙明玮,孙青林 (1.南开大学人工智能学院,天津300350,2.天津市智能机器人重点实验室,天津300350) 摘要:在实际的船舶航向控制中,航向系统在受到外界风浪干扰时表现出的模型非线性和参数不确定性,为 航向控制器的设计带来了困难。针对该问题,设计了常规的线性自抗扰控制器和两种在线学习的自抗扰控制 器。利用自适应神经模糊推理系统(ANFIS)实现自抗扰控制器参数的在线调整,设计了自适应PD的自抗扰控 制器和自适应扩张状态观测器(E$O)的自抗扰控制器:分别在船舶受到外界扰动和参数摄动的两种情况下进 行了仿真,仿真表明自适应自抗扰控制器控制效果更好,抗扰能力更强,表现出较强的鲁棒性。 关键词:航向控制:自适应神经模糊推理系统(ANFIS):自适应自抗扰控制器:野本Nomoto)模型:线性自抗扰 控制(LADRC):非线性系统:梯度下降法;参数学习 中图分类号:TP272文献标志码:A文章编号:1673-4785(2020)02-0255-09 中文引用格式:秦贝贝,陈增强,孙明玮,等.基于自适应神经模糊推理系统的船舶航向自抗扰控制J智能系统学报,2020, 15(2):255-263. 英文引用格式:QIN Beibei,.CHEN Zengqiang,SUN Mingwei,etal.Active disturbance rejection control of ship course based on ad- aptive-network-based fuzzy inference system CAAl transactions on intelligent systems,2020,15(2):255-263. Active disturbance rejection control of ship course based on adaptive-net- work-based fuzzy inference system QIN Beibei',CHEN Zengqiang,SUN Mingwei',SUN Qinglin' (1.College of Artificial Intelligence,Nankai University,Tianjin 300350,China;2.Key Laboratory of Intelligent Robotics of Tianjin, Tianjin 300350,China) Abstract:In actual ship course control,the model nonlinearity and parameter uncertainty of the course system when dis- turbed by external wind and waves bring difficulties to the design of a course controller.To solve this problem,we de- signed a conventional linear active disturbance rejection controller(ADRC)and two online learning ADRCs.The adapt- ive-network-based fuzzy inference system is used to achieve the online adjustment of the parameters of the ADRC. Moreover,the ADRCs for adaptive PD and adaptive extended state observer are designed.The simulation results show that the adaptive ADRCs have a good control effect,strong anti-interference capability,and strong robustness when the ship is subjected to external disturbance and parameter perturbation. Keywords:course control;adaptive-network-based fuzzy inference system(ANFIS);adaptive active disturbance rejec- tion controller;Nomoto model;linear active disturbance rejection control (LADRC);nonlinear system;gradient descent method;parameter learning 自20世纪20年代PID控制律应用于船舶航 重视。航运业承担着约90%的国际贸易数额,人 向控制以来,出于航行安全、节能,进一步解放船 们对于其经济性和安全性关注度越来越高,因此 员劳动力的考虑,航向控制一直受到人们的高度 对大型船舶航向控制的研究和分析有非常重要的 意义山。船舶的系统参数会受到船舶装载状态、 收稿日期:2018-10-09.网络出版日期:2019-08-29. 基金项目:国家自然科学基金项目(61973175,61973172). 船速、外界干扰等的影响,使船舶运动表现出系 通信作者:陈增强.E-mail:chenzq@nankai.edu.cn, 统参数不确定性和外部扰动不确定性,因此,研
DOI: 10.11992/tis.201809047 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20190828.1821.014.html 基于自适应神经模糊推理系统的船舶航向自抗扰控制 秦贝贝1 ,陈增强1,2,孙明玮1 ,孙青林1 (1. 南开大学 人工智能学院,天津 300350; 2. 天津市智能机器人重点实验室,天津 300350) 摘 要:在实际的船舶航向控制中,航向系统在受到外界风浪干扰时表现出的模型非线性和参数不确定性,为 航向控制器的设计带来了困难。针对该问题,设计了常规的线性自抗扰控制器和两种在线学习的自抗扰控制 器。利用自适应神经模糊推理系统 (ANFIS) 实现自抗扰控制器参数的在线调整,设计了自适应 PD 的自抗扰控 制器和自适应扩张状态观测器 (ESO) 的自抗扰控制器;分别在船舶受到外界扰动和参数摄动的两种情况下进 行了仿真,仿真表明自适应自抗扰控制器控制效果更好,抗扰能力更强,表现出较强的鲁棒性。 关键词:航向控制;自适应神经模糊推理系统 (ANFIS);自适应自抗扰控制器;野本 (Nomoto) 模型;线性自抗扰 控制 (LADRC);非线性系统;梯度下降法;参数学习 中图分类号:TP272 文献标志码:A 文章编号:1673−4785(2020)02−0255−09 中文引用格式:秦贝贝, 陈增强, 孙明玮, 等. 基于自适应神经模糊推理系统的船舶航向自抗扰控制 [J]. 智能系统学报, 2020, 15(2): 255–263. 英文引用格式:QIN Beibei, CHEN Zengqiang, SUN Mingwei, et al. Active disturbance rejection control of ship course based on adaptive-network-based fuzzy inference system[J]. CAAI transactions on intelligent systems, 2020, 15(2): 255–263. Active disturbance rejection control of ship course based on adaptive-network-based fuzzy inference system QIN Beibei1 ,CHEN Zengqiang1,2 ,SUN Mingwei1 ,SUN Qinglin1 (1. College of Artificial Intelligence, Nankai University, Tianjin 300350, China; 2. Key Laboratory of Intelligent Robotics of Tianjin, Tianjin 300350, China) Abstract: In actual ship course control, the model nonlinearity and parameter uncertainty of the course system when disturbed by external wind and waves bring difficulties to the design of a course controller. To solve this problem, we designed a conventional linear active disturbance rejection controller (ADRC) and two online learning ADRCs. The adaptive-network-based fuzzy inference system is used to achieve the online adjustment of the parameters of the ADRC. Moreover, the ADRCs for adaptive PD and adaptive extended state observer are designed. The simulation results show that the adaptive ADRCs have a good control effect, strong anti-interference capability, and strong robustness when the ship is subjected to external disturbance and parameter perturbation. Keywords: course control; adaptive-network-based fuzzy inference system (ANFIS); adaptive active disturbance rejection controller; Nomoto model; linear active disturbance rejection control (LADRC); nonlinear system; gradient descent method; parameter learning 自 20 世纪 20 年代 PID 控制律应用于船舶航 向控制以来,出于航行安全、节能,进一步解放船 员劳动力的考虑,航向控制一直受到人们的高度 重视。航运业承担着约 90% 的国际贸易数额,人 们对于其经济性和安全性关注度越来越高,因此 对大型船舶航向控制的研究和分析有非常重要的 意义[1]。船舶的系统参数会受到船舶装载状态、 船速、外界干扰等的影响,使船舶运动表现出系 统参数不确定性和外部扰动不确定性,因此,研 收稿日期:2018−10−09. 网络出版日期:2019−08−29. 基金项目:国家自然科学基金项目 (61973175,61973172). 通信作者:陈增强. E-mail: chenzq@nankai.edu.cn. 第 15 卷第 2 期 智 能 系 统 学 报 Vol.15 No.2 2020 年 3 月 CAAI Transactions on Intelligent Systems Mar. 2020
·256· 智能系统学报 第15卷 究船舶航向的控制具有重要的意义冈。 应新型航向控制器,与固定参数的控制器进行对 船舶航向的控制问题即令船舶航向跟踪上设 比,观察其在风、浪等环境扰动和载重变化等引 定值实质上包含两部分内容:一是当船舶在目标 起的参数摄动下的控制效果。 航向上受到扰动时,舵角改变量应尽量小以减少 燃料损耗;二是当航向设定值改变时,船舶航向 1船舶航向控制模型 可以快速准确地跟踪上新的设定值。为了达到 常规水面船舶的主要操纵设备为螺旋桨和舵 这两个目标,近年来国内外的研究者们提出了众 机,螺旋桨产生推进力用来控制船舶的前进速 多的控制方法应用到船舶自动舵的设计中,大致 可以分为3类:早期的经典PID控制,上世纪 度,舵机产生舵角来保持和改变船首方向。 70年代出现的自适应控制和现在应用较多的智 图1中,船舶的实时航向山可以通过设备直 能控制。文献[4]针对船舶运动模型中的参数不 接测得,航向的设定值少,由用户给出,船舶航向控 确定性和外扰不确定性的问题,将PD与补偿控 制即设计控制器跟踪航向设定值。船舶受到的风 制相结合,提出了一种船舶航向鲁棒PD型自动 浪扰动作用可折合成等效舵角进行数学模拟,考 舵;文献[3,5]借鉴反步法的思想,设计了船舶航 虑舵机特性,与实际舵角6一同进入船舶模型。 向控制器;文献[6]考虑到船舶所受外扰的不确 其中船舶航行过程中受到的浪、流干扰及产生的 定性和舵机舵角的实际物理约束,设计了自适应 参数摄动都会为控制器的设计带来一定的困难。 鲁棒控制器,引人动态面简化控制器计算;文献 浪、流 参数 [7]首次将系统状态和控制输入由平面输出和它 干扰 摄动 的导数表示,结合滑模控制和微分平坦的特点设 计了有效的航向控制器;文献[8]对于船舶航向 控制器 舵机模型 船舶模型 保持问题提出了基于特征值分解的自适应滑模控 制器;文献[9]将模糊神经网络与内模控制相结 图1船舶航向控制示意 合设计了航向控制器。到目前为止,已经有多种 Fig.1 Schematic diagram of ship course control 方法用于航向控制,并且取得了不错的控制效 1.1 航向控制的简化模型 果;但由于上述大多数算法结构复杂,计算量大, 船舶模型具有大惯性、大时滞的特点,且其 对模型要求较高等原因,不易于工程实现。 操舵机构能量有限,可提供的舵角变化速度通常 韩京清教授提出自抗扰控制后,自抗扰控 较低,为同≤3~6(°)/s,因此船舶运动具有低频 制技术凭借其鲁棒性强、易于理解、结构简单且 特性。在船舶自动舵的设计中,一阶响应模型即 不依赖于模型等特点受到了国内外学者的广泛关 注山,理论证明的结果也层出不穷。ADRC凭 野本Nomoto)方程被广泛采用,它最早是由野 本采用类比建模法从简单力学意义上得出的。为 借其结构简单、鲁棒性强也被应用于船舶控制 Ti+r=K6 (1) 中。文献[13]将自抗扰控制技术应用于航向控 式中:r=山为船舶转首角速度;山为航向角;6为 制,仿真表明该控制器具有良好的适应能力;文 舵机舵角:K和T为船舶操纵性指数。 献[14]基于船舶非线性Bech模型设计了高阶 实际航向中,船舶纵向速度的变化和流体动 ADRC控制器。通过对已有自抗扰控制航向的相 力的非线性特性都会使船舶的操舵响应呈现出非 关文献学习发现,目前在船舶自动舵设计中的参 线性,非线性的影响通过引入非线性项r3实 数大多都是在初始设计时给定,因此当船舶受到 现,即 较大的扰动或者船舶航行状态发生较大改变时, Ti+r+ar=K 难以达到较好的控制效果。 (2) 其中,α为非线性系数。 受到上述不同控制方法所具有的不同特点的 从而可得船舶航向的非线性响应模型为 启发,考虑到船舶航向系统具有不确定性和非线 地=r 性的特点,本文针对船舶模型非线性、时变的特 (3) 点设计了一个线性自抗扰(LADRC)控制器。为 了解决被控对象受到环境等影响变化范围大从而 为了更具一般性,同时考虑外部扰动,通常将 恶化控制效果的问题,进一步提高控制器的鲁棒 式(3)写为 性,引入了自适应ESO和自适应PD的概念,利 山=r i=f(r)+w(t)+bo (4) 用ANFIS实现参数的在线调整,设计了一种自适
究船舶航向的控制具有重要的意义[2]。 船舶航向的控制问题即令船舶航向跟踪上设 定值实质上包含两部分内容:一是当船舶在目标 航向上受到扰动时,舵角改变量应尽量小以减少 燃料损耗;二是当航向设定值改变时,船舶航向 可以快速准确地跟踪上新的设定值[3]。为了达到 这两个目标,近年来国内外的研究者们提出了众 多的控制方法应用到船舶自动舵的设计中,大致 可以分为 3 类:早期的经典 PID 控制,上世纪 70 年代出现的自适应控制和现在应用较多的智 能控制。文献 [4] 针对船舶运动模型中的参数不 确定性和外扰不确定性的问题,将 PID 与补偿控 制相结合,提出了一种船舶航向鲁棒 PID 型自动 舵;文献 [3,5] 借鉴反步法的思想,设计了船舶航 向控制器;文献 [6] 考虑到船舶所受外扰的不确 定性和舵机舵角的实际物理约束,设计了自适应 鲁棒控制器,引入动态面简化控制器计算;文献 [7] 首次将系统状态和控制输入由平面输出和它 的导数表示,结合滑模控制和微分平坦的特点设 计了有效的航向控制器;文献 [8] 对于船舶航向 保持问题提出了基于特征值分解的自适应滑模控 制器;文献 [9] 将模糊神经网络与内模控制相结 合设计了航向控制器。到目前为止,已经有多种 方法用于航向控制,并且取得了不错的控制效 果;但由于上述大多数算法结构复杂,计算量大, 对模型要求较高等原因,不易于工程实现。 韩京清教授提出自抗扰控制后[10] ,自抗扰控 制技术凭借其鲁棒性强、易于理解、结构简单且 不依赖于模型等特点受到了国内外学者的广泛关 注 [11] ,理论证明的结果也层出不穷[12]。ADRC 凭 借其结构简单、鲁棒性强也被应用于船舶控制 中。文献 [13] 将自抗扰控制技术应用于航向控 制,仿真表明该控制器具有良好的适应能力;文 献 [14] 基于船舶非线性 Bech 模型设计了高阶 ADRC 控制器。通过对已有自抗扰控制航向的相 关文献学习发现,目前在船舶自动舵设计中的参 数大多都是在初始设计时给定,因此当船舶受到 较大的扰动或者船舶航行状态发生较大改变时, 难以达到较好的控制效果。 受到上述不同控制方法所具有的不同特点的 启发,考虑到船舶航向系统具有不确定性和非线 性的特点,本文针对船舶模型非线性、时变的特 点设计了一个线性自抗扰 (LADRC) 控制器。为 了解决被控对象受到环境等影响变化范围大从而 恶化控制效果的问题,进一步提高控制器的鲁棒 性,引入了自适应 ESO 和自适应 PD 的概念,利 用 ANFIS 实现参数的在线调整,设计了一种自适 应新型航向控制器,与固定参数的控制器进行对 比,观察其在风、浪等环境扰动和载重变化等引 起的参数摄动下的控制效果。 1 船舶航向控制模型 常规水面船舶的主要操纵设备为螺旋桨和舵 机,螺旋桨产生推进力用来控制船舶的前进速 度,舵机产生舵角来保持和改变船首方向。 ψ ψr δ 图 1 中,船舶的实时航向 可以通过设备直 接测得,航向的设定值 由用户给出,船舶航向控 制即设计控制器跟踪航向设定值。船舶受到的风 浪扰动作用可折合成等效舵角进行数学模拟,考 虑舵机特性,与实际舵角 一同进入船舶模型。 其中船舶航行过程中受到的浪、流干扰及产生的 参数摄动都会为控制器的设计带来一定的困难。 控制器 舵机模型 船舶模型 浪、流 干扰 参数 摄动 ψr δr δ ψ 图 1 船舶航向控制示意 Fig. 1 Schematic diagram of ship course control 1.1 航向控制的简化模型 δ˙ ⩽ 3 ∼ 6 (°)/s 船舶模型具有大惯性、大时滞的特点,且其 操舵机构能量有限,可提供的舵角变化速度通常 较低,为 ,因此船舶运动具有低频 特性。在船舶自动舵的设计中,一阶响应模型即 野本 (Nomoto) 方程[15] 被广泛采用,它最早是由野 本采用类比建模法从简单力学意义上得出的。为 Tr˙ +r = Kδ (1) 式中:r = ψ˙ 为船舶转首角速度; ψ 为航向角; δ 为 舵机舵角;K 和 T 为船舶操纵性指数。 αr 3 实际航向中,船舶纵向速度的变化和流体动 力的非线性特性都会使船舶的操舵响应呈现出非 线性,非线性的影响通过引入非线性项 实 现,即 Tr˙ +r +αr 3 = Kδ (2) 其中,α 为非线性系数。 从而可得船舶航向的非线性响应模型为 ψ˙ = r r˙ = − 1 T r − α T r 3 + K T δ (3) 为了更具一般性,同时考虑外部扰动,通常将 式 (3) 写为 { ψ˙ = r r˙ = f(r)+w(t)+bδ (4) ·256· 智 能 系 统 学 报 第 15 卷
第2期 秦贝贝,等:基于自适应神经模糊推理系统的船舶航向自抗扰控制 ·257· 式中:b为控制增益;w()为外部扰动;fr)为系统 的内部扰动,即未建模动态。 1.2舵机特性 船艏方向的保持和改变主要是通过合理操作 舵机实现的。舵机是一个动态系统,受实际物理 条件的制约,有最大操舵角和最大操舵角速度的 ESO 限制,目前应用较多的为一阶惯性模型,表达式为 6=KE(6,-)/TE (5) 图2船舶航向自抗扰控制结构 式中:Kε为舵机控制增益,一般取为1;TE为舵机 Fig.2 Structure of ADRC control for ship course 时间常数:6为实际舵角:6为命令舵角。 控制目标是求得控制舵角6,使山→山。在航 结合式(4)和式(⑤),考虑舵机特性的船舶航 向改变过程中,使用二阶滤波器进行柔化,用滤 向控制系统的非线性响应数学模型可以表示为 波后的期望航向山代替变化剧烈的设定信号少,有 山=r 4=。 w员 产=f(r)+w(r)+b6 (6) 少,s2+250ns+w (7) δ=KE(6,-6)/TE 式中:、wm为设计参数;越大,妇变化越平缓。 1.3船舶运动干扰 当期望的航向角信号少未被噪声污染时,可 船舶在运动中会受到多种环境干扰,大致可 以省略跟踪微分器,把对系统的跟踪控制改变为 分为3类: 系统的镇定控制问题。为了直观,将系统写为 1)船舶航行时的载重、航行速度、吃水深度 y=山-山a 等的变化,会造成船舶的水动力系数发生改变, y=yI 这种扰动为系统内部不确定性,表现为系统的参 乃=f+bu (8) 1 数摄动,很难计算。 f=7r--b=u=6 K 2)船舶在航行过程中总是存在风、浪、流等 控制器的控制目标为:y→0,)→0。 外界干扰,表现为干扰力和干扰力矩,是不可测 则式(⑧)的线性ESO可设计为 的,但可以通过一些器件进行模拟,设计控制器 eo=Z1-y 时应予以考虑。 i1=2-f01e0 i2=73-Bozeo+bou (9) 3)船舶航行时电源和油源的波动和测量噪声 3=-fo3e0 的存在,其属于低频干扰,影响相对小得多,设计 控制器时不予考虑。 式中:Bo1,B2,B]=[3wo,3w2,w引,w。为ES0带宽。 带宽越大,观测器的估计能力就越强,但对输入 2基于ADRC的船舶航向控制器设计 噪声也更为敏感。因此在实际控制应用中,观测 器带宽需要根据实际“总扰动”的大小合理选择。 高志强教授与韩京清研究员长期合作,在深 误差反馈律采用线性PD组合,得到误差反 刻理解抗扰思想、深入分析和思考控制问题本质 馈控制律为 的基础上,提出了频率尺度这一与工程应用紧密 uo=-(kpe+kae)=-kpz-kaz2 相关的概念,将ADRC参数与控制器和观测器的 u=Mo-2 (10) 带宽相关联,解决了传统ADRC技术参数整定困 bo 难的问题,简化了参数的整定过程1。线性AD 式中:[k,ka=[w2,2w],we为控制器带宽。 RC由3部分组成,分别为跟踪微分器(TD)、线性 2.2自适应神经模糊推理系统 扩张状态观测器(LE$O)和线性误差反馈控制律 自适应神经模糊推理系统(ANFIS)是由J-SR (LSEF)。其中,在某些情况下,TD的设计步骤可 Jang提出的一种基于T-S模型的自适应神经模糊 以省略,更加简化了LADRC的控制结构。 推理系统。该系统将神经网络与模糊推理结合, 2.1船舶航向控制器设计 根据输入一输出对的信息,采用混合算法可以自 为了使设计简单,设计控制器时把船舶和舵 动产生if-then规则,实现隶属度函数的在线调整。 机看作一个整体,将舵机特性作为航向控制系统 ANFIS通过对未知函数训练集样本的聚类分 的扰动,利用线性扩张状态观测器(LESO)进行观 析可近似未知函数,还可用于模式识别,分类问 测,控制系统的结构框图如图2所示。 题,过程控制等。ANFIS的典型结构如图31
式中: b 为控制增益; w(t) 为外部扰动; f(r) 为系统 的内部扰动,即未建模动态。 1.2 舵机特性 船艏方向的保持和改变主要是通过合理操作 舵机实现的。舵机是一个动态系统,受实际物理 条件的制约,有最大操舵角和最大操舵角速度的 限制,目前应用较多的为一阶惯性模型,表达式为 δ˙ = KE(δr −δ)/TE (5) KE TE δ δr 式中: 为舵机控制增益,一般取为 1; 为舵机 时间常数; 为实际舵角; 为命令舵角。 结合式 (4) 和式 (5),考虑舵机特性的船舶航 向控制系统的非线性响应数学模型可以表示为 ψ˙ = r r˙ = f(r)+w(r)+bδ δ˙ = KE(δr −δ)/TE (6) 1.3 船舶运动干扰 船舶在运动中会受到多种环境干扰,大致可 分为 3 类: 1) 船舶航行时的载重、航行速度、吃水深度 等的变化,会造成船舶的水动力系数发生改变, 这种扰动为系统内部不确定性,表现为系统的参 数摄动,很难计算。 2) 船舶在航行过程中总是存在风、浪、流等 外界干扰,表现为干扰力和干扰力矩,是不可测 的,但可以通过一些器件进行模拟,设计控制器 时应予以考虑。 3) 船舶航行时电源和油源的波动和测量噪声 的存在,其属于低频干扰,影响相对小得多,设计 控制器时不予考虑。 2 基于 ADRC 的船舶航向控制器设计 高志强教授与韩京清研究员长期合作,在深 刻理解抗扰思想、深入分析和思考控制问题本质 的基础上,提出了频率尺度这一与工程应用紧密 相关的概念,将 ADRC 参数与控制器和观测器的 带宽相关联,解决了传统 ADRC 技术参数整定困 难的问题,简化了参数的整定过程[16]。线性 ADRC 由 3 部分组成,分别为跟踪微分器 (TD)、线性 扩张状态观测器 (LESO) 和线性误差反馈控制律 (LSEF)。其中,在某些情况下,TD 的设计步骤可 以省略,更加简化了 LADRC 的控制结构。 2.1 船舶航向控制器设计 为了使设计简单,设计控制器时把船舶和舵 机看作一个整体,将舵机特性作为航向控制系统 的扰动,利用线性扩张状态观测器 (LESO) 进行观 测,控制系统的结构框图如图 2 所示。 舵 机 船 舶 ψd ψ kp kd z3 z2 z1 b0 w(t) 1 − − − − u δ LESO 图 2 船舶航向自抗扰控制结构 Fig. 2 Structure of ADRC control for ship course δ ψ → ψr ψd ψr 控制目标是求得控制舵角 ,使 。在航 向改变过程中,使用二阶滤波器进行柔化,用滤 波后的期望航向 代替变化剧烈的设定信号 ,有 ψd ψr = ω 2 n s 2 +2ξωn s+ω2 n (7) 式中: ξ、ωn 为设计参数; ξ 越大, ψd 变化越平缓。 当期望的航向角信号 ψd 未被噪声污染时,可 以省略跟踪微分器,把对系统的跟踪控制改变为 系统的镇定控制问题。为了直观,将系统写为 y = ψ−ψd y˙ = y1 y˙1 = f +bu f = − 1 T r − α T r 3 −ψ¨ d ;b = K T ;u = δ (8) 控制器的控制目标为: y → 0, y˙ → 0。 则式 (8) 的线性 ESO 可设计为 e0 = z1 −y z˙1 = z2 −β01e0 z˙2 = z3 −β02e0 +b0u z˙3 = −β03e0 (9) [ β01, β02, β03] = [ 3ωo,3ω 2 o ,ω3 o ] 式中: ,ωo 为 ESO 带宽。 带宽越大,观测器的估计能力就越强,但对输入 噪声也更为敏感。因此在实际控制应用中,观测 器带宽需要根据实际“总扰动”的大小合理选择。 误差反馈律采用线性 PD 组合,得到误差反 馈控制律为 u0 = −(kpe+kde˙) = −kpz1 −kdz2 u = u0 −z3 b0 (10) [ kp, kd ] = [ ω 2 c ,2ωc ] 式中: ,ωc 为控制器带宽。 2.2 自适应神经模糊推理系统 自适应神经模糊推理系统 (ANFIS) 是由 J-S R Jang 提出的一种基于 T-S 模型的自适应神经模糊 推理系统。该系统将神经网络与模糊推理结合, 根据输入−输出对的信息,采用混合算法可以自 动产生 if-then 规则,实现隶属度函数的在线调整。 ANFIS 通过对未知函数训练集样本的聚类分 析可近似未知函数,还可用于模式识别,分类问 题,过程控制等。ANFIS 的典型结构如图 3 [17-18]。 第 2 期 秦贝贝,等:基于自适应神经模糊推理系统的船舶航向自抗扰控制 ·257·
·258· 智能系统学报 第15卷 的准确性。为了提高状态估计精度,改善控制性 能,根据图5设计了一个双入单出的网络实现w。 的在线调整(无需考虑图5的点划线部分)从而 实现ESO增益的在线调整。 B, X1 X2 输 第 第 第 第 输 航向角 层 层 层 出 误差 wk) 图3 ANFIS的典型结构 Fig.3 Typical structure of ANFIS 误差 图3中给出的是一个MIS0系统,其中x1, 变化率 是系统的输人,y为推理输出。该系统可被视为 一个5层的网络,其中方形结点表示自适应结点, 图5 ANFIS网络结构 该结点内包含参数并且参数是可变的;圆形结点 Fig.5 Network structure diagram of ANFIS 代表固定结点,不包含参数。对整个系统来说, ANFIS的参数优化算法分为正向计算和反向 可调整参数集是自适应结点参数集的并集,其中 计算两个过程。 第1层参数被称为前提参数,第4层参数被称为 I)ANFIS的正向计算: 结论参数。网络参数的学习根据实际工作的需要 第1层隶属度选择高斯函数: 可以采取不同的方法:梯度下降与最小二乘的混 合算法、递推最小二乘、仅使用梯度下降法等。 4=ew;i=1,2:j=1,…,5 (11) 在本文的设计中,采用第3种方法实现参数的学习。 第2层计算每一条规则的适应度: 2.3基于ANFIS的自适应ADRC控制器设计 we=:ji,j2∈{1,2,…,5:k=1,2,…,25 (12) 为了解决被控对象变化范围大而快使得控制 第3层对每一个适应度进行归一化: 效果变差的问题,进一步提高ADRC的鲁棒性, Wk = (13) 利用ANFIS网络分别实现ESO带宽w。和线性误 差反馈律PD参数[k,k]的在线调整,设计了改 进的ADRC控制策略19,控制结构图如图4所示。 第4层为模糊规则的输出,每条规则的输出 是输入变量的线性组合,即 ·BP算法 ANFIS结构 R:ifxis x is thenf is 模糊化模糊推理 w() fi=puxr+pax2+por (14) o kt kg 第5层是网络的输出层,有 ADRC 5 -de/dr .=y- (15) = 图4 ANFIS-ADRC结构 2)ANFIS的反向计算: Fig.4 Diagram of ANFIS-ADRC ANFIS的反向计算选择BP算法进行参数调 为了实现控制器所期望的功能,设计了两个 整,性能指标函数为 ANFIS系统,每一个系统都是一个5层的前馈神 =因-r= (16) 经网络:输人层变量都选为2个,分别为航向误差 e=山-u和航向误差变化率de=e;每个变量语言 该网络中可以调整的参数包括式(11)中的前 值个数为5,为{NB,NS,ZE,PS,PB};隶属度函数选 提参数σ,c和式(14)中的结论参数p,对于每一 择高斯函数;设计模糊规则个数为5×5=25个;输 参数均沿其负梯度方向调整得: 出层有所不同,Adaptive-ESO输出变量个数为1, w0-器恶胎 (17) 为w;Adaptive-PD输出变量个数为2,为[k,kao 根据上述规则,设计出如下ANFIS参数调整网络: 其中,2表示可调整参数集合,2={σ,c,p以。 2.3.1AESO-ADRC控制器设计 由于心未知,采用符号函数近似代替,由 由式(9)可知,ESO有3个重要参数:B1、 近似带来的数值上的误差可以通过合理选择学习 B2、B,这3个参数直接影响观测器对状态估计 步长刀进行补偿。用来近似的符号函数为
x1 x1 x2 x2 x1 x2 A1 A2 w1 w2 w1 w2 y B1 B2 输 入 输 出 图 3 ANFIS 的典型结构 Fig. 3 Typical structure of ANFIS x1, x2 y 图 3 中给出的是一个 MISO 系统,其中 是系统的输入, 为推理输出。该系统可被视为 一个 5 层的网络,其中方形结点表示自适应结点, 该结点内包含参数并且参数是可变的;圆形结点 代表固定结点,不包含参数。对整个系统来说, 可调整参数集是自适应结点参数集的并集,其中 第 1 层参数被称为前提参数,第 4 层参数被称为 结论参数。网络参数的学习根据实际工作的需要 可以采取不同的方法:梯度下降与最小二乘的混 合算法、递推最小二乘、仅使用梯度下降法等。 在本文的设计中,采用第 3 种方法实现参数的学习。 2.3 基于 ANFIS 的自适应 ADRC 控制器设计 ωo [ kp, kd ] 为了解决被控对象变化范围大而快使得控制 效果变差的问题,进一步提高 ADRC 的鲁棒性, 利用 ANFIS 网络分别实现 ESO 带宽 和线性误 差反馈律 PD 参数 的在线调整,设计了改 进的 ADRC 控制策略[19] ,控制结构图如图 4 所示。 ψr ωo kp kd ADRC w(t) e u δ ψ − ec de/dt ANFIS结构 模糊化 模糊推理 BP算法 舵 机 船 舶 图 4 ANFIS-ADRC 结构 Fig. 4 Diagram of ANFIS-ADRC e = ψ−ψd de = e˙ ωo [ kp, kd ] 为了实现控制器所期望的功能,设计了两个 ANFIS 系统,每一个系统都是一个 5 层的前馈神 经网络:输入层变量都选为 2 个,分别为航向误差 和航向误差变化率 ;每个变量语言 值个数为 5,为{NB,NS,ZE,PS,PB};隶属度函数选 择高斯函数;设计模糊规则个数为 5×5=25 个;输 出层有所不同,Adaptive-ESO 输出变量个数为 1, 为 ;Adaptive-PD 输出变量个数为 2,为 。 根据上述规则,设计出如下 ANFIS 参数调整网络: 2.3.1 AESO-ADRC 控制器设计 β01 β02 β03 由式 (9) 可知, ESO 有 3 个重要参数: 、 、 ,这 3 个参数直接影响观测器对状态估计 ωo 的准确性。为了提高状态估计精度,改善控制性 能,根据图 5 设计了一个双入单出的网络实现 的在线调整 (无需考虑图 5 的点划线部分),从而 实现 ESO 增益的在线调整。 μ 5 1 μ 5 2 μ 1 2 f 1 1 f 1 2 f 2 2 f 2 1 f 1 25 f 2 25 w25 w25 w2 w2 w1 w1 ... ... 航向角 误差 误差 变化率 ... ... ωo (kp ) kd 图 5 ANFIS 网络结构 Fig. 5 Network structure diagram of ANFIS ANFIS 的参数优化算法分为正向计算和反向 计算两个过程。 1) ANFIS 的正向计算: 第 1 层隶属度选择高斯函数: µ j i = e − (xi−ci j) 2 σ 2 i j ;i = 1,2; j = 1,··· ,5 (11) 第 2 层计算每一条规则的适应度: wk = µ j1 1 µ j2 2 ; j1, j2 ∈ {1,2,··· ,5}; k = 1,2,··· ,25 (12) 第 3 层对每一个适应度进行归一化: w¯ k = wk ∑25 k=1 wk (13) 第 4 层为模糊规则的输出,每条规则的输出 是输入变量的线性组合,即 Rk x1 µ j 1 x2 µ j 2 f :if is , is , then k is fk = p1k x1 + p2k x2 + p0k (14) 第 5 层是网络的输出层,有 ωo = y = ∑25 k=1 w¯ k fk (15) 2) ANFIS 的反向计算: ANFIS 的反向计算选择 BP 算法进行参数调 整,性能指标函数为 J(k) = 1 2 (ψ(k)−ψd(k))2 = 1 2 e(k) 2 (16) σ,c p 该网络中可以调整的参数包括式 (11) 中的前 提参数 和式 (14) 中的结论参数 ,对于每一 参数均沿其负梯度方向调整得: ∆Ω = − ∂J ∂Ω = − ∂J ∂e · ∂e ∂ψ · ∂ψ ∂ωo · ∂ωo ∂Ω (17) 其中, Ω 表示可调整参数集合, Ω = {σ, c, p}。 ∂ψ ∂ωo η 由于 未知,采用符号函数近似代替,由 近似带来的数值上的误差可以通过合理选择学习 步长 进行补偿。用来近似的符号函数为 ·258· 智 能 系 统 学 报 第 15 卷
第2期 秦贝贝,等:基于自适应神经模糊推理系统的船舶航向自抗扰控制 ·259· u(k) yB=3w(k ≈sign(a(k)/a△w.(k)= 3仿真分析 (k)-(k-1) (18) 本文以“育龙”轮为仿真对象,选择航速为 sign A(k)-A(k-1) wk)≠△w(k-1) 7.2m/s的状态进行控制,操纵性指数K=0.478s, sign(w(k-(k-1),△w(k)=△w(k-1) T=216s,a=30,舵机时间常数为2.5s,船舶舵角 式(18)代入式(17),并化简得 的极限值为352o。分别采用LADRC和自适应 0- dw =-eg02 (19) ADRC进行控制,观察其控制效果。设定的航向 82 指令信号为周期为600s、幅值为30°的方波。 网络输出分别对各参数求偏导得 3.1仿真参数 0w。 Wk i=0 Pik mxi≠0 选取仿真参数为:h=0.01,b。=0.0022;w=0.7, w。=0.04;5=0.95,wn=0.045。 Wk- w AESO控制器:n=0.5,a=0.1;ANFIS网络先 dw. 1 2(x-c 进行标称模型下的100次离线优化,将优化后的 i (20) ANFIS作为初始网络,再利用式(21)和式(22)对 2 -∑w 系统进行在线微调,以期达到更好的控制效果。 8wo 2(-c)月 APD-ADRC控制器:7=0.007,a=0.01;将 Ooi ∑ 2 LADRC中的PD增益作为网络期望输出,对AN- FIS网络进行10次离线训练,将训练后的参数作 式中m表示所有与c、σ有关的模糊规则数。 为网络的初值,再利用式(24)进行在线微调。 采用改进BP算法,附加一个加快搜索速度 3.2仿真结果与分析 的惯性项,则参数的学习算法为 利用MATLAB进行仿真实验,分别进行了理 2(k+1)=2(k)+7△2(k)+a△2(k-1) (21) 想状态下和有扰动情况下的仿真;扰动表现为参 2.3.2APD-ADRC控制器设计 数摄动和外界扰动;参数摄动为随机参数摄动; 与自适应ESO的设计方法类似,PD参数的 外界扰动包括恒值干扰和低频正弦干扰两种情 在线调整也利用ANFIS网络实现。除网络第 况。各控制器的仿真结果如下。 5层变为两个输出变量(考虑图中的点划线部分) 3.2.1理想状态 之外,网络其他部分结构与上一节相同。 图6~8分别为在不考虑外界扰动和参数摄动 由于网络结构细微的不同,网络正向计算和 时,设定航向为幅值30°,周期600s的方波信号 反向的公式略有改变。 时,所设计的不同控制器下的仿真结果。 正向计算: 30 第4层: 20 fu Puxr+paxz+pofa Pix+pixz+Poe (22) 第5层: 0 (23) --LADRC k=为=∑m房 0 200 4006008001000 你 性能指标仍为式(16),类似地,采用符号函数 图6无干扰时LADRC的航向曲线 代替难求解的偏导项,可得 Fig.6 Heading curve of LADRC without interference kp 30 =-e.y-Z1. +(-22): (24) 02 02 02 d(k) 20 yu= ≈sign(0(k)/0△4o(k)= 8w(k) k)-k-1) ()-△ok-△因≠A(k-1) sign- sign((k)-(k-1),△o(k)=△o(k-1) ----AES0 0 2004006008001000 驰驰的计算方式与式(20)类似,此处不再赘述。 (a)无干扰时航向曲线(AESO)
yβ = ∂ψ(k) ∂ωo(k) ≈ sign( ∂ψ(k)/ ∂∆ωo(k)) = sign ψ(k)−ψ(k−1) ∆ωo(k)−∆ωo(k−1) ,∆ωo(k) , ∆ωo(k−1) sign(ψ(k)−ψ(k−1)),∆ωo(k) = ∆ωo(k−1) (18) 式 (18) 代入式 (17),并化简得 ∆Ω = − ∂J ∂Ω = −e · yβ · ∂ωo ∂Ω (19) 网络输出分别对各参数求偏导得 ∂ωo ∂pik = { w¯ k i = 0 w¯ k xi i , 0 ∂ωo ∂ci j = ∑25 k=1 wk − ∑nl l=1 wl · ∑nl l=1 wl fl ∑ wk 2 · 2 ( xi −ci j) σ 2 i j ∂ωo ∂σi j = ∑25 k=1 wk − ∑nl l=1 wl · ∑nl l=1 wl fl ∑ wk 2 · 2 ( xi −ci j)2 σ 3 i j (20) 式中nl 表示所有与 ci j、σi j 有关的模糊规则数。 采用改进 BP 算法,附加一个加快搜索速度 的惯性项,则参数的学习算法为 Ω(k+1) = Ω(k)+η∆Ω(k)+α∆Ω(k−1) (21) 2.3.2 APD-ADRC 控制器设计 与自适应 ESO 的设计方法类似,PD 参数的 在线调整也利用 ANFIS 网络实现。除网络第 5 层变为两个输出变量 (考虑图中的点划线部分) 之外,网络其他部分结构与上一节相同。 由于网络结构细微的不同,网络正向计算和 反向的公式略有改变。 正向计算: 第 4 层: f1k = p 1 1k x1 + p 1 2k x2 + p 1 0k f2k = p 2 1k x1 + p 2 2k x2 + p 2 0k (22) 第 5 层: kp = y1 = ∑25 k=1 w¯ k f 1 k kd = y2 = ∑25 k=1 w¯ k f 2 k (23) 性能指标仍为式 (16),类似地,采用符号函数 代替难求解的偏导项,可得 ∆Ω = − ∂J ∂Ω = −e · yu · ( −z1 · ∂kp ∂Ω +(−z2)· ∂kd ∂Ω ) (24) yu = ∂ψ(k) ∂ωo(k) ≈ sign( ∂ψ(k)/ ∂∆u0(k)) = sign ψ(k)−ψ(k−1) ∆u0(k)−∆u0(k−1) ,∆u0(k) , ∆u0(k−1) sign(ψ(k)−ψ(k−1)),∆u0(k) = ∆u0(k−1) ∂kp ∂Ω , ∂kd ∂Ω 的计算方式与式 (20) 类似,此处不再赘述。 3 仿真分析 K = 0.478 s−1 T = 216 s,α = 3035◦ 本文以“育龙”轮为仿真对象,选择航速为 7.2 m/s 的状态进行控制,操纵性指数 , ,舵机时间常数为 2.5 s,船舶舵角 的极限值为 [20]。分别采用 LADRC 和自适应 ADRC 进行控制,观察其控制效果。设定的航向 指令信号为周期为 600 s、幅值为 30°的方波。 3.1 仿真参数 ωo = 0.7 ωc = 0.04 ξ = 0.95,ωn = 0.045 选取仿真参数为:h=0.01, b0=0.002 2; , ; 。 AESO 控制器: η = 0.5,α = 0.1 ;ANFIS 网络先 进行标称模型下的 100 次离线优化,将优化后的 ANFIS 作为初始网络,再利用式 (21) 和式 (22) 对 系统进行在线微调,以期达到更好的控制效果。 APD-ADRC 控制器: η = 0.007,α = 0.01 ; 将 LADRC 中的 PD 增益作为网络期望输出,对 ANFIS 网络进行 10 次离线训练,将训练后的参数作 为网络的初值,再利用式 (24) 进行在线微调。 3.2 仿真结果与分析 利用 MATLAB 进行仿真实验,分别进行了理 想状态下和有扰动情况下的仿真;扰动表现为参 数摄动和外界扰动;参数摄动为随机参数摄动; 外界扰动包括恒值干扰和低频正弦干扰两种情 况。各控制器的仿真结果如下。 3.2.1 理想状态 30◦ 图 6~8 分别为在不考虑外界扰动和参数摄动 时,设定航向为幅值 ,周期 600 s 的方波信号 时,所设计的不同控制器下的仿真结果。 0 200 400 600 800 t/s 0 10 20 30 ψ/(°) ψd LADRC 1 000 图 6 无干扰时 LADRC 的航向曲线 Fig. 6 Heading curve of LADRC without interference (a) 无干扰时航向曲线(AESO) 0 200 400 600 800 1 000 t/s 0 10 20 30 ψ/(°) ψd AESO 第 2 期 秦贝贝,等:基于自适应神经模糊推理系统的船舶航向自抗扰控制 ·259·