工程科学学报,第40卷,第2期:241-251,2018年2月 Chinese Joural of Engineering,Vol.40,No.2:241-251,February 2018 DOI:10.13374/j.issn2095-9389.2018.02.015;http://journals.ustb.edu.cn 离散时间多智能体系统的协调最优预见跟踪 卢延荣,廖福成四,任金鸣,付海龙,盛超逸 北京科技大学数理学院,北京100083 ☒通信作者,E-mail:fcliao@usth.edu.cn 摘要在互联拓扑包含一棵有向生成树的条件下,研究了离散时间多智能体系统的协调最优预见跟踪问题.首先利用状态 增广技术把协调跟踪问题转化为一个增广系统的全局最优调节问题.然后应用离散时间线性二次型调节理论的相关结果给 出了使增广系统的闭环系统渐近稳定的控制器,并由此得到原系统实现跟踪一致性的全局最优预见控制器.仿真结果不仅 验证了所设计控制器的有效性,并且表明适当增加预见步长对保证准确跟踪领导者的输出是至关重要的. 关键词多智能体系统:协调跟踪:预见控制:代数Riccati方程 分类号TG142.71 Cooperative optimal preview tracking control of discrete-time multi-agent systems LU Yan-rong,LIAO Fu-cheng,REN Jin-ming,FU Hai-long,SHENG Chao-yi School of Mathematics and Physics,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:fcliao@ustb.edu.cn ABSTRACT This study investigated the cooperative optimal preview tracking problem of discrete-time multi-agent systems under the assumption of the communication topology containing a directed spanning tree.First,a state augmentation technique was used to con- vert the cooperative preview tracking problem into a global optimal regulation problem of an augmented system.Second,by resorting to relative conclusions about the discrete-time linear quadratic regulation theory,an optimal controller was obtained,which can guarantee the asymptotic stability of the closed-loop augmented system.Moreover,a global optimal preview controller was provided in order for the original system to achieve the tracking consensus.Finally,the simulation results not only verified the effectiveness of the designed controller,but also indicated that it is critical for accurately tracking the reference signal to moderately increase the preview length. KEY WORDS multi-agent systems;cooperative tracking;preview control;algebraic Riccati equation 近年来,受复杂系统理论、传感、计算机以及通 言,一致性问题可分为两类,即无领导者的一致性 信技术等快速发展的影响,多智能体系统的协调控 问题和有领导者的同步问题,后者也称为分布式跟 制受到了研究者的广泛关注.协调控制研究的主要 踪问题、领导者跟随者一致性问题或牵引控制问 问题是根据所设计的分布式控制策略来分析智能体 题等. 的动态特性与智能体间的信息交换拓扑对系统整体 在无领导者一致性问题研究方面,文献[2]分 行为的影响. 别在拓扑为固定或切换、通信存在或缺少时滞、以及 一致性问题在计算机科学中有着很长的历 信息流为有向或无向的假设下,较全面地研究了具 史),近期在多智能体系统的背景下已逐渐成为协 有一阶积分器系统的一致性问题,并为每一种情形 调控制研究中的一个重要而基本的问题.一般而 提供了收敛性分析.文献[3]考虑了二阶积分器系 收稿日期:2017-06-01 基金项目:国家自然科学基金资助项目(61174209)
工程科学学报,第 40 卷,第 2 期:241鄄鄄251,2018 年 2 月 Chinese Journal of Engineering, Vol. 40, No. 2: 241鄄鄄251, February 2018 DOI: 10. 13374 / j. issn2095鄄鄄9389. 2018. 02. 015; http: / / journals. ustb. edu. cn 离散时间多智能体系统的协调最优预见跟踪 卢延荣, 廖福成苣 , 任金鸣, 付海龙, 盛超逸 北京科技大学数理学院, 北京 100083 苣 通信作者, E鄄mail: fcliao@ ustb. edu. cn 摘 要 在互联拓扑包含一棵有向生成树的条件下,研究了离散时间多智能体系统的协调最优预见跟踪问题. 首先利用状态 增广技术把协调跟踪问题转化为一个增广系统的全局最优调节问题. 然后应用离散时间线性二次型调节理论的相关结果给 出了使增广系统的闭环系统渐近稳定的控制器, 并由此得到原系统实现跟踪一致性的全局最优预见控制器. 仿真结果不仅 验证了所设计控制器的有效性, 并且表明适当增加预见步长对保证准确跟踪领导者的输出是至关重要的. 关键词 多智能体系统; 协调跟踪; 预见控制; 代数 Riccati 方程 分类号 TG142郾 71 收稿日期: 2017鄄鄄06鄄鄄01 基金项目: 国家自然科学基金资助项目(61174209) Cooperative optimal preview tracking control of discrete鄄time multi鄄agent systems LU Yan鄄rong, LIAO Fu鄄cheng 苣 , REN Jin鄄ming, FU Hai鄄long, SHENG Chao鄄yi School of Mathematics and Physics, University of Science and Technology Beijing, Beijing 100083, China 苣 Corresponding author, E鄄mail: fcliao@ ustb. edu. cn ABSTRACT This study investigated the cooperative optimal preview tracking problem of discrete鄄time multi鄄agent systems under the assumption of the communication topology containing a directed spanning tree. First, a state augmentation technique was used to con鄄 vert the cooperative preview tracking problem into a global optimal regulation problem of an augmented system. Second, by resorting to relative conclusions about the discrete鄄time linear quadratic regulation theory, an optimal controller was obtained, which can guarantee the asymptotic stability of the closed鄄loop augmented system. Moreover, a global optimal preview controller was provided in order for the original system to achieve the tracking consensus. Finally, the simulation results not only verified the effectiveness of the designed controller, but also indicated that it is critical for accurately tracking the reference signal to moderately increase the preview length. KEY WORDS multi鄄agent systems; cooperative tracking; preview control; algebraic Riccati equation 近年来, 受复杂系统理论、传感、计算机以及通 信技术等快速发展的影响, 多智能体系统的协调控 制受到了研究者的广泛关注. 协调控制研究的主要 问题是根据所设计的分布式控制策略来分析智能体 的动态特性与智能体间的信息交换拓扑对系统整体 行为的影响. 一致性问题在计算机科学中有着很长的历 史[1] , 近期在多智能体系统的背景下已逐渐成为协 调控制研究中的一个重要而基本的问题. 一般而 言, 一致性问题可分为两类, 即无领导者的一致性 问题和有领导者的同步问题, 后者也称为分布式跟 踪问题、领导者跟随者一致性问题或牵引控制问 题等. 在无领导者一致性问题研究方面, 文献[2]分 别在拓扑为固定或切换、通信存在或缺少时滞、以及 信息流为有向或无向的假设下, 较全面地研究了具 有一阶积分器系统的一致性问题, 并为每一种情形 提供了收敛性分析. 文献[3]考虑了二阶积分器系
·242· 工程科学学报,第40卷,第2期 统的分布式协议设计问题,并在无向信息交换拓扑 H2最优预见控制问题,其处理问题的核心思想是 的假设下推出了系统实现一致性所需的充要条件. 将H,调节问题看做具有多输入时滞的线性二次型 随后,该问题在文献[4]中得到了进一步深入的研 最优调节问题.文献[27]与文献[26]在处理问题 究.当切换互联拓扑满足频繁连通的假设时,文献 的主要思想上是一致的,不同的是,文献[27]中的 [5]为多智能体系统设计了基于局部信息的分散式 方法不仅给出了预见时间与H,性能之间的解析表 控制器,并证明实现一致性的充分条件为线性系统 达式,而且可以处理参考信号分量的预见步长为相 完全能控.针对互联拓扑中每个智能体的输出信息 异的情形.文献[28]研究了凸多面体不确定离散时 可测的情形,文献[6]采用低增益方法设计了实现 间系统的鲁棒预见控制问题,作者基于混合LQ/ 一致性所需的分布式动态补偿器.近来,该方法得 H判据设计了能抑制外部干扰的鲁棒伺服控制器 到了进一步推广,解决了广义多智能体系统的一致 文献[29]采用上述方法设计了参数相关的静态输 性问题].文献[8]根据每个智能体邻居的输出信 出反馈预见控制器.当模型中存在大的参数不确定 息设计了观测器型一致性协议,使得多智能体系统 性时,文献[30]中的作者基于多模型自适应控制给 能按给定的收敛速度实现一致性.文献[9]考虑了 出了一种新的预见控制器设计方法. 多智能体系统的H,和H,控制器设计问题(H,和 文献[31]中首次研究了连续时间多智能体系 H均为范数),作者引入了H2和H性能区域的概 统的协调预见跟踪问题,在所给的信息交换拓扑 念用以度量协议的鲁棒性.文献[10]研究了离散时 下,全局虚拟调节误差渐近地趋于零蕴含着系统可 间多智能体系统的一致性问题,其中的模型具有传 实现协调预见跟踪.于是建立基于全局虚拟调节误 递非线性和时变时滞.当模型中具有输入饱和限制 差和全局状态向量导数的增广系统,从而将协调跟 时,文献[11]在固定无向拓扑的情形下给出了系统 踪问题转化为最优调节问题,这是文献[31]处理协 实现全局一致性的必要条件.文献[12]运用行随机 调预见跟踪问题的主要思想.本文将文献[31]中的 矩阵的乘积性质解决了一类离散时间线性多智能体 方法扩展至离散时间系统的情形,与文献[31]不同 系统的收敛性分析问题.更多关于一致性问题的研 的是,通过构建关于预见信息差分的恒等式,增广 后的系统可进一步转化为标准的离散时间线性系 究成果可参见文献[13-14]. 统.在用线性二次型最优控制理论获得全局最优预 对于有领导者的同步问题,文献[15]在切换互 见控制器后,可根据系统矩阵的特点对控制器和代 联拓扑的情形下考虑了多智能体系统的领导者-跟 数Riccati方程进行降阶处理,使所得的结果可用 随者一致性问题,通过构建公共Lyapunov函数,作 初次进行系统增广后的相应矩阵表示.这将在一定 者证明所设计的分布式控制策略可实现对动态领导 程度上降低仿真时的计算复杂度 者的跟踪.在模型中存在可测噪声以及互联拓扑为 有向的情形下,文献[16]设计了带有分布式估计器 1记号与有关基础知识 的控制策略,并分析了跟踪误差的均方收敛情况. 本节给出文中用到的一些主要记号和概念. 文献[17]考虑的模型为具有多时变时滞的二阶积 R(C)为实数(复数)集.Rx(C)为n×l 分器系统,并在拓扑为固定和切换的情形下分别给 的实数矩阵(复数矩阵)集合.I,表示n×n的单位 出了实现跟踪一致性的充要条件和充分条件.随 矩阵,后文此形式均表示相应的单位矩阵.1∈R" 后,文献[18]将上述问题推广到了一般线性系统的 表示元素都为1的列向量.0∈Rx表示n×l的零 情形.关于跟踪一致问题的其他重要结果还可参见 矩阵.diag(a1,a2,…,an)表示对角矩阵,其中a 文献[19-20]. (i=1,2,…,n)为主对角元素,其余元素为0.对于 预见控制自提出以来便在实践中得到了成功的 矩阵A∈RaxL,B∈RPx9,A⑧B表示Kronecker 应用[21-2],其主要思想是利用已知的未来信息设 积,其定义为 计带有预见补偿作用的控制器,以提高闭环系统的 「aB …aB 跟踪和(或)抗干扰品性.预见控制的理论研究已经 A⑧B= 取得了长足的进步,尤其是线性二次型最优预见控 LanB…anB」 制,有关结果可参见文献[23-25].近年来,基于 容易验证,Kronecker积满足如下性质:(A⑧B)(C☒ H2和H。的最优预见控制问题也得到了深入的研 D)=(AC)☒(BD),(A⑧B)T=A'⑧B,A☒B+ 究.文献[26]中处理了具有多输入多输出时滞的 A⑧C=A⑧(B+C),其中C和D为具有适当维数
工程科学学报,第 40 卷,第 2 期 统的分布式协议设计问题, 并在无向信息交换拓扑 的假设下推出了系统实现一致性所需的充要条件. 随后, 该问题在文献[4]中得到了进一步深入的研 究. 当切换互联拓扑满足频繁连通的假设时, 文献 [5]为多智能体系统设计了基于局部信息的分散式 控制器, 并证明实现一致性的充分条件为线性系统 完全能控. 针对互联拓扑中每个智能体的输出信息 可测的情形, 文献[6]采用低增益方法设计了实现 一致性所需的分布式动态补偿器. 近来, 该方法得 到了进一步推广, 解决了广义多智能体系统的一致 性问题[7] . 文献[8]根据每个智能体邻居的输出信 息设计了观测器型一致性协议, 使得多智能体系统 能按给定的收敛速度实现一致性. 文献[9]考虑了 多智能体系统的 H2 和 H肄 控制器设计问题(H2 和 H肄 均为范数), 作者引入了 H2 和 H肄 性能区域的概 念用以度量协议的鲁棒性. 文献[10]研究了离散时 间多智能体系统的一致性问题, 其中的模型具有传 递非线性和时变时滞. 当模型中具有输入饱和限制 时, 文献[11]在固定无向拓扑的情形下给出了系统 实现全局一致性的必要条件. 文献[12]运用行随机 矩阵的乘积性质解决了一类离散时间线性多智能体 系统的收敛性分析问题. 更多关于一致性问题的研 究成果可参见文献[13鄄鄄14]. 对于有领导者的同步问题, 文献[15]在切换互 联拓扑的情形下考虑了多智能体系统的领导者鄄鄄 跟 随者一致性问题, 通过构建公共 Lyapunov 函数, 作 者证明所设计的分布式控制策略可实现对动态领导 者的跟踪. 在模型中存在可测噪声以及互联拓扑为 有向的情形下, 文献[16]设计了带有分布式估计器 的控制策略, 并分析了跟踪误差的均方收敛情况. 文献[17]考虑的模型为具有多时变时滞的二阶积 分器系统, 并在拓扑为固定和切换的情形下分别给 出了实现跟踪一致性的充要条件和充分条件. 随 后, 文献[18]将上述问题推广到了一般线性系统的 情形. 关于跟踪一致问题的其他重要结果还可参见 文献[19鄄鄄20]. 预见控制自提出以来便在实践中得到了成功的 应用[21鄄鄄22] , 其主要思想是利用已知的未来信息设 计带有预见补偿作用的控制器, 以提高闭环系统的 跟踪和(或)抗干扰品性. 预见控制的理论研究已经 取得了长足的进步, 尤其是线性二次型最优预见控 制, 有关结果可参见文献[23鄄鄄 25]. 近年来, 基于 H2 和 H肄 的最优预见控制问题也得到了深入的研 究. 文献[26]中处理了具有多输入多输出时滞的 H2 最优预见控制问题, 其处理问题的核心思想是 将 H2 调节问题看做具有多输入时滞的线性二次型 最优调节问题. 文献[27]与文献[26]在处理问题 的主要思想上是一致的, 不同的是, 文献[27]中的 方法不仅给出了预见时间与 H2 性能之间的解析表 达式, 而且可以处理参考信号分量的预见步长为相 异的情形. 文献[28]研究了凸多面体不确定离散时 间系统的鲁棒预见控制问题, 作者基于混合 LQ/ H肄 判据设计了能抑制外部干扰的鲁棒伺服控制器. 文献[29]采用上述方法设计了参数相关的静态输 出反馈预见控制器. 当模型中存在大的参数不确定 性时, 文献[30]中的作者基于多模型自适应控制给 出了一种新的预见控制器设计方法. 文献[31]中首次研究了连续时间多智能体系 统的协调预见跟踪问题, 在所给的信息交换拓扑 下, 全局虚拟调节误差渐近地趋于零蕴含着系统可 实现协调预见跟踪. 于是建立基于全局虚拟调节误 差和全局状态向量导数的增广系统, 从而将协调跟 踪问题转化为最优调节问题, 这是文献[31]处理协 调预见跟踪问题的主要思想. 本文将文献[31]中的 方法扩展至离散时间系统的情形, 与文献[31]不同 的是, 通过构建关于预见信息差分的恒等式, 增广 后的系统可进一步转化为标准的离散时间线性系 统. 在用线性二次型最优控制理论获得全局最优预 见控制器后, 可根据系统矩阵的特点对控制器和代 数 Riccati 方程进行降阶处理, 使所得的结果可用 初次进行系统增广后的相应矩阵表示. 这将在一定 程度上降低仿真时的计算复杂度. 1 记号与有关基础知识 本节给出文中用到的一些主要记号和概念. 迬 (迯 )为实数(复数)集. 迬 n 伊 l (迯 n 伊 l )为 n 伊 l 的实数矩阵(复数矩阵)集合. In 表示 n 伊 n 的单位 矩阵,后文此形式均表示相应的单位矩阵. 1沂迬 n 表示元素都为 1 的列向量. 0沂迬 n 伊 l表示 n 伊 l 的零 矩阵. diag( a1 ,a2 ,…,an ) 表示对角矩阵, 其中 ai (i = 1,2,…,n)为主对角元素, 其余元素为 0. 对于 矩阵 A沂迬 n 伊 l , B沂迬 p 伊 q , A茚B 表示 Kronecker 积, 其定义为 A茚B = a11B … a1lB 左 埙 左 an1B … anl é ë ê ê ê ù û ú ú ú B 容易验证, Kronecker 积满足如下性质:(A茚B)(C茚 D) = (AC)茚(BD), (A茚B) T = A T茚B T , A茚B + A茚C = A茚(B + C), 其中 C 和 D 为具有适当维数 ·242·
卢延荣等:离散时间多智能体系统的协调最优预见跟踪 ·243· 的矩阵.有关Kronecker积的其他性质,可参考文 另外,设r(k)的预见步数为M,即对于当前时标 献[32]. k,参考信号r(k),r(k+1),r(k+2),…,r(k+ 对于多智能体系统,智能体间的信息交换拓扑 M.)的值为已知,M。步以后的值为常值,即 通常用有向图罗=((),))表示,其中(分= r(k+j)=r(k),j=Mg+1,Mg+2,Mg+3,… {,2,…,w}是顶点集,(分二孔分×(分代 用预见控制的相关理论来设计控制器.首先把 表弧集.顶点,∈(分表示第i个智能体,弧(:, (1)写成紧凑形式,为此引入向量 秒)∈队表示第j个智能体可以接受来自第i个 「x,(k)7 u(k) 智能体的信息,其中顶点:称为父顶点,)称为子 x2(k) 42(k) 顶点,并称:为心的邻居.基于此,定义第i个智 x(k)= ∈RN,u(k)= ∈Rw 能体的邻居集为={1(巴,:)∈(}.在有向 图罗中,如果除根顶点外,其他顶点有且只有一个 xx() LuN() 父顶点,则称有向图罗为一棵有向树.另外,在有 (k)1 向图罗中,若其全部顶点和部分弧组成的有向图为 2(k) y(k)= ∈RW. 一棵有向树,则称有向图罗包含一棵生成树 定义有向图罗的邻接矩阵为W=[a]∈ Lyx(k)」 RxN,ag表示弧(,)的权重.规定:若(,)∈ 系统(1)可表示为 分,a=1,否则a,=0.拉普拉斯矩阵L= (x(k+1)=(Iw⑧A)x(k)+(Iw☒B)u(k) [l与]∈Rxw,定义为l=∑a,l与=-a与,ij:i, y(k)=(Iw⑧C)x(k) jc. x(0)=xo (3) j=1,2,…N,显然∑与=0. 进一步,对系统(1)及其对应的有向信息交换 本文视参考信号r(k)为领导者(标记为顶点 拓扑写作如下假设 )的输出轨迹.如果第i个顶点能够接受来自领导 B A2:设(A,B)可镇定且 行满秩,1 者的信息,则弧(o,:)存在并记其权重m:=1,否 0 则m:=0.此外,记牵引矩阵为M=diag(m1,m2, 表示具有适当维数的单位矩阵. …,my). A3:设(C,A)可检测. A4:设有向图罗包含一棵生成树,而且根顶点 2问题描述 v,能够观测到来自领导者的信息,即m.=1. 考虑由N个跟随者和一个领导者构成的多智 对于假设A4,一个已知的结果是: 能体系统,其中跟随者的动力学方程为 引理13)如果假设A4成立,那么有 x:(k+1)=Ax,(k)+Bu:(k) (1)L1w=0,换言之,0是矩阵L的一个特征 ,x:(0)=x0, y;(k)=Cx;(k) 值,其相应的特征向量为1、; i=1,2,…,W (1) (2)矩阵H非奇异且其所有特征值具有正的实 其中,x(k)∈R",u:(k)∈R',y:(k)∈R'分别表 部,其中,H=L+M. 示状态,输人和输出,xm表示x:(k)的初值,A、B 在随后的讨论中,我们还需要用到下面的 和C分别为n×n、n×r和l×n的矩阵.对于取定 结果 的i,(1)中的方程就是第i个跟随者的状态方程 引理2 在假设A4成立时,矩阵 设领导者的输出(即参考信号)为r(k),本文 H⑧C 0 的目的是设计一个最优预见控制器,使得系统(1) 行满秩的充分必要条件是 IN-(I,⑧A)I,⑧B」 的闭环系统的输出y,(k)都渐近跟踪r(k),即 lim[y:(k)-r(k)]=0,i=1,2,…,N(2) 1-AB行满秩 0 首先对参考信号作如下假设. 附注1这一结果的证明方法与文献[31]中引 A1:设参考信号r(k)在k→∞时趋于常值向量 理3的证明方法很相似,因此不再重复. r,即 定义跟随者i(i=1,2,…,N)的局部邻居输出 limr(k)=r 误差为
卢延荣等: 离散时间多智能体系统的协调最优预见跟踪 的矩阵. 有关 Kronecker 积的其他性质, 可参考文 献[32]. 对于多智能体系统, 智能体间的信息交换拓扑 通常用有向图 G = (V(G),E(G))表示, 其中 V(G) = {v1 ,v2 ,…,vN }是顶点集, E(G)哿V(G) 伊 V(G)代 表弧集. 顶点 vi沂V(G)表示第 i 个智能体, 弧( vi, vj)沂E(G)表示第 j 个智能体可以接受来自第 i 个 智能体的信息, 其中顶点 vi 称为父顶点, vj 称为子 顶点, 并称 vi 为 vj 的邻居. 基于此, 定义第 i 个智 能体的邻居集为 Ni = {j | (vj,vi)沂E(G)}. 在有向 图 G 中, 如果除根顶点外, 其他顶点有且只有一个 父顶点, 则称有向图 G 为一棵有向树. 另外, 在有 向图 G 中, 若其全部顶点和部分弧组成的有向图为 一棵有向树, 则称有向图 G 包含一棵生成树. 定义有 向 图 G 的 邻 接 矩 阵 为 W = [ aij ] 沂 迬 N 伊 N , aij表示弧(vj,vi)的权重. 规定:若( vj,vi)沂 E(G), aij = 1, 否则 aij = 0. 拉普拉斯矩阵 L = [l ij]沂迬 N 伊 N ,定义为 l ii = 移 j沂Ni aij, l ij = - aij, i屹j; i, j = 1,2,…,N, 显然 移 N j = 1 l ij = 0. 本文视参考信号 r( k) 为领导者(标记为顶点 v0 )的输出轨迹. 如果第 i 个顶点能够接受来自领导 者的信息, 则弧(v0 ,vi)存在并记其权重 mi = 1, 否 则 mi = 0. 此外, 记牵引矩阵为 M = diag(m1 ,m2 , …,mN). 2 问题描述 考虑由 N 个跟随者和一个领导者构成的多智 能体系统, 其中跟随者的动力学方程为 xi(k + 1) = Axi(k) + Bui(k) yi(k) = Cxi(k { ) , xi(0) = xi0 , i = 1,2,…,N (1) 其中,xi(k)沂迬 n , ui(k)沂迬 r , yi(k)沂迬 l 分别表 示状态, 输入和输出, xi0 表示 xi ( k) 的初值, A、B 和 C 分别为 n 伊 n、n 伊 r 和 l 伊 n 的矩阵. 对于取定 的 i, (1)中的方程就是第 i 个跟随者的状态方程. 设领导者的输出(即参考信号)为 r( k), 本文 的目的是设计一个最优预见控制器, 使得系统(1) 的闭环系统的输出 yi(k)都渐近跟踪 r(k), 即 lim k寅肄 [yi(k) - r(k)] = 0, i = 1,2,…,N (2) 首先对参考信号作如下假设. A1: 设参考信号 r(k)在 k寅肄 时趋于常值向量 r, 即 lim k寅肄 r(k) = r 另外, 设 r( k)的预见步数为 MR,即对于当前时标 k, 参考信号 r( k), r( k + 1), r( k + 2),…,r( k + MR)的值为已知, MR 步以后的值为常值, 即 r(k + j) = r(k), j = MR + 1,MR + 2,MR + 3,… 用预见控制的相关理论来设计控制器. 首先把 (1)写成紧凑形式, 为此引入向量 x(k) = x1 (k) x2 (k) 左 xN(k é ë ê ê ê ê ê ù û ú ú ú ú ú ) 沂迬 nN , u(k) = u1 (k) u2 (k) 左 uN(k é ë ê ê ê ê ê ù û ú ú ú ú ú ) 沂迬 rN , y(k) = y1 (k) y2 (k) 左 yN(k é ë ê ê ê ê ê ù û ú ú ú ú ú ) 沂迬 lN . 系统(1)可表示为 x(k + 1) = (IN茚A)x(k) + (IN茚B)u(k) y(k) = (IN茚C)x(k { ) , x(0) = x0 (3) 进一步, 对系统(1)及其对应的有向信息交换 拓扑 G 作如下假设. A2: 设(A,B) 可镇定且 I - A B C é ë ê ê ù û ú ú 0 行满秩, I 表示具有适当维数的单位矩阵. A3: 设(C,A)可检测. A4: 设有向图 G 包含一棵生成树, 而且根顶点 vi r能够观测到来自领导者的信息, 即 mi r = 1. 对于假设 A4, 一个已知的结果是: 引理 1 [31] 如果假设 A4 成立, 那么有 (1)L1N = 0, 换言之, 0 是矩阵 L 的一个特征 值, 其相应的特征向量为 1N; (2)矩阵 H 非奇异且其所有特征值具有正的实 部,其中,H = L + M. 在随后的讨论中, 我 们 还 需 要 用 到 下 面 的 结果. 引 理 2 在 假 设 A4 成 立 时, 矩 阵 H茚C 0 InN - (IN茚A) IN茚 é ë ê ê ù û ú Bú行满秩的充分必要条件是 I - A B C é ë ê ê ù û ú ú 0 行满秩. 附注 1 这一结果的证明方法与文献[31]中引 理 3 的证明方法很相似, 因此不再重复. 定义跟随者 i( i = 1,2,…,N) 的局部邻居输出 误差为 ·243·
·244· 工程科学学报,第40卷,第2期 e,(k)=∑a,y,(k)-y:(k)+m,(r(k)-y,(k) M⑧L ie GR= (4) 由假设A1知,对于当前时标k,R(k),R(k+ 记全局输出误差为 1),R(k+2),…,R(k+M。)的值是已知的.基于 e,(k)7 此,将参考信号的增量做成列向量 e2(k) e(k)= ∈RW △R(k+1) △R(k+2) Lex(k) X(k)= 并令R(k)=1v⑧r()∈R,则由(4)得到 △R(k+MR)」 e(k)=-((L+M)⑧C)x(k)+(M⑧L)R(k) 显然,X(k)满足如下的代数关系 (5) XR(k+1)=AgXg(k) (9) 其中,L为有向图对应的拉普拉斯矩阵,M为牵 其中AR是(lNM)×(lNMR)矩阵,定义为 引矩阵.为方便起见,记H=L+M.注意到H1v= 0 0 07 (L+M)1x=M1w,则(4)可表示为 e(k)=-(H⑧l)(Ix⑧C)x(k)-R(k)(6) AR= 0 在假设A4下,由于H非奇异,因此从(6)得到当 且仅当lime(k)=0时(2)成立.为此,引入如下的 0 二次型性能指标函数 再次引入状态变量 J=∑∑e(k)0e,(k)+△u(k)R△u,(k) 「X(k)1 Xgo(k) k=-g+1=1 Xp(k) (7) 于是,结合(8)和(9)得到标准的离散时间线性 式中,Q和R分别是l×l和r×r的正定矩阵(i= 系统 1,2,…,N).文献[23]指出,在性能指标中引入输 Xo(+1)=Xgo(k)+Au(k) (10) 入的差分△u,(k),可使闭环系统中包含积分器,而 其中,2= = 「G. 亚= 积分器的存在有助于消除系统在跟踪过程中产生的 0 AR 静态误差. [Gg0… 0],并且2和⊙分别为[N(l+n+ 下面采用预见控制的方法构造一个增广系统, lM.)]×[N(l+n+lMR)]和[N(l+n+lMR)]× 将多智能体系统的协调预见跟踪问题转化为对增广 (Nr)的矩阵. 系统的状态调节问题,然后设计所需要的控制器. 根据本文的控制目的,取观测方程为 e(k)=IXgo(k) (11) 3最优预见控制器的设计 其中,T=[Co0]为(lW)×[N(l+n+lM.)]的矩 3.1增广系统的构造 阵.则(10)和(11)即为所需要的增广系统 将一阶后向差分算子△: 根据系统(10)中的相关变量,性能指标函数 △r(k)=x(k)-x(k-1) (7)可表示为 作用于系统(3)和全局输出误差(5),并引入状态 向量 J=豆(0x()+a如()u() (12) X(k) e(k) L△r(k) 得到 -[88e-[8 ,分别为[N(l+n+ X(k+1)=ΦX(k)+G.△u(k)+GR△R(k+1) Ma)]×[N(l+n+M)]和[(l+n)N]×[(l+n) (8) N]的半正定矩阵.另外,Q.=diag(Q。,Qa,…, 「I-H☒CA -H⑧CB 其中,Φ= Qv),R=diag(R1,R2,…,R). 0I⑧A G。= Iv⑧B 至此,离散时间多智能体系统的协调预见跟踪
工程科学学报,第 40 卷,第 2 期 ei(k) = 移 j沂Ni aij(yj(k) - yi(k)) + mi(r(k) - yi(k)) (4) 记全局输出误差为 e(k) = e1 (k) e2 (k) 左 eN(k é ë ê ê ê ê ê ù û ú ú ú ú ú ) 沂迬 lN 并令 R(k) = 1N茚r(k)沂迬 lN , 则由(4)得到 e(k) = - ((L + M)茚C)x(k) + (M茚Il)R(k) (5) 其中, L 为有向图 G 对应的拉普拉斯矩阵, M 为牵 引矩阵. 为方便起见,记 H = L + M. 注意到 H1N = (L + M)1N = M1N, 则(4)可表示为 e(k) = - (H茚Il)((IN茚C)x(k) - R(k)) (6) 在假设 A4 下, 由于 H 非奇异, 因此从(6)得到当 且仅当lim k寅肄 e(k) = 0 时(2)成立. 为此, 引入如下的 二次型性能指标函数 J = 移 肄 k = -MR+1移 N i = 1 e T i (k)Qei ei(k) + 驻u T i (k)R寛i驻ui(k) (7) 式中, Qei和 R寛i 分别是 l 伊 l 和 r 伊 r 的正定矩阵(i = 1,2,…,N). 文献[23]指出, 在性能指标中引入输 入的差分 驻ui(k), 可使闭环系统中包含积分器, 而 积分器的存在有助于消除系统在跟踪过程中产生的 静态误差. 下面采用预见控制的方法构造一个增广系统, 将多智能体系统的协调预见跟踪问题转化为对增广 系统的状态调节问题, 然后设计所需要的控制器. 3 最优预见控制器的设计 3郾 1 增广系统的构造 将一阶后向差分算子 驻: 驻x(k) = x(k) - x(k - 1) 作用于系统(3)和全局输出误差(5), 并引入状态 向量 X0 (k) = e(k) 驻x(k é ë ê ê ù û ú ú ) 得到 X0 (k + 1) = 椎X0 (k) + Gu驻u(k) + GR驻R(k + 1) (8) 其 中, 椎 = I - H茚CA 0 IN茚 é ë ê ê ù û ú A ú , Gu = - H茚CB IN茚 é ë ê ê ù û ú B ú , GR = M茚I é l ë ê ê ù û ú ú 0 . 由假设 A1 知, 对于当前时标 k, R(k), R(k + 1), R(k + 2), …, R(k + MR )的值是已知的. 基于 此, 将参考信号的增量做成列向量 XR(k) = 驻R(k + 1) 驻R(k + 2) 左 驻R(k + MR é ë ê ê ê ê ê ù û ú ú ú ú ú ) 显然, XR(k)满足如下的代数关系 XR(k + 1) = ARXR(k) (9) 其中 AR 是(lNMR) 伊 (lNMR)矩阵, 定义为 AR = 0 IlN 0 … 0 左 埙 埙 埙 左 左 埙 埙 0 左 埙 IlN 0 … … … é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 0 再次引入状态变量 XR0 (k) = X0 (k) XR(k é ë ê ê ù û ú ú ) 于是, 结合(8) 和(9) 得到标准的离散时间线性 系统 XR0 (k + 1) = 赘XR0 (k) + 专驻u(k) (10) 其 中, 赘 = 椎 追 0 A é ë ê ê ù û ú ú R , 专 = éGu ë ê ê ù û ú ú 0 , 追 = [GR 0 … 0],并且 赘 和 专 分别为[N( l + n + lMR)] 伊 [N( l + n + lMR )] 和[N( l + n + lMR )] 伊 (Nr)的矩阵. 根据本文的控制目的, 取观测方程为 e(k) = 祝XR0 (k) (11) 其中,祝 = [C0 0]为( lN) 伊 [N( l + n + lMR )]的矩 阵. 则(10)和(11)即为所需要的增广系统. 根据系统(10) 中的相关变量, 性能指标函数 (7)可表示为 J = 移 肄 k = 1 X T R0 (k) ^QXR0 (k) + 驻u T (k)R寛驻u(k) (12) 其中, ^Q = éQ 0 ë ê ê ù û ú ú 0 0 , Q = éQe 0 ë ê ê ù û ú ú 0 0 ,分别为[N(l + n + lMR)] 伊 [N(l + n + lMR)]和[( l + n)N] 伊 [( l + n) N]的半正定矩阵. 另外, Qe = diag ( Qe1 ,Qe2 ,…, QeN), R寛 = diag(R寛1 ,R寛2 ,…,R寛N). 至此, 离散时间多智能体系统的协调预见跟踪 ·244·
卢延荣等:离散时间多智能体系统的协调最优预见跟踪 ·245· 问题就转化为系统(11)在性能指标函数(12)下的 左乘[zl-2⊙]得到 最优调节问题.实际上,根据线性二次型最优控制 「(z-l)lw H⑧C -G810 0 0 理论[],将所求得的△u(k)代入系统(10),其闭 0 dnv-(l⑧A) 0 0…0 I⑧B 环系统为渐近稳定的,于是由(11)知e(k)在k→o w -Iw 0 时渐近稳定到0,即系统(1)实现了对领导者的协 w 调预见跟踪.通过应用文献[34]的结果,立即得到 下面的定理 -Iw 定理1若(2,O)可镇定,(Q,2)可检测, 0 0 2Lv0 则系统(10)的使性能指标函数(12)极小的最优控 由于初等变换不改变矩阵的秩,因此上述矩阵与 制输入为: [l-2O]具有相同的秩.又由于1z≥1,所以上 △u(k)=-(R+OP⊙)-1⊙P2Xo(k)(13) 述矩阵中以z山八为对角元的上三角矩阵块可逆,根 其中,P.是一个[N(l+n+lM.)]×[N(l+n+ 据矩阵秩的性质知 M.)]的半正定矩阵,满足如下的离散代数Riccati rank[2I-INMg rank(V) 方程 其中: H⑧C 07 P,=Q+2P2-2P⊙(R+⊙P⊙)-1⊙P2 0 (14) -(1,8A)1,®BK16) 3.2控制器的存在性 于是,只需证明下述命题即可:在假设A4下, 为了保证定理1中控制器的存在性,需要验证 当z∈C且IzI≥1时,V行满秩的充要条件是 原系统在满足何条件时,(2,⊙)是可镇定的以及 「I-AB [2I-A 均行满秩 (Q2,2)是可检测的 B C 0 引理3在假设A4下,(2,⊙)可镇定的充要 必要性.即证明在假设A4下,当1z1≥1时, 条件是假设A2成立 若V行满秩,则[l-A B]与-AB购行 证明:由Popov-Belevitch-Hautus(PBH)秩判 据知[3],需要证明:在假设A4下,当z∈C且1z1≥ 满秩 1时,[-2⊙]行满秩的充要条件是 当z=1时,由(16)得到 [-AB]与 I-AB1 均行满秩 H⑧C c o rank(Vl:=1)=rank LIx-(I⑧A)I⑧B 根据2和⊙的具体结构,有 (17) [d-00= 在假设A4下,由引理2知,如果 (:-1)IIN H⑧CA :-G810 …0:-H8CB H⑧C 0 lnv-(l⑧A) … 01,⑧8 I.N-(I,⑧A)I,⑧B 行 满秩, 那么 0 1w -Iw 0 w 「I-AB行满秩同时, 「I-A B c o 行满秩蕴含 0 -I 着[-AB]-行满秩 0 lw 0 当1z≥1且z≠1时,(z-1)1w非奇异,由矩 注意到 H⑧CA-zH⑧C= 阵秩的性质知,若V行满秩,则 (H⑧C)(I⑧A)-z(H⑧C)(I⑧In)= [InN-(Iw⑧A)Iw⑧B]行满秩.由于 -(H⑧C)[zl.x-(Iw⑧A)] (15) rank[zl.v-(Iw⑧A)I⑧B]=N-ank[zl-AB], 于是,用可逆矩阵 因此进一步得到,在1z|≥1且z≠1时,若V行满 「IwH⑧C 0 07 秩,则[z-AB]行满秩. IN 0 0 联合两种分类情形下的结果便可证得必要性. 0 IwN 充分性即证明在假设A4下,当z∈C且Iz1≥1 0 I-AB1 0 0 …0 Ii] 时,若[l-AB]与 c o 均行满秩,则V行
卢延荣等: 离散时间多智能体系统的协调最优预见跟踪 问题就转化为系统(11)在性能指标函数(12)下的 最优调节问题. 实际上, 根据线性二次型最优控制 理论[33] , 将所求得的 驻u( k) 代入系统(10), 其闭 环系统为渐近稳定的, 于是由(11)知 e(k)在 k寅肄 时渐近稳定到 0, 即系统(1)实现了对领导者的协 调预见跟踪. 通过应用文献[34]的结果,立即得到 下面的定理. 定理 1 若(赘,专)可镇定, ( ^Q 1 / 2 ,赘)可检测, 则系统(10)的使性能指标函数(12)极小的最优控 制输入为: 驻u(k) = - (R寛 + 专 TPr专) - 1专 TPr赘XR0 (k) (13) 其中, Pr 是一个[N( l + n + lMR )] 伊 [ N( l + n + lMR)]的半正定矩阵, 满足如下的离散代数 Riccati 方程 Pr = ^Q + 赘 TPr赘 - 赘 TPr专 (R寛 + 专 TPr专) - 1专 TPr赘 (14) 3郾 2 控制器的存在性 为了保证定理 1 中控制器的存在性,需要验证 原系统在满足何条件时, (赘,专) 是可镇定的以及 ( ^Q 1 / 2 ,赘)是可检测的. 引理 3 在假设 A4 下, (赘,专)可镇定的充要 条件是假设 A2 成立. 证明: 由 Popov鄄鄄 Belevitch鄄鄄 Hautus ( PBH) 秩判 据知[33] ,需要证明:在假设 A4 下, 当 z沂迯 且| z | 逸 1 时, [ zI - 赘 专 ] 行 满 秩 的 充 要 条 件 是 [zI - A B]与 I - A B C é ë ê ê ù û ú ú 0 均行满秩. 根据 赘 和 专 的具体结构, 有 [zI -赘 专] = (z -1)IlN H茚CA - G茚Il 0 … 0 -H茚CB 0 zInN - (IN茚A) 0 0 … 0 IN茚B 0 0 zIlN - IlN 0 左 左 zIlN 埙 左 左 左 埙 - IlN 左 0 0 zIlN 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪 é ë ê ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ú 0 注意到 H茚CA - zH茚C = (H茚C)(IN茚A) - z(H茚C)(IN茚In ) = - (H茚C)[zInN - (IN茚A)] (15) 于是, 用可逆矩阵 IlN H茚C 0 … 0 0 IlN 0 … 0 0 0 IlN 埙 左 左 左 埙 埙 0 0 0 … 0 I é ë ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú lN 左乘[zI - 赘 专]得到 (z -1)IlN zH茚C - G茚Il 0 … 0 0 0 zInN - (IN茚A) 0 0 … 0 IN茚B 0 0 zIlN - IlN 0 左 左 zIlN 埙 左 左 左 埙 - IlN 左 0 0 zIlN 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪 é ë ê ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ú 0 由于初等变换不改变矩阵的秩, 因此上述矩阵与 [zI - 赘 专]具有相同的秩. 又由于|z|逸1, 所以上 述矩阵中以 zIlN为对角元的上三角矩阵块可逆, 根 据矩阵秩的性质知 rank[zI - 赘 专] = lNMR + rank(V) 其中: V = (z - 1)IlN zH茚C 0 0 zInN - (IN茚A) IN茚 é ë ê ê ù û ú ú B (16) 于是, 只需证明下述命题即可: 在假设 A4 下, 当 z沂 迯 且 | z | 逸1 时, V 行满秩的充要条件是 [zI - A B]与 I - A B C é ë ê ê ù û ú ú 0 均行满秩. 必要性. 即证明在假设 A4 下, 当 | z | 逸1 时, 若 V 行 满 秩, 则 [ zI - A B] 与 I - A B C é ë ê ê ù û ú ú 0 均 行 满秩. 当 z = 1 时, 由(16)得到 rank(V| z = 1 ) = rank H茚C 0 InN - (IN茚A) IN茚 é ë ê ê ù û ú Bú (17) 在 假 设 A4 下, 由 引 理 2 知, 如 果 H茚C 0 InN - (IN茚A) IN茚 é ë ê ê ù û ú Bú 行 满 秩, 那 么 I - A B C é ë ê ê ù û ú ú 0 行满秩. 同时, I - A B C é ë ê ê ù û ú ú 0 行满秩蕴含 着[zI - A B]z = 1行满秩. 当|z| 逸1 且 z屹1 时, ( z - 1) IlN非奇异, 由矩 阵 秩 的 性 质 知, 若 V 行 满 秩, 则 [zInN - (IN茚A) IN茚B]行满秩. 由于 rank[zInN - (IN茚A) IN茚B] =N·rank[zI -A B], 因此进一步得到, 在| z | 逸1 且 z屹1 时, 若 V 行满 秩, 则[zI - A B]行满秩. 联合两种分类情形下的结果便可证得必要性. 充分性. 即证明在假设 A4 下, 当 z沂迯 且|z |逸1 时, 若[zI - A B]与 I - A B C é ë ê ê ù û ú ú 0 均行满秩, 则 V 行 ·245·