第14卷第5期 智能系统学报 Vol.14 No.5 2019年9月 CAAI Transactions on Intelligent Systems Sep.2019 D0:10.11992/tis.201809035 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.tp.20181224.2209.011.html 分布式事件触发多自主体领导跟随一致性研究 刘远山,杨洪勇',李玉玲‘,刘凡',杨怡泽 (1.鲁东大学信息与电气工程学院,山东烟台264025,2.新南咸尔士大学电机工程与通信学院,澳大利亚悉 尼2052) 摘要:为了提高系统的通信效率和能源利用率,减少多自主体系统硬件资源的浪费,提出了只需要自主体自 身及其最近邻居节点信息的分布式事件触发控制算法。研究了带有动态领导者的二阶多自主体系统领导跟随 一致性问题。应用矩阵论和现代控制理论研究了在分布式事件触发机制下的二阶系统,得到了基于事件触发 机制的多自主体系统协同运动的收敛条件。通过理论分析与计算表明,在此控制协议下不会存在芝诺行为,并 且多自主体系统可以实现领导跟随一致性。最后,应用计算机仿真验证了本文所提控制协议的可靠性。 关键词:多自主体系统:二阶系统:事件触发机制:芝诺行为:领导跟随;一致性;李雅普诺夫函数:计算机仿真 中图分类号:TP18文献标志码:A 文章编号:1673-4785(2019)05-0991-07 中文引用格式:刘远山,杨洪勇,李玉玲,等.分布式事件触发多自主体领导跟随一致性研究智能系统学报,2019,14(5): 991-997. 英文引用格式:LIU Yuanshan,,YANG Hongyong,.LI Yuling,etal.Distributed event-triggered consensus control of multi-agent sys- tems with leader-followingJ CAAI transactions on intelligent systems,2019,14(5):991-997. Distributed event-triggered consensus control of multi-agent systems with leader-following LIU Yuanshan',YANG Hongyong',LI Yuling',LIU Fan',YANG Yize2 (1.School of Information and Electrical Engineering.Ludong University,Yantai 264025,China;2.School of Electrical Engineering and Telecommunications.The University of New South Wales.Sydney 2052.Australia) Abstract:For second-order multi-agent systems with a dynamic leader,the problem of leader-following consistency is investigated herein.To reduce wastage of hardware resources and improve the communication efficiency of multi-agent systems,a distributed event-triggered control algorithm is proposed,which depends only on the agent states of each agent and its neighbors.The closed-loop model of second-order multi-agent systems is established with the distributed event-triggering mechanism.Through the matrix and modern control theories,the convergence condition of multi-agent systems'cooperative motion based on the distributed event-triggered mechanism is obtained.Through theoretical ana- lysis and calculation,the absence of Zeno behavior is confirmed in this control protocol.Finally,the effectiveness of the algorithm is verified through simulation experiments. Keywords:multi-agent systems;second-order system;event-triggered mechanism;Zeno behavior,leader-following; consensus control;Lyapunov function;computer simulation 受到自然界中动物集体运动(或者集群、编 “计算”能力的个体组成的分布式多自主体系统通 队运动)行为的启发,人们发现由多个具有自主 常能够完成相对复杂的任务,且具有单个个体所 不具有的能力。一致性作为分布式多自主体协同 收稿日期:2018-09-18.网络出版日期:2018-12-26. 基金项目:国家自然科学基金项目(61673200.61771231. 控制的基础,现在已经成为人工智能控制方向 61471185):山东省自然科学基金项目(ZR2017MF010, ZR20I7PF010). 的一个研究热点问题。 通信作者:杨洪勇.E-mail:hyyang@yeah.net 近年来,对于分布式多自主体的研究热度不
DOI: 10.11992/tis.201809035 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.tp.20181224.2209.011.html 分布式事件触发多自主体领导跟随一致性研究 刘远山1 ,杨洪勇1 ,李玉玲1 ,刘凡1 ,杨怡泽2 (1. 鲁东大学 信息与电气工程学院,山东 烟台 264025; 2. 新南威尔士大学 电机工程与通信学院,澳大利亚 悉 尼 2052) 摘 要:为了提高系统的通信效率和能源利用率,减少多自主体系统硬件资源的浪费,提出了只需要自主体自 身及其最近邻居节点信息的分布式事件触发控制算法。研究了带有动态领导者的二阶多自主体系统领导跟随 一致性问题。应用矩阵论和现代控制理论研究了在分布式事件触发机制下的二阶系统,得到了基于事件触发 机制的多自主体系统协同运动的收敛条件。通过理论分析与计算表明,在此控制协议下不会存在芝诺行为,并 且多自主体系统可以实现领导跟随一致性。最后,应用计算机仿真验证了本文所提控制协议的可靠性。 关键词:多自主体系统;二阶系统;事件触发机制;芝诺行为;领导跟随;一致性;李雅普诺夫函数;计算机仿真 中图分类号:TP18 文献标志码:A 文章编号:1673−4785(2019)05−0991−07 中文引用格式:刘远山, 杨洪勇, 李玉玲, 等. 分布式事件触发多自主体领导跟随一致性研究 [J]. 智能系统学报, 2019, 14(5): 991–997. 英文引用格式:LIU Yuanshan, YANG Hongyong, LI Yuling, et al. Distributed event-triggered consensus control of multi-agent systems with leader-following[J]. CAAI transactions on intelligent systems, 2019, 14(5): 991–997. Distributed event-triggered consensus control of multi-agent systems with leader-following LIU Yuanshan1 ,YANG Hongyong1 ,LI Yuling1 ,LIU Fan1 ,YANG Yize2 (1. School of Information and Electrical Engineering, Ludong University, Yantai 264025, China; 2. School of Electrical Engineering and Telecommunications, The University of New South Wales, Sydney 2052, Australia) Abstract: For second-order multi-agent systems with a dynamic leader, the problem of leader-following consistency is investigated herein. To reduce wastage of hardware resources and improve the communication efficiency of multi-agent systems, a distributed event-triggered control algorithm is proposed, which depends only on the agent states of each agent and its neighbors. The closed-loop model of second-order multi-agent systems is established with the distributed event-triggering mechanism. Through the matrix and modern control theories, the convergence condition of multi-agent systems’ cooperative motion based on the distributed event-triggered mechanism is obtained. Through theoretical analysis and calculation, the absence of Zeno behavior is confirmed in this control protocol. Finally, the effectiveness of the algorithm is verified through simulation experiments. Keywords: multi-agent systems; second-order system; event-triggered mechanism; Zeno behavior; leader-following; consensus control; Lyapunov function; computer simulation 受到自然界中动物集体运动 (或者集群、编 队运动) 行为的启发,人们发现由多个具有自主 “计算”能力的个体组成的分布式多自主体系统通 常能够完成相对复杂的任务,且具有单个个体所 不具有的能力。一致性作为分布式多自主体协同 控制的基础[1-4] ,现在已经成为人工智能控制方向 的一个研究热点问题。 近年来,对于分布式多自主体的研究热度不 收稿日期:2018−09−18. 网络出版日期:2018−12−26. 基金项目:国家自然科学基金项 目 (61673200, 61771231, 61471185);山东省自然科学基金项目 (ZR2017MF010, ZR2017PF010). 通信作者:杨洪勇. E-mail:hyyang@yeah.net. 第 14 卷第 5 期 智 能 系 统 学 报 Vol.14 No.5 2019 年 9 月 CAAI Transactions on Intelligent Systems Sep. 2019
·992· 智能系统学报 第14卷 断增长,并涌现出了大量的研究成果。文献[5-6)] 示,利用边来表示自主体之间的信息传递。带有 研究了在固定和变换拓扑下二阶多自主体系统协 领导者的网络中的通信拓扑可以由含有N+1个 同控制信息的一致性算法。文献[]针对有向拓 自主体的有向图G=P,E,A)来表示,其中P 扑结构研究了时变的二阶多自主体网络的一致性 0,1,…,W表示自主体的集合。E=7×7代表有 问题。在多自主体系统中如果减少自主体之间的 向边的集合,自主体i的邻接矩阵为N:=U∈ 通信次数,就可以减少网络中的节点之间数据的 Ii,)∈E,A=(a)wxw表示邻接矩阵,其中a,表 传递次数和频率,提高系统的收敛速度。文献 示边(位,)的权重。如果有向边位,)存在,即 [8]研究了具有交换拓扑和存在噪声的多自主体 亿,)eE,则与之对应的边的权值a>0,否则 系统模型,提出了一种基于自主体自身以及邻居 a=0。 状态的一致性采样控制协议。文献[9]研究了在 邻接矩阵A所有的对角元素为0。在图G中 采样数据集中的情况下具有领导者的多自主体收 敛问题。文献[10]研究了在时变拓扑下通过采样 分别令d=∑a和d=∑a,为第i个节点的 1 数据实现多自主体系统一致性的问题。尽管采样 入度和出度。特别地,若d(①=d(),则称图G 控制容易实现,且在一定程度上能够减少自主体 为平衡图。若定义D=diag{d.(}为图的度矩阵, 之间信息交互次数,但在采样数据差值微小或当 则图G的Laplacian矩阵L定义为L=D-A。定 系统趋近于稳定的时候系统仍然采样还会存在资 义矩阵H=diag{aoa2o…ao}为跟随者与领导者 源浪费的现象。所以Dimarogonas等-切提出了 的邻接矩阵,其中an不全为0。 仅需要自主体自己的状态与其邻居自主体状态的 引理1L为连通图G的Laplacian矩阵 事件触发机制,并且给出了可以使多自主体网络 1)1=0是L中的一个特征值,且其对应的特 实现一致性的集中式、自触发式和分布式的一阶 征向量为1w,即满足L1w=0wo 系统的事件触发函数。文献[14]研究并给出了非 2)令i=L+H,那么其特征值(L)>0。 线性多自主体系统的基于Lyapunov方法和驻留 引理2对于对称矩阵S=:、其中 时间方法两种事件触发机制的设计方法。文献 S21S22 [15-16]通过引人合理的状态误差研究了基于事 S、S2均为方阵。如果S>0,下面的两个条件等 件触发机制的多自主体系统有限时间快速收敛问 价: 题,得到了系统实现一致性的事件触发条件。文 1)S1>0,S22-S12'S1S12>0: 献[17]针对强连通图提出一种自适应事件触发控 2)S2>0,S1-S2TS21S12>0。 制方案,该方案根据采样数据动态改变系统参数 引理3对于任意维度的矩阵M、N、P和Q, 可以实现触发间隔的动态调节。文献[18]研究了 并且M和N是可逆矩阵,Kronecker积具有以下 线性结构下异构多自主体系统的输出收敛问题, 性质: 设计了一个事件触发下的输出控制机制。文献 1)(P+O)⑧M=P⑧M+Q⑧M: [19-21]综述了多自主体系统分布式事件触发控 2)(M⑧W)T=MT⑧WT; 制的研究现状,分析了当前几种主要的多自主体 3)amin(M))=nia(M⑧Imxm); 系统事件触发一致性算法。在以上的文献中主要 4)(M⑧N)(P⑧Q)=(MP)⑧(NQ). 研究了一阶系统的分布式事件触发算法,或者二 引理4若A、B是Hermite矩阵,则下式 阶系统的集中式触发算法。 成立: 本文给出了一种分布式事件触发机制下的二 1)Zmin(A)+Zmin(B)5 Imin(A+B); 阶多自主体系统的控制协议和触发函数,设计的 2)4max(A)+Amx(B)>Imx(A+B)o 事件触发函数的触发时刻仅依赖自主体自身状态 2 基于分布式事件触发机制的多自 和其邻居状态的误差值。应用矩阵论和现代控制 主体系统的一致性 理论等工具对分布式事件触发多自主体领导跟随 一致性进行了分析,得到了二阶系统协同运动的 21问题描述 收敛条件。 针对一个二阶多自主体系统中有N个可以 1预备知识 相互通信的个体,其动力学方程可以描述为 x,(t)=v,(t) (1) 一个自主体可以利用图中的一个节点来表 :(t)=l(t)
断增长,并涌现出了大量的研究成果。文献 [5-6] 研究了在固定和变换拓扑下二阶多自主体系统协 同控制信息的一致性算法。文献 [7] 针对有向拓 扑结构研究了时变的二阶多自主体网络的一致性 问题。在多自主体系统中如果减少自主体之间的 通信次数,就可以减少网络中的节点之间数据的 传递次数和频率,提高系统的收敛速度。文献 [8] 研究了具有交换拓扑和存在噪声的多自主体 系统模型,提出了一种基于自主体自身以及邻居 状态的一致性采样控制协议。文献 [9] 研究了在 采样数据集中的情况下具有领导者的多自主体收 敛问题。文献 [10] 研究了在时变拓扑下通过采样 数据实现多自主体系统一致性的问题。尽管采样 控制容易实现,且在一定程度上能够减少自主体 之间信息交互次数,但在采样数据差值微小或当 系统趋近于稳定的时候系统仍然采样还会存在资 源浪费的现象。所以 Dimarogonas 等 [11-13] 提出了 仅需要自主体自己的状态与其邻居自主体状态的 事件触发机制,并且给出了可以使多自主体网络 实现一致性的集中式、自触发式和分布式的一阶 系统的事件触发函数。文献 [14] 研究并给出了非 线性多自主体系统的基于 Lyapunov 方法和驻留 时间方法两种事件触发机制的设计方法。文献 [15-16] 通过引入合理的状态误差研究了基于事 件触发机制的多自主体系统有限时间快速收敛问 题,得到了系统实现一致性的事件触发条件。文 献 [17] 针对强连通图提出一种自适应事件触发控 制方案,该方案根据采样数据动态改变系统参数 可以实现触发间隔的动态调节。文献 [18] 研究了 线性结构下异构多自主体系统的输出收敛问题, 设计了一个事件触发下的输出控制机制。文献 [19-21] 综述了多自主体系统分布式事件触发控 制的研究现状,分析了当前几种主要的多自主体 系统事件触发一致性算法。在以上的文献中主要 研究了一阶系统的分布式事件触发算法,或者二 阶系统的集中式触发算法。 本文给出了一种分布式事件触发机制下的二 阶多自主体系统的控制协议和触发函数,设计的 事件触发函数的触发时刻仅依赖自主体自身状态 和其邻居状态的误差值。应用矩阵论和现代控制 理论等工具对分布式事件触发多自主体领导跟随 一致性进行了分析,得到了二阶系统协同运动的 收敛条件。 1 预备知识 一个自主体可以利用图中的一个节点来表 N +1 G¯ = {V¯,E, A¯} V¯ = {0,1,··· ,N} E = V¯ ×V¯ i Ni = {j ∈ V|(j,i) ∈ E} A¯ = (ai j)N×N ai j (i, j) (i, j) (i, j) ∈ E ai j > 0 ai j = 0 示,利用边来表示自主体之间的信息传递。带有 领导者的网络中的通信拓扑可以由含有 个 自主体的有向图 来表示,其中 表示自主体的集合。 代表有 向边的集合,自主体 的邻接矩阵为 , 表示邻接矩阵,其中 表 示 边 的权重。如果有向边 存在,即 ,则与之对应的边的权值 ,否则 。 A¯ G¯ din = ∑N i=1 ai j dout = ∑N i=1 aji i din(i) = dout(i) G¯ D = diag{din(i)} G¯ Laplacian L L = D− A¯ H = diag{a10 a20 ··· aN0} ai0 邻接矩阵 所有的对角元素为 0。在图 中 分别令 和 为第 个节点的 入度和出度。特别地,若 ,则称图 为平衡图。若定义 为图的度矩阵, 则图 的 矩阵 定义为 。定 义矩阵 为跟随者与领导者 的邻接矩阵,其中 不全为 0。 引理 1 L 为连通图 G 的 Laplacian 矩阵 λ1 = 0 1N L1N = 0N 1) 是 L 中的一个特征值,且其对应的特 征向量为 ,即满足 。 L¯ = L+ H λi(L¯ 2) 令 ,那么其特征值 ) > 0。 S = [ S11 S12 S21 S22 ] S11 S22 S > 0 引理 2 对于对称矩阵 ,其中 、 均为方阵。如果 ,下面的两个条件等 价: S11 > 0,S22 −S12 T S11 −1 1) S12 > 0 ; S22 > 0,S11 −S12 T S22 −1 2) S12 > 0。 M N P Q M N Kronecker 引理 3 对于任意维度的矩阵 、 、 和 , 并且 和 是可逆矩阵, 积具有以下 性质: 1) (P+Q)⊗ M = P⊗ M +Q⊗ M ; (M ⊗ N) T = MT ⊗ N T 2) ; 3) λmin(M) = λmin(M ⊗ Im×m) ; 4) (M ⊗ N)(P⊗Q) = (MP)⊗(NQ)。 引 理 4 若 A、B 是 Hermite 矩阵,则下式 成立: 1) λmin(A)+λmin(B) ⩽ λmin(A+ B) ; 2) λmax(A)+λmax(B) ⩾ λmax(A+ B)。 2 基于分布式事件触发机制的多自 主体系统的一致性 2.1 问题描述 针对一个二阶多自主体系统中有 N 个可以 相互通信的个体,其动力学方程可以描述为 { x˙i(t) = vi(t) v˙i(t) = ui(t) (1) ·992· 智 能 系 统 学 报 第 14 卷
第5期 刘远山,等:分布式事件触发多自主体领导跟随一致性研究 ·993· 式中:x,(0)∈Rm,为第i个跟随者在t时刻的位置; e,0=e0e0…e'eRw v,()∈Rm,为第i个跟随者在t时刻的速度; e,(t)=e"(t)e(t) u,(①∈Rm,为第i个跟随者在t时刻的控制协议; …e(ERY 则式(⑤)可以改写为 i=1,2,…,N。对于领导者0,其动力学方程可以 (t) x(1) ex(t) 描述为 -A⑧Im v(t) B⑧Imm e.(r)+ 」o(t)=o(t) (6) (2) ②(H⑧Imxm) 1xo(t) vo(t)=uo(t) B 1vo(t) 式中:x①∈Rm,为领导者在1时刻的位置; -INXN ONXN o()eRm,为领导者在t时刻的速度;o()∈Rm,为 式中:A= aL BL ,B= aL BL L=L+ 领导者在t时刻的控制协议,并且这里假设领导 H;H=diag{aoa0…aol;1表示全为1的列向 者0的加速度保持不变,即o()=0。 量;L为图G中跟随者的Laplacian矩阵。令,()= 定义1称跟随者自主体i与领导者0实现 x()-o(①,(t)=(①)-%(①,那么x()=(t)+xo(t0, 一致性,当且仅当存在控制协议,()使得系统在 ,()=()+%(),所以式(6)整理后得 任意的初始条件下满足: t(t) limlx:(t)-xo()1=0 limlv:(t)-vo(t)=0 由式(⑦可以看出,通过模型变换将研究系统 式(1)、(2)的领导跟随一致性问题,变为研究式 式中i=1,2,…,N。 2.2事件触发控制器的设计 (7)的稳定性问题。下面针对式(7)设计分布式事 件触发函数。 假设连续时间下的控制协议为 定理1考虑带有一个领导者的多自主体系 u,0=-a∑x0-x,0-B∑,(0-v,0- 统式(①)、2),如果连通图G至少含有一个全局可达点, jeN, aan(x;(t)-xo(t))-Bazo(vi(t)-vo(t)) 领导者为根节点,即图G中至少有一个自主体可 设基于事件触发机制的控制协议为 以接收到领导者发送的位置和速度状态,对于多 u0=-a∑x)-x》-B∑-v 自主体系统,那么设计分布式事件触发函数为 jEN jEN f((i),(t0,e(0),e(),e(t0),e(t)= ad(xi()-xo())-Bain(vi)-vo(1)) (3) Vm.∑a[aIea0r+leo+ 式中:α>0,B>0为系统控制协议的可调增益系 数;1e44),=inft>片:f0≥0k=1,2,…)为 Ble(+ax(alle(+B(] 0(6-1)le(t)l+1:(t)) 触发器的第k次事件触发时刻,其中f①为事件 (8) 触发函数。 式中:a>0,B>0为系统控制增益;0,∈(0,1), 定义误差函数为 e0=x)-x0所以 6=max{infmin(2ai)-l,(mn(2Bi)-2)-1,1}。在控 e(0=v()-v(0' 制协议式(3)的作用下,当)≥0时,多自主体 4(0=-a∑(x0-x,0+e.0-e0) 系统式(1)、(2)可以实现领导跟随一致。 B∑w0-vy0+ed0-eo- 证明令)=[t()r()门T,构造Lyapunov函 jeN 数V()=)T(P⑧Imxm)0,其中 aao(xi(t)+e(1)-xo())-Bao(vi(t)+e(t)-vo(t)) (4) P=a+BL+Ixo Iv】 INXN 因此式(1)可以变为 对V)求导可得 (t0=() ()=-a∑(c(t)-x()+e(0-e(0) V(0)=5(t)TP8Imxm5(0)+5t)P⑧1mxm5)= B (v:(t)-v,(t)+ei(t)-e(t))- (-5(t)T(ATP+PA)I())+ aao(xi(t)+e(t)-xo(t))-Bao(vi(t)+e(t)-vo(t)) (-e(i)TBrP⑧Imxm5()-5t)TP⑧In Be(t) (5) 其中e①=[e.)Te,()]T,计算得 为了简化书写,令 V(t))=-(t0(2aL)⑧Immt()+f(t0 TInn⑧Im()+ x(0=[x(03(0·xw(0]'∈R fi)TINXN⑧Lmm(t0)-(t)T(2BL-2INxw)⑧Imxm(t)+ (O=[v1()v2()…Vw()j'∈R (-e()TBrP⑧Imxm5()-5dTP⑧Imxm Be(t)
xi(t) ∈ R m i t vi(t) ∈ R m i t ui(t) ∈ R m i t i = 1,2,··· ,N 式中: ,为第 个跟随者在 时刻的位置; ,为第 个跟随者在 时刻的速度; ,为第 个跟随者在 时刻的控制协议; 。对于领导者 0,其动力学方程可以 描述为 { x˙0(t) = v0(t) v˙0(t) = u0(t) (2) x0(t) ∈ R m t v0(t) ∈ R m t u0(t) ∈ R m t 0 u0(t) = 0 式中: ,为领导者在 时刻的位置; ,为领导者在 时刻的速度; ,为 领导者在 时刻的控制协议,并且这里假设领导 者 的加速度保持不变,即 。 i 0 ui(t) 定义 1 称跟随者自主体 与领导者 实现 一致性,当且仅当存在控制协议 使得系统在 任意的初始条件下满足: lim t→∞ |xi(t)− x0(t)| = 0 lim t→∞ |vi(t)−v0(t)| = 0 式中 i = 1,2,··· ,N。 2.2 事件触发控制器的设计 假设连续时间下的控制协议为 ui(t) =−α ∑ j∈Ni (xi(t)− xj(t))−β ∑ j∈Ni (vi(t)−vj(t))− αai0(xi(t)− x0(t))−βai0(vi(t)−v0(t)) 设基于事件触发机制的控制协议为 ui(t) =−α ∑ j∈Ni (xi(t i k )− xj(t i k ))−β ∑ j∈Ni (vi(t i k )−vj(t i k ))− αai0(xi(t i k )− x0(t))−βai0(vi(t i k )−v0(t)) (3) α > 0 β > 0 t ∈ [ t i k ,t i k+1 ) t i k = inf{t > t i k−1 : fi(t) ⩾ 0}(k = 1,2,···) k fi(t) 式中: , 为系统控制协议的可调增益系 数; , 为 触发器的第 次事件触发时刻,其中 为事件 触发函数。 { e i x (t) = xi(t i k )− xi(t) e i v (t) = vi(t i k )−vi(t) 定义误差函数为 ,所以 ui(t) =−α ∑ j∈Ni (xi(t)− xj(t)+e i x (t)−e j x (t))− β ∑ j∈Ni (vi(t)−vj(t)+e i v (t)−e j v (t))− αai0(xi(t)+e i x (t)− x0(t))−βai0(vi(t)+e i v (t)−v0(t)) (4) 因此式 (1) 可以变为 x˙i(t) = vi(t) v˙i(t) = −α ∑ j∈Ni (xi(t)− xj(t)+e i x (t)−e j x(t))− β ∑ j∈Ni (vi(t)−vj(t)+e i v (t)−e j v(t))− αai0(xi(t)+e i x (t)− x0(t))−βai0(vi(t)+e i v (t)−v0(t)) (5) 为了简化书写,令 x(t) = [x1(t) x2(t) · · · xN(t)] T ∈ R N v(t) = [v1(t) v2(t) · · · vN(t)] T ∈ R N ex(t) = [ e 1 x (t) e 2 x (t) · · · e N x (t) ]T ∈ R N ev(t) = [ e 1 v (t) e 2 v (t) · · · e N v (t) ]T ∈ R N 则式 (5) 可以改写为 [ x˙(t) v˙(t) ] = −A⊗ Im×m [ x(t) v(t) ] − B⊗ Im×m [ ex(t) ev(t) ] + [ α β ]T ⊗(H ⊗ Im×m) [ 1x0(t) 1v0(t) ] (6) A = [ 0N×N −IN×N αL¯ βL¯ ] ,B = [ 0N×N 0N×N αL¯ βL¯ ] ,L¯ = L+ H = diag{a10 a20 ··· aN0} 1 L G¯ Laplacian xˆi(t) = xi(t)− x0(t) vˆi(t) = vi(t)−v0(t) xi(t) = xˆi(t)+x0(t) vi(t) = vˆi(t)+v0(t) 式中: H; ; 表示全为 1 的列向 量; 为图 中跟随者的 矩阵。令 , ,那么 , ,所以式 (6) 整理后得 · xˆ(t) · vˆ(t) = −A⊗ Im×m [ xˆ(t) vˆ(t) ] − B⊗ Im×m [ ex(t) ev(t) ] (7) 由式 (7) 可以看出,通过模型变换将研究系统 式 (1)、(2) 的领导跟随一致性问题,变为研究式 (7) 的稳定性问题。下面针对式 (7) 设计分布式事 件触发函数。 G¯ G¯ 定理 1 考虑带有一个领导者的多自主体系 统式 (1)、(2),如果连通图 至少含有一个全局可达点, 领导者为根节点,即图 中至少有一个自主体可 以接收到领导者发送的位置和速度状态,对于多 自主体系统,那么设计分布式事件触发函数为 fi( ˆxi(t), vˆi(t), exi(t), ex j(t), evi(t), ev j(t)) = √ m· ∑ j∈Ni ai j[α(∥exi(t)∥ 2 + ex j(t) 2 )+ β(∥evi(t)∥ 2 + ev j(t) 2 )+ai0(α∥exi(t)∥ 2 +β∥evi(t)∥ 2 )]− θi(δ−1)(∥xˆi(t)∥ 2 +∥vˆi(t)∥ 2 ) (8) α > 0 β > 0 θi ∈ (0,1) δ= max{inf{λmin(2αL¯)−1,(λmin(2βL¯)−2)−1},1} fi(t) ⩾ 0 式中: , 为系统控制增益; , 。在控 制协议式 (3) 的作用下,当 时,多自主体 系统式 (1)、(2) 可以实现领导跟随一致。 ξ(t) = [xˆ(t) T vˆ(t) T ] T Lyapunov V(t) = ξ(t) T (P⊗ Im×m)ξ(t) 证明 令 ,构造 函 数 ,其中 P = [ (α+β)L¯ + IN×N IN×N IN×N IN×N ] 对 V(t) 求导可得 V˙ (t) = ξ˙(t) T P⊗ Im×mξ(t)+ξ(t) T P⊗ Im×mξ˙(t) = (−ξ(t) T (A T P+ PA)⊗ Im×mξ(t))+ (−e(t) TB T P⊗ Im×mξ(t)−ξ(t) T P⊗ Im×m Be(t)) e(t) = [ex(t) T ev(t) T ] 其中 T,计算得 V˙ (t) = −xˆ(t) T (2αL¯)⊗ Im×m xˆ(t)+ xˆ(t) T In×n ⊗ Im×mvˆ(t)+ vˆ(t) T IN×N ⊗ Im×m xˆ(t)−vˆ(t) T (2βL¯ −2IN×N)⊗ Im×mvˆ(t)+ (−e(t) TB T P⊗ Im×mξ(t)−ξ(t) T P⊗ Im×m Be(t)) 第 5 期 刘远山,等:分布式事件触发多自主体领导跟随一致性研究 ·993·
·994· 智能系统学报 第14卷 根据引理3和引理4可以得到: f((t),(),e(t),ei(),en(t),e(t)》= 0)T2BL-2IN⑧Imxm(0= m.∑a,ale.r+ledl+ (t)T2βL⑧Im0-2(0 TINXN⑧Imxm(t)>≥ (亿ama(2βi)-2)lle(t) B(ll+()+ao(alleP+)]- 0.(6-1)0le(0+(t) 所以 对于第i个跟随者自主体,如果有f((①),(①, V(t)mi(2a+()- e(①),e(),e(0,e()≥0,那么第k=0,l,2,…,n个 (min(2BL)-2)l(t)l-[(t)a(L+H)Ix(e,(t)+ 条件触发,此时获取系统的位置和速度状态。 e()+(i)a(L+H)⑧Imm(ex(t)+e,(t)月 由Lyapunov稳定性理论可知,当事件触发条 那么 件式(8)满足时对于任意的初始位置状态 (t)儿=和速度状态,=,0≤0,二阶微分方程 V(t)min(2a)(+(+() 式(7)的解都可以满足iml(t)=0,liml()=0那 (0mn(2BL)-2)l(t0-2g(c(),t0),e.(0),e,(t0) 么表明lim(t)-xa(tl=0,limlva.(t)-o(tl=0。因 其中 此,根据定义1可以知道系统式(1)、(2)达成了领 g((),(t),e(),e,(t)= 导跟随一致性。 于事件触发条件式(⑧)是分布式的,任意的两 a⑧Imxm(eu(t)-e(t)+ao⑧Imxme(t) jeN 个自主体的事件触发时刻可以是不相同的。如果 f()<0事件触发,系统提取自身及其邻居的状态 来更新控制器。 如果艺诺现象产生则认为我们设计的事件触 aj⑧Imxm(e(t)-ej(t)+an⑧Imxme() 发函数是不可行的。为了证明系统在运行过程中 不会被触发无数次,下面计算任意两次事件触发 aj8Imxm(en(t)-ej(t))+ao⑧Imxmev(t) 的最小间隔。 定理2考虑带有一个领导者的多自主体系 统式(1)、(2),如果领导者作为图G中的一个全局 6=max(inflmin(2aL)-1,(min(2BL)-2)-1),1) 可达点,应用一致性协议式(3)和分布式事件触 又因为 发函数式(7),则系统式(1)、(2)中的任意一个自 -2g(t(t)n(t),e.(t),e(t)= 主体q,得到的所有的触发时刻为to,t,…,T,Tk+ 它的触发时刻的间隔1-,(s=0,1,…,k)≥tg -2∑i0+it∑a8 L.te..0-etr Tg为 F(e(0-evj(t)+ao⑧Imm(ae(t)+Ben(t)月≤ V,(6-·sup (All,B- Ta= (9) of+ei+ Va+B(IITI+HDIl)+0(6-1) 1 式中:T=diag(,T:为矩阵D+A的第i行元素绝 m∑anfa(e.a.of+eof+ 对值的和;6=max{inf以min(2aL)-1,(亿mn(2Bi)-2)-1, 150<0,<1i=1,2,…,N。 B(lle +()+ao(alle (P+Bl())]] 证明 构造 eo训的动态方程: 5t训 所以 g≤户-s0of+时em+or+ei+ d (lle(r)ll d (e(r)"e(r)) d50训 dt(传050) 海r2 .dodc.0+kor e('e0_Ile()5o'50 IIE()Ile(lI B(lle (r)+e(r)+a(alle (+B(]] 当t∈[t,tk)时,e(0=5t)+50,所以e()=0- 取0<8,<1,使得: 0。又因为50=A50+Be0.令e0=leo训,可 50' -0(6-1)+F)+Vm.>ajfa(lex(+ 以得到不等式:(①≤(1+p()2.supA,B,如 jEN 果(0满足0≤红,中),当且仅当c,)是 e()+B(+e)+ao(alle+ (≤(1+()2·supAll,B,(0,中)的解。当t∈ le(t)l2)]≤0 [g,)时,解微分方程dp(0=(1+g()2.supA, 所以将触发函数)设计为如下形式: IB)dr可得:
根据引理 3 和引理 4 可以得到: vˆ(t) T [ 2βL¯ −2IN×N ] ⊗ Im×mvˆ(t) = vˆ(t) T [ 2βL¯ ] ⊗ Im×mvˆ(t)−2vˆ(t) T IN×N ⊗ Im×mvˆ(t) ⩾ (λmin(2βL¯)−2)∥vˆ(t)∥ 2 所以 V˙ (t) ⩽ −λmin(2αL¯)∥xˆ(t)∥ 2 +(∥xˆ(t)∥ 2 +∥vˆ(t)∥ 2 )− (λmin(2βL¯)−2)∥vˆ(t)∥ 2 −[xˆ(t) Tα(L+ H)⊗ Im×m(ex(t)+ ev(t))+vˆ(t) Tα(L+ H)⊗ Im×m(ex(t)+ev(t))] 那么 V˙ (t) ⩽ −λmin(2αL¯)∥xˆ(t)∥ 2 +(∥xˆ(t)∥ 2 +∥vˆ(t)∥ 2 )− (λmin(2βL¯)−2)∥vˆ(t)∥ 2 −2g(xˆ(t), vˆ(t), ex(t), ev(t)) 其中 g(xˆ(t), vˆ(t), ex(t), ev(t)) = ∑n i=1 xˆi(t) α ∑ j∈Ni ai j ⊗ Im×m(exi(t)−ex j(t))+ai0 ⊗ Im×mexi(t) + ∑n i=1 xˆi(t) β ∑ j∈Ni ai j ⊗ Im×m(evi(t)−ev j(t))+ai0 ⊗ Im×mevi(t) + ∑n i=1 vˆi(t) α ∑ j∈Ni ai j ⊗ Im×m(exi(t)−ex j(t))+ai0 ⊗ Im×mexi(t) + ∑n i=1 vˆi(t) β ∑ j∈Ni ai j ⊗ Im×m(evi(t)−ev j(t))+ai0 ⊗ Im×mevi(t) 令 δ= max{inf{λmin(2αL¯)−1,(λmin(2βL¯)−2)−1},1} 又因为 −2g(xˆ(t), vˆ(t), ex(t), ev(t)) = −2 ∑N i=1 ( ˆxi(t)+vˆi(t))∑ j∈Ni ai j ⊗ Im×m[α(exi(t)−ex j(t))+ β(evi(t)−ev j(t))+ai0 ⊗ Im×m(αexi(t)+βevi(t))] ⩽ ∑N i=1 [(∥xˆi(t)∥ 2 +∥vˆi(t)∥ 2 )+ √ m· ∑ j∈Ni ai j[α(∥exi(t)∥ 2 + ex j(t) 2 )+ β(∥evi(t)∥ 2 + ev j(t) 2 )+ai0(α∥exi(t)∥ 2 +β∥evi(t)∥ 2 )]] 所以 V˙ (t) ⩽ ∑N i=1 [−δ(∥xˆi(t)∥ 2 +∥vˆi(t)∥ 2 )+(∥xˆi(t)∥ 2 +∥vˆi(t)∥ 2 )+ √ m· ∑ j∈Ni ai j[α(∥exi(t)∥ 2 + ex j(t) 2 )+ β(∥evi(t)∥ 2 + ev j(t) 2 )+ai0(α∥exi(t)∥ 2 +β∥evi(t)∥ 2 )]] 取 0 < θi < 1 ,使得: −θi(δ−1)(∥xˆi(t)∥ 2 +∥vˆi(t)∥ 2 )+ √ m· ∑ j∈Ni ai j[α(∥exi(t)∥ 2+ ex j(t) 2 )+β(∥evi(t)∥ 2 + ev j(t) 2 )+ai0(α∥exi(t)∥ 2+ β∥evi(t)∥ 2 )] ⩽ 0 f 所以将触发函数 i(t) 设计为如下形式: fi( ˆxi(t), vˆi(t), exi(t), ex j(t), evi(t), ev j(t)) = √ m· ∑ j∈Ni ai j[α(∥exi(t)∥ 2 + ex j(t) 2 )+ β(∥evi(t)∥ 2 + ev j(t) 2 )+ai0(α∥exi(t)∥ 2 +β∥evi(t)∥ 2 )]− θi(δ−1)(∥xˆi(t)∥ 2 +∥vˆi(t)∥ 2 ) i fi( ˆxi(t), vˆi(t), exi(t), ex j(t), evi(t), ev j(t)) ⩾ 0 k = 0,1,2,··· ,n 对于第 个跟随者自主体,如果有 ,那么第 个 条件触发,此时获取系统的位置和速度状态。 Lyapunov xˆi(t)|t=t0 vˆi(t)|t=t0 V˙ (t) ⩽ 0 lim t→∞ |xˆi(t)| = 0 lim t→∞ |vˆi(t)| = 0 lim t→∞ |xi(t)− x0(t)| = 0 lim t→∞ |vi(t)−v0(t)| = 0 由 稳定性理论可知,当事件触发条 件 式 ( 8 ) 满足时对于任意的初始位置状态 和速度状态 , ,二阶微分方程 式 (7) 的解都可以满足 , 那 么表明 , 。 因 此,根据定义 1 可以知道系统式 (1)、(2) 达成了领 导跟随一致性。 fi(t) < 0 于事件触发条件式 (8) 是分布式的,任意的两 个自主体的事件触发时刻可以是不相同的。如果 事件触发,系统提取自身及其邻居的状态 来更新控制器。 如果芝诺现象产生则认为我们设计的事件触 发函数是不可行的。为了证明系统在运行过程中 不会被触发无数次,下面计算任意两次事件触发 的最小间隔。 G¯ q τ0,τ1,··· ,τk ,τk+1 t q s+1 −t q s s = 0,1,··· , k τq τq 定理 2 考虑带有一个领导者的多自主体系 统式 (1)、(2),如果领导者作为图 中的一个全局 可达点,应用一致性协议式 (3) 和分布式事件触 发函数式 (7),则系统式 (1)、(2) 中的任意一个自 主体 ,得到的所有的触发时刻为 , 它的触发时刻的间隔 , ( )≥ , 为 τq = √ θq(δ−1)·sup{∥A∥,∥B∥} −1 √ α+β(∥Γ∥+∥HD∥)+ √ θq(δ−1) (9) Γ= diag{Γi} Γi D+ A i δ= max{inf{λmin(2αL¯)−1,(λmin(2βL¯)−2)−1}, 1} 0 < θi < 1 i = 1,2,··· ,N 式中: , 为矩阵 的第 行元素绝 对值的和; ; , 。 ∥e(t)∥ ∥ξ(t)∥ 证明 构造 的动态方程: d dt ( ∥e(t)∥ ∥ξ(t)∥ ) = d dt (e(t) T e(t)) 1 2 (ξ(t) T ξ(t)) 1 2 = e(t) T e˙(t) ∥ξ(t)∥ ∥e(t)∥ − ∥e(t)∥ξ(t) T ξ˙(t) ∥ξ(t)∥ 3 t ∈ [tk ,tk+1) e(t) = ξ(tk)+ξ(t) e˙(t) = 0− ξ˙(t) ξ˙(t) = Aξ(t)+ Be(t) φ(t) = ∥e(t)∥ ∥ξ(t)∥ φ˙(t) ⩽ (1+φ(t))2 ·sup{∥A∥,∥B∥}, φ(t) φ(t) ⩽ ϕ(t, ϕt0 ) ϕ(t, ϕt0 ) φ˙(t) ⩽ (1+φ(t))2 ·sup{∥A∥,∥B∥} ϕ(0, ϕt0 ) t ∈ [t q s ,t q s+1 ) dφ(t) = (1+φ(t))2 ·sup{∥A∥, ∥B∥})dt 当 时, ,所以 。又因为 ,令 ,可 以得到不等式: 如 果 满 足 ,当且仅当 是 , 的解。当 时,解微分方程 可得: ·994· 智 能 系 统 学 报 第 14 卷
第5期 刘远山,等:分布式事件触发多自主体领导跟随一致性研究 ·995· p(t0) sup(llAll,llBll)t-C:+1 本文考虑多自主体系统在二维平面内的运动 -sup(llAll,IIBIl)-t+C 的情况。根据在定理1中给出的限制条件,选取 当t=0时触发时间将取得最小值,代入式 =1.500,B=2.000,0,=0.01518∈(0,1),所以在a、B (10),C1=1。令T=diag{Cli=1,2,…,m),其中T 为矩阵D+A的第i行元素绝对值的行和。所以 给定的情况下6取1.5912。在仿真过程中时长 为20s,采样间隔为2.5×10-3s,共有8×103个采 outadbe.olP+le.oF+pxk.(oFk.o 样点。给出自主体的初始状态分别为: x1(6)=[06.002],x2(o)=[02.123], a(alle(+Blle(t))] ar.Br]e()+HDla.B]INxNe(t)s x3(to)=[012.915],x4(to)=[0.2040], xs(to)=[12.9780],x6(o)=[8.2930j。 Il[aT,Br]+HD[a,B⑧IwxN·le(t)l 按照给出的控制器来调控系统得到如图2和 令 图3所示的在两个方向上的位置和速度状态,可 9=argmax(l(2+H‖.(t)) 见多自主体系统逐渐达到一致。 则 waek.o+k.nfpk.o.te.of 40 30 Asent ★Agent Agent a(ael+Bl.()·(wlcol+legl)》'≤ 号20 10 llaT,βTr]+HD[a,]⑧Iwxw.lle(lr 5t) 8101214161820 因此 (a)位置状态 Va+B(IIIIl+HDID)(T.0)=0(6-1) 解得触发间隔的最小值为 Agent VO,(6-万·sup (Al,B- 0 T= -2 Va+BTI+IHD0+√O,6-ID 证毕。 68101214161820 s 3计算机仿真 b)速度状态 在这一部分,将利用计算机仿真来验证控制 图2横轴方向的位置和速度状态 算法和事件触发函数。仿真实验中共有6个 Fig.2 Position and speed states in the horizontal axis Follower和l个Leader.,该系统如图l所示的拓扑 Agen 结构,那么相应的Laplacian矩阵如下: 20 ★Agent 「1 0-10001 -Agent 01-1000 10 51 -1 -13 -10 0 L= 2 0 00 -1 -1 0 8101214161820 0 0 0 -10 (a)位置状态 0 000-1 领导跟随矩阵为 H=diag(1 00 11 0) (3(2)(1 -w)/A 8101214161820 (⑥)速度状态 图3纵轴方向的位置和速度状态 0 Fig.3 Position and speed states in the vertical axis 图1多自主体系统的拓扑图 表1分别给出了在分布式事件触发机制下, Fig.1 Topology of multi-agent systems 多自主体系统在20s内触发器的触发次数,由表
φ(t) ⩽ sup{∥A∥,∥B∥} · t−C1 +1 −sup{∥A∥,∥B∥} · t+C1 t = 0 C1 = 1 Γ = diag{Γi}(i = 1,2,··· ,n) Γi D+ A i 当 时触发时间将取得最小值,代入式 (10), 。令 ,其中 为矩阵 的第 行元素绝对值的行和。所以 ∑n i ∑ j∈Ni ai j[α( exi(t) 2 + ex j(t) 2 )+β( evi(t) 2 + ev j(t) 2 )+ ai0(α∥exi(t)∥ 2 +β∥evi(t)∥ 2 )] ⩽ [ αΓ, βΓ ] e(t)+ H D[α, β]⊗ IN×Ne(t) 2 ⩽ [ αΓ, βΓ ] + HD[α, β]⊗ IN×N 2 ·∥e(t)∥ 2 令 q = argmax i∈N (∥xˆi(t)∥ 2+∥vˆi(t)∥ 2 ) 则 N ∑ j∈Nq ai j[ α( exq(t) 2 + ex j(t) 2 )+β( evq(t) 2 + ev j(t) 2 )+ ai0(α exq(t) 2 +β evq(t) 2 ) ] ·(N( xˆq(t) 2 + vˆq(t) 2 ))−1 ⩽ [ αΓ, βΓ ] + HD[α, β]⊗ IN×N 2 ·∥e(t)∥ 2 ∥ξ(t)∥ 2 因此 √ α+β(∥Γ∥+∥H D∥)ϕ(τq,0) = √ θq(δ−1) 解得触发间隔的最小值为 τq = √ θq(δ−1)·sup{∥A∥,∥B∥} −1 √ α+β(∥Γ∥+∥HD∥)+ √ θq(δ−1) 证毕。 3 计算机仿真 Follower Leader Laplacian 在这一部分,将利用计算机仿真来验证控制 算法和事件触发函数。仿真实验中共 有 6 个 和 1 个 ,该系统如图 1 所示的拓扑 结构,那么相应的 矩阵如下: L = 1 0 −1 0 0 0 0 1 −1 0 0 0 −1 −1 3 −1 0 0 0 0 −1 2 −1 0 0 0 0 −1 0 −1 0 0 0 0 −1 1 领导跟随矩阵为 H= diag{1 0 0 1 1 0} 3 2 1 6 5 4 0 图 1 多自主体系统的拓扑图 Fig. 1 Topology of multi-agent systems α = 1.500 β= 2.000 θi = 0.015 18 ∈ (0,1) α β δ 2.5×10−3 8×103 本文考虑多自主体系统在二维平面内的运动 的情况。根据在定理 1 中给出的限制条件,选取 , , ,所以在 、 给定的情况下 取 1.591 2。在仿真过程中时长 为 20 s,采样间隔为 s,共有 个采 样点。给出自主体的初始状态分别为: x1(t0) = [0 6.002]T x2(t0) = [0 2.123]T , , x3(t0) = [0 12.915]T x4(t0) = [0.204 0]T , , x5(t0) = [12.978 0]T x6(t0) = [8.293 0]T , 。 按照给出的控制器来调控系统得到如图 2 和 图 3 所示的在两个方向上的位置和速度状态,可 见多自主体系统逐渐达到一致。 0 2 (a) 位置状态 (b) 速度状态 4 6 8 10 12 14 16 18 20 t/s 10 20 30 40 x/m Agent1 Agent2 Agent3 Agent4 Agent5 Agent6 0 2 4 6 8 10 12 14 16 18 20 t/s −6 −4 −2 0 2 4 v/(m·s−1 ) Agent1 Agent2 Agent3 Agent4 Agent5 Agent6 图 2 横轴方向的位置和速度状态 Fig. 2 Position and speed states in the horizontal axis 0 2 4 6 8 10 12 14 16 18 20 0 t/s 5 10 15 20 25 x/m Agent1 Agent2 Agent3 Agent4 Agent5 Agent6 (a) 位置状态 0 2 4 6 8 10 12 14 16 18 20 t/s −4 −2 0 2 4 v/(m·s−1 ) Agent1 Agent2 Agent3 Agent4 Agent5 Agent6 (b) 速度状态 图 3 纵轴方向的位置和速度状态 Fig. 3 Position and speed states in the vertical axis 表 1 分别给出了在分布式事件触发机制下, 多自主体系统在 20 s 内触发器的触发次数,由表 第 5 期 刘远山,等:分布式事件触发多自主体领导跟随一致性研究 ·995·