第12卷第6期 智能系统学报 Vol.12 No.6 2017年12月 CAAI Transactions on Intelligent Systems Dec.2017 D0:10.11992/tis.201702008 网络出版t地址:http:/kns.cnki.net/cms/detail/23.1538.TP.20171109.1243.002.html 基于二阶邻居事件触发多智能体系统的一致性 夏倩倩,刘开恩',纪志坚 (1.青岛大学数学与统计学院,山东青岛266071;2.青岛大学自动化与电气工程学院,山东青岛266071) 摘要:针对多智能体系统的平均一致性问题,采用二阶邻居信息设计一致性协议以加速一致性收敛速度。同时,为 了减少系统的通信次数,基于事件控制的方法被用于一致性协议的设计中。首先在固定拓扑网络下研究了多智能体 系统利用二阶邻居信息来加速一致性收敛速度的问题,随后在切换拓扑网络下对类似问题进行了分析。最后,把该 协议应用到数值仿真中,并与只利用一阶邻居信息的协议比较,仿真结果表明所设计的协议能够加快收敛速度。 关键词:一阶动力学方程:多智能体系统;一致性:事件触发;二阶邻居:李雅普诺夫函数:收敛速度;仿真 中图分类号:TP18文献标志码:A 文章编号:1673-4785(2017)06-0833-08 中文引用格式:夏倩倩,刘开恩,纪志坚.基于二阶邻居事件触发多智能体系统的一致性.智能系统学报,2017,12(6:833-840. 英文引用格式:XIA Qianqian,.LIU Kaien,,JI Zhijian..Event-.triggered consensus of multi--agent systems based on second-order neighborsJ.CAAI transactions on intelligent systems,2017,12(6):833-840. Event-triggered consensus of multi-agent systems based on second-order neighbors XIA Qianqian',LIU Kaien',JI Zhijian? (1.School of Mathematics and Statistics,Qingdao University,Qingdao 266071,China;2.School of Automation and Electrical Engin- eering,Qingdao University,Qingdao 266071,China) Abstract:Based on the second-order neighbors'information,consensus algorithm was proposed to accelerate the con- sensus convergence speed for the average consensus problem of multi-agent systems.Meanwhile,the event-based con- trol method was used in the design of consensus algorithm in order to reduce the number of communications in the sys- tems.Firstly,under a fixed topology network,we looked at speeding up the consensus convergence by getting the multi- agent systems to apply information to their second-order neighbors;then,similar problems were analyzed under a switching topology network;finally,the protocol was applied in a numerical simulation and was compared with a pro- tocol that applied information to only the first-order neighbors.The simulation results show that the proposed protocol can accelerate the convergence speed. Keywords:first-order dynamics equation;multi-agent systems;consensus;event-triggering;second-order neighbors; Lyapunov function;convergence rate;simulation 近几年,由于多智能体系统一致性问题在机器 的状态渐近达到一个共同的值。许多学者已经研究 人编队问题山、群集运动问题)等方面得到广泛应 了在拓扑网络、非线性、时滞等约束条件下,以一 阶、二阶或高阶动力学方程为模型的多智能体系统 用,这一问题成为了当前控制领域的研究重点。一 的一致性问题B刀。 致性控制就是设计一个一致性协议使得所有智能体 用基于事件触发控制代替时间触发控制具有十 收稿日期:2017-02-18.网络出版日期:2017-11-09. 基金项目:国家自然科学基金项目(61374062):山东省自然科学英 分重要的意义。通过与时间触发控制的比较发 才基金项目(ZR2015FM023):中国博士后科学基金面 上项目(2015M571995):青岛市博士后应用研究项目 现,基于事件触发控制在减少通信次数方面具有明 通信作者:刘开恩.E-mail:kaienliu@pku.edu.cn. 显的优点,在多数情况下,基于事件触发控制要优
DOI: 10.11992/tis.201702008 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20171109.1243.002.html 基于二阶邻居事件触发多智能体系统的一致性 夏倩倩1,刘开恩1,纪志坚2 (1. 青岛大学 数学与统计学院,山东 青岛 266071; 2. 青岛大学 自动化与电气工程学院,山东 青岛 266071) 摘 要:针对多智能体系统的平均一致性问题,采用二阶邻居信息设计一致性协议以加速一致性收敛速度。同时,为 了减少系统的通信次数,基于事件控制的方法被用于一致性协议的设计中。首先在固定拓扑网络下研究了多智能体 系统利用二阶邻居信息来加速一致性收敛速度的问题,随后在切换拓扑网络下对类似问题进行了分析。最后,把该 协议应用到数值仿真中,并与只利用一阶邻居信息的协议比较,仿真结果表明所设计的协议能够加快收敛速度。 关键词:一阶动力学方程;多智能体系统;一致性;事件触发;二阶邻居;李雅普诺夫函数;收敛速度;仿真 中图分类号:TP18 文献标志码:A 文章编号:1673−4785(2017)06−0833−08 中文引用格式:夏倩倩, 刘开恩, 纪志坚. 基于二阶邻居事件触发多智能体系统的一致性 [J]. 智能系统学报, 2017, 12(6): 833–840. 英文引用格式:XIA Qianqian, LIU Kaien, JI Zhijian. Event-triggered consensus of multi-agent systems based on second-order neighbors[J]. CAAI transactions on intelligent systems, 2017, 12(6): 833–840. Event-triggered consensus of multi-agent systems based on second-order neighbors XIA Qianqian1 ,LIU Kaien1 ,JI Zhijian2 (1. School of Mathematics and Statistics, Qingdao University, Qingdao 266071, China; 2. School of Automation and Electrical Engineering, Qingdao University, Qingdao 266071, China) Abstract: Based on the second-order neighbors' information, consensus algorithm was proposed to accelerate the consensus convergence speed for the average consensus problem of multi-agent systems. Meanwhile, the event-based control method was used in the design of consensus algorithm in order to reduce the number of communications in the systems. Firstly, under a fixed topology network, we looked at speeding up the consensus convergence by getting the multiagent systems to apply information to their second-order neighbors; then, similar problems were analyzed under a switching topology network; finally, the protocol was applied in a numerical simulation and was compared with a protocol that applied information to only the first-order neighbors. The simulation results show that the proposed protocol can accelerate the convergence speed. Keywords: first-order dynamics equation; multi-agent systems; consensus; event-triggering; second-order neighbors; Lyapunov function; convergence rate; simulation 近几年,由于多智能体系统一致性问题在机器 人编队问题[1] 、群集运动问题[2] 等方面得到广泛应 用,这一问题成为了当前控制领域的研究重点。一 致性控制就是设计一个一致性协议使得所有智能体 的状态渐近达到一个共同的值。许多学者已经研究 了在拓扑网络、非线性、时滞等约束条件下,以一 阶、二阶或高阶动力学方程为模型的多智能体系统 的一致性问题[3-7]。 用基于事件触发控制代替时间触发控制具有十 分重要的意义[8]。通过与时间触发控制的比较发 现,基于事件触发控制在减少通信次数方面具有明 显的优点,在多数情况下,基于事件触发控制要优 收稿日期:2017−02−18. 网络出版日期:2017−11−09. 基金项目:国家自然科学基金项目 (61374062); 山东省自然科学英 才基金项目 (ZR2015FM023); 中国博士后科学基金面 上项目 (2015M571995); 青岛市博士后应用研究项目 通信作者:刘开恩. E-mail:kaienliu@pku.edu.cn.. 第 12 卷第 6 期 智 能 系 统 学 报 Vol.12 No.6 2017 年 12 月 CAAI Transactions on Intelligent Systems Dec. 2017
·834· 智能系统学报 第12卷 于传统的时间触发控制。2013年,X.Y.Meng等o 2017年,王康等20为了研究一阶多智能体系统的一 在固定拓扑网络下针对特定事件设计了一致性协议 致性特点及能控、能观性保持策略,分析了具有时 来探索多智能体系统的一致性问题,随后又提出了 变拓扑结构的多智能体系统在一阶邻居和二阶邻居 在切换拓扑网络下的基于事件的一致性协议。 协议下的一致性速度,并且得出了系统在二阶邻居 2014年,王航飞等四将基于事件触发控制应用到了 议下具有更快的收敛速度的结论:2014年,H.Pan 环形编队问题中:2016年,K.Liu等山基于一致性 等证明了在二阶动力学方程下利用二阶邻居信 理论研究成果研究了一阶和二阶多智能体系统在有 息并不一定能够加速一致性速度,一致性速度还和 向图下基于事件的包容控制问题,基于一定的事 二阶邻居协议的参数有关系。 件,智能体决定何时传递状态给它的邻居,并且利 本文将针对一类一阶多智能体系统的一致性问 用这些采样状态设计了分布式协议,从而使得跟随 题展开研究,通过合理设计事件触发条件和一致性 者最终收敛到领导者所形成的凸包中;Y.Fan等] 协议得到事件触发时刻序列,并获得使系统达到一 对进行周期采样的多智能体系统设计了基于事件一 致性的条件。本文采用的是文献[10]中的研究模型。 致性协议,并且在此基础上设计了自触发一致性协 议来减少通信次数和采样次数;2017年,W.Zhu等 1准备知识 研究了二阶多智能体系统在离散时间情况下的基于 1.1代数图论 事件触发控制的一致性问题,通过自触发方式避免 令G=V,8,A}表示含有n个节点的无向图,其 了观察智能体及其邻居在所有离散时刻的状态;文 中V={,2,…,}表示节点的集合,8≤V×V表示 献[14]针对二阶多智能体系统提出了基于事件触 边的集合,若(wy)∈E,那么v:与y,称为是相邻 发控制的一致性协议,对固定有向拓扑网络下的系 的。N={y,y)∈8,j≠表示节点y的一阶邻居, 统一致性问题进行了分析;2013年,胡春健s) ={k∈N,jeN,k≠i,k≠j》表示节点y,的二阶邻 采用事件驱动控制方法,研究了一类一般线性多智 居。邻接矩阵A=[dinxn定义为:若(y,y)∈8,那么 能体系统的一致性问题,研究方法上不再要求拉普 a=1;否则a=0。由于在无向图G中,a=a, 拉斯矩阵具有对称性,并获得了一类线性多智能体 i≠j,所以A为对称阵。在无向图G中,度矩阵 系统达到一致的充分条件;2016年,D.P.Yang等6 D=diag(d,d2,…,dn)是一个对角阵,其中d,表示节 研究了一般线性多智能体系统在有向图中的基于事 点,的邻居集N,的势。矩阵L=D-A称为与图 件触发控制的一致性问题,基于状态反馈,采用分 G中一阶邻居信息对应的拉普拉斯矩阵。类似地可 布式事件触发一致性协议使得所有智能体都实现了 以定义二阶邻居信息对应的拉普拉斯矩阵。在无 一致性,不需要智能体之间进行连续通信;文 向图G中,L是对称的半正定矩阵,即L=LT≥0,因 献[17]研究了一般线性模型多智能体系统在基于 此它的特征值都是非负实数创,记为1≤2≤…≤ 事件触发情况下的采样数据一致性问题,分别设计 入。对于无向图G,如果两个节点y与y,之间存在一 了固定和切换拓扑情况下的分布式事件触发策略。 组边(,,),(,,)…,(),则称从节点v到y存 虽然利用一阶邻居信息研究多智能体系统的一 在长度为r的一条路。如果对于G中的任意两个 致性较为普遍,但由于系统的复杂性,为了提高系 顶点都有一条路,则称G为连通图。在连通图中, 统的收敛速率,许多学者开始利用二阶邻居信息对 1=0,2是最小的非零特征值,且1n=[11…1 多智能体系统的一致性问题进行研究。2010年, 为零特征值所对应的特征向量。在无向连通图中, D.Yuan等剧研究了一阶多智能体系统利用二阶邻 1L=0,其中0n=[00…0。 居信息来加速分布式平均一致性的问题,解决了在 1.2模型描述 离散和连续时间情况下的加速平均一致性问题,并 考虑具有n个智能体的多智能体系统,且该系 发现了利用二阶邻居信息要比只使用一阶邻居信息 统由无向图G=V,8,A描述,即每个智能体被描述 的协议收敛速度快;不同于Z.Liu等在2010年利 为图G中的节点,智能体之间的通信用节点间的连 用全局信息对多智能体系统的一致性进行研究的结 接来表示,每个智能体y∈V的状态遵循一阶动力学 果,文中只需要利用一阶和二阶邻居信息来研究一 方程: 阶多智能体系统的一致性问题,结合二阶邻居信息 (0)=(),i=1,2,…,n (1) 和事件触发条件,通过对一阶多智能体系统加速平 式中:x∈R表示第i个智能体的状态,4∈R表示第 均一致性问题的研究来提高网络收敛速度; i个智能体的控制输入,R表示全体实数集
于传统的时间触发控制[9]。2013 年,X.Y.Meng 等 [10] 在固定拓扑网络下针对特定事件设计了一致性协议 来探索多智能体系统的一致性问题,随后又提出了 在切换拓扑网络下的基于事件的一致性协议。 2014 年,王航飞等[1] 将基于事件触发控制应用到了 环形编队问题中;2016 年,K.Liu 等 [11] 基于一致性 理论研究成果研究了一阶和二阶多智能体系统在有 向图下基于事件的包容控制问题,基于一定的事 件,智能体决定何时传递状态给它的邻居,并且利 用这些采样状态设计了分布式协议,从而使得跟随 者最终收敛到领导者所形成的凸包中;Y.Fan 等 [12] 对进行周期采样的多智能体系统设计了基于事件一 致性协议,并且在此基础上设计了自触发一致性协 议来减少通信次数和采样次数;2017 年,W.Zhu 等 [13] 研究了二阶多智能体系统在离散时间情况下的基于 事件触发控制的一致性问题,通过自触发方式避免 了观察智能体及其邻居在所有离散时刻的状态;文 献 [14] 针对二阶多智能体系统提出了基于事件触 发控制的一致性协议,对固定有向拓扑网络下的系 统一致性问题进行了分析;2013 年,胡春健[ 1 5 ] 采用事件驱动控制方法,研究了一类一般线性多智 能体系统的一致性问题,研究方法上不再要求拉普 拉斯矩阵具有对称性,并获得了一类线性多智能体 系统达到一致的充分条件;2016 年,D.P.Yang 等 [16] 研究了一般线性多智能体系统在有向图中的基于事 件触发控制的一致性问题,基于状态反馈,采用分 布式事件触发一致性协议使得所有智能体都实现了 一致性,不需要智能体之间进行连续通信;文 献 [17] 研究了一般线性模型多智能体系统在基于 事件触发情况下的采样数据一致性问题,分别设计 了固定和切换拓扑情况下的分布式事件触发策略。 虽然利用一阶邻居信息研究多智能体系统的一 致性较为普遍,但由于系统的复杂性,为了提高系 统的收敛速率,许多学者开始利用二阶邻居信息对 多智能体系统的一致性问题进行研究。2010 年, D.Yuan 等 [18] 研究了一阶多智能体系统利用二阶邻 居信息来加速分布式平均一致性的问题,解决了在 离散和连续时间情况下的加速平均一致性问题,并 发现了利用二阶邻居信息要比只使用一阶邻居信息 的协议收敛速度快;不同于 Z.Liu 等 [19] 在 2010 年利 用全局信息对多智能体系统的一致性进行研究的结 果,文中只需要利用一阶和二阶邻居信息来研究一 阶多智能体系统的一致性问题,结合二阶邻居信息 和事件触发条件,通过对一阶多智能体系统加速平 均一致性问题的研究来提高网络收敛速度; 2017 年,王康等[20] 为了研究一阶多智能体系统的一 致性特点及能控、能观性保持策略,分析了具有时 变拓扑结构的多智能体系统在一阶邻居和二阶邻居 协议下的一致性速度,并且得出了系统在二阶邻居 协议下具有更快的收敛速度的结论;2014 年,H.Pan 等 [21] 证明了在二阶动力学方程下利用二阶邻居信 息并不一定能够加速一致性速度,一致性速度还和 二阶邻居协议的参数有关系。 本文将针对一类一阶多智能体系统的一致性问 题展开研究,通过合理设计事件触发条件和一致性 协议得到事件触发时刻序列,并获得使系统达到一 致性的条件。本文采用的是文献 [10] 中的研究模型。 1 准备知识 1.1 代数图论 G = {V,E, A} V = {v1, v2,··· , vn} E ⊆ V ×V (vi , vj) ∈ E Ni = {j|(vi , vj) ∈ E, j , i} N 2 i = {k|k ∈ Nj , j ∈ Ni , k , i, k , j} A = [ai j]n×n (vi , vj) ∈ E ai j = 1 ai j = 0 ai j = aji ∀i , j D = diag(d1,d2,··· ,dn) L = D− A L˜ L = L T ⩾ 0 λ1 ⩽ λ2 ⩽ ··· ⩽ λn vi0 vir (vi0 , vi1 ),(vi1 , vi2 ),··· ,(vir−1 , vir ) vi0 vir λ1 = 0 λ2 1n = [1 1 ··· 1]T 1 T n L = 0 T n 0n = [0 0 ··· 0]T 令 表示含有 n 个节点的无向图,其 中 表示节点的集合, 表示 边的集合,若 ,那么 vi 与 vj 称为是相邻 的。 表示节点 vi 的一阶邻居, 表示节点 vi 的二阶邻 居。邻接矩阵 定义为:若 ,那么 ;否则 。由于在无向图 G 中 , , ,所以 A 为对称阵。在无向图 G 中,度矩阵 是一个对角阵,其中 di 表示节 点 vi 的邻居集 Ni 的势。矩阵 称为与图 G 中一阶邻居信息对应的拉普拉斯矩阵。类似地可 以定义二阶邻居信息对应的拉普拉斯矩阵 。在无 向图 G 中,L 是对称的半正定矩阵,即 ,因 此它的特征值都是非负实数[ 3 ] ,记为 。对于无向图 G,如果两个节点 与 之间存在一 组边 ,则称从节点 到 存 在长度为 r 的一条路。如果对于 G 中的任意两个 顶点都有一条路,则称 G 为连通图。在连通图中, , 是最小的非零特征值,且 为零特征值所对应的特征向量。在无向连通图中, ,其中 。 1.2 模型描述 G = {V,E, A} vi ∈ V 考虑具有 n 个智能体的多智能体系统,且该系 统由无向图 描述,即每个智能体被描述 为图 G 中的节点,智能体之间的通信用节点间的连 接来表示,每个智能体 的状态遵循一阶动力学 方程: x˙i(t) = ui(t), i = 1,2,··· ,n (1) 式中:xi ∈ R 表示第 i 个智能体的状态,ui ∈ R 表示第 i 个智能体的控制输入,R 表示全体实数集。 ·834· 智 能 系 统 学 报 第 12 卷
第6期 夏倩倩,等:基于二阶邻居事件触发多智能体系统的一致性 ·835· 设智能体,的事件触发判定条件为 0=-(∑(x)-x心》+∑(x(-x(》= le,(+lh)l服≤σz(d+lh),1=1,2,·(2) kE好 式中:σ:>0,t表示第i个智能体的第r个事件触发 之G,+-xG+h 时刻,且是h的整数倍,h表示所有智能体的采样 高⑨-G+h)+∑)-+m- 周期。e(C+lh)=x(C)-x(C+h)表示智能体y,在最 ∑(xC+m-xC+m》- 近的一个事件触发时刻的状态与当前采样时刻的状 kEN 态的差值,而z(G+h)=∑(x(+h)-x(¢+h)+ A-++Aa-+- kEN 品化+-化+)表示在当前采样时刻,智能 及+-G+a-∑eC+ jeN 体y,的状态与其一阶邻居状态的差值以及智能体 e,+h》-∑x+)-xd+h) ”,的状态与其二阶邻居状态差值的和。 keNp 在每个采样时刻,每个智能体都传递自己的状 eG+m-e+》 态信息给它的一阶邻居和二阶邻居并且也接收来自 (4) 它一阶邻居和二阶邻居的状态信息用于事件检测。 式中:=max{t∈{,r=0,l,…,t≤+hl,=max 如果条件(2)满足,那么智能体v:不需要更新自己 ∈{,r=0,1,…h,t≤t+h,注意此处I的取值可以 的控制输入;否则,y将更新它自己的控制输人并且 是0,1,2,…直到下一事件发生。 通知它的一阶邻居和二阶邻居利用y,当前的状态 由式(4)可得,当t∈[rh,+1)h)时,有 信息来更新它们的控制输入,同时将误差e,(:+lh)置 (t)=-(L+L)x(rh)-(L+L)e(rh) (5) 于零,这时就满足了条件(2)。也即y,的事件触发 式中:x=[x12…xJ,e=[ee2…enJa 时刻为 在无向连通图中,由于L的非对角线元素不大 于零,主对角线元素大于等于零且行和为零,L具有 =t+hinf(l:lle:(t,+h>lt,+h) 相同的性质,容易得到L+具有同样的性质,所以 式中:6=0是初始时刻。很明显,所有测量x()是采 L+L仍为拉普拉斯矩阵。 样状态x)的一个子序列。也就是说,事件触发时 引理1对于半正定对称矩阵AeR,Ya,b∈ 刻{6,,…}s{0,h,2h,…。这意味着事件内部时刻 R",有 化-,r=0,1,…至少是以所有智能体采样时刻 2a'Ab1≤a'Aa+bTAb h为下界。 证明由于A是对称矩阵,所以存在正交矩阵 为了减少符号的复杂程度,定义 U,使得UAUr=A,其中A=diag(d1,2,…,dn),且 (0兰x(,t≤t<t d≥0,i=1,2…,n。记a=Ua,则 即通过在下一个事件出现之前都保持状态不变将离 aT Aa=aUUAUUa=aAa=Aaj+...+a 散时间信号x:(心)转换成分段连续时间信号()。 记B=Ub,则 根据定义的符号,考虑利用二阶邻居信息构 BAb=bUUAU'Ub =BAB=AB+...+B 造一致性协议,由此给出下面的基于事件一致性 由于2β别≤a+,i=1,2,…,n,那么 协议: aAa+bAb=aAa+BAB= a+…+na2+6+…+入S= 4,0=-((,0-,0》+((0-(0》 (3) 1(a+附)+…+(a+β)≥ 2laBl+..+AlB.l)=2laTABI 2固定拓扑网络下的一致性研究 2la UAUbl=2laTAbl 考虑系统的平均状态: 暂且假设系统具有固定拓扑网络结构,由协议 (3)式得到智能体,的闭环系统为 )=- n 0=-(∑(优0-)+∑((0-4》 在无向连通图中,(L+)=0,根据协议(3)式 jEN kEN 根据前面定义的e(t+lh)可以得到在t∈[心+h, 得到=20=0=u+i0=0,其 n1 :+h+h)这一时间段内的智能体v,的动力学方程 中0=[t(02(0…元()]P。 如下: 因此,它是时不变的。定义非一致性向量
设智能体 vi 的事件触发判定条件为 ||ei(t i r +lh)||2 2 ⩽ σi ||zi(t i r +lh)||2 2 , l = 1,2,··· (2) σi > 0 t i r t i r ei(t i r +lh) = xi(t i r )− xi(t i r +lh) zi(t i r +lh) = ∑ j∈Ni (xi(t i r +lh)− xj(t i r +lh))+ ∑ k∈N 2 i (xi(t i r +lh)− xk(t i r +lh)) 式中: , 表示第 i 个智能体的第 r 个事件触发 时刻,且 是 h 的整数倍,h 表示所有智能体的采样 周期。 表示智能体 vi 在最 近的一个事件触发时刻的状态与当前采样时刻的状 态的差值,而 表示在当前采样时刻,智能 体 vi 的状态与其一阶邻居状态的差值以及智能体 vi 的状态与其二阶邻居状态差值的和。 ei(t i r +lh) 在每个采样时刻,每个智能体都传递自己的状 态信息给它的一阶邻居和二阶邻居并且也接收来自 它一阶邻居和二阶邻居的状态信息用于事件检测。 如果条件 (2) 满足,那么智能体 vi 不需要更新自己 的控制输入;否则,vi 将更新它自己的控制输入并且 通知它的一阶邻居和二阶邻居利用 vi 当前的状态 信息来更新它们的控制输入,同时将误差 置 于零,这时就满足了条件 (2)。也即 vi 的事件触发 时刻为 t i r+1 = t i r +hinf{l : ||ei(t i r +lh)||2 2 > σi ||zi(t i r +lh)||2 2 } t i 0 = 0 xi(t i r ) xi(rh) {t i 0 ,t i 1 ,··· } ⊆ {0,h,2h,··· } {t i r+1 −t i r ,r = 0,1,··· } 式中: 是初始时刻。很明显,所有测量 是采 样状态 的一个子序列。也就是说,事件触发时 刻 。这意味着事件内部时刻 至少是以所有智能体采样时刻 h 为下界。 为了减少符号的复杂程度,定义 xˆi(t) ∆ = xi(t i r ), t i r ⩽ t < t i r+1 xi(t i r ) xˆi(t) 即通过在下一个事件出现之前都保持状态不变将离 散时间信号 转换成分段连续时间信号 。 根据定义的符号,考虑利用二阶邻居信息构 造一致性协议,由此给出下面的基于事件一致性 协议: ui(t) = −( ∑ j∈Ni ( ˆxi(t)− xˆj(t))+ ∑ k∈N2 i ( ˆxi(t)− xˆk(t))) (3) 2 固定拓扑网络下的一致性研究 暂且假设系统具有固定拓扑网络结构,由协议 (3) 式得到智能体 vi 的闭环系统为 x˙i(t) = −( ∑ j∈Ni ( ˆxi(t)− xˆj(t))+ ∑ k∈N2 i ( ˆxi(t)− xˆk(t))) e(t i r +lh) t ∈ [t i r +lh, t i r +lh+h) 根据前面定义的 可以得到在 这一时间段内的智能体 vi 的动力学方程 如下: x˙i(t) = −( ∑ j∈Ni (xi(t i r )− xj(t j r ′ ))+ ∑ k∈N2 i (xi(t i r )− xk(t k r ′′ ))) = − ∑ j∈Ni (xi(t i r +lh)− xj(t i r +lh))− ∑ j∈Ni (xi(t i r )− xi(t i r +lh))+ ∑ j∈Ni (xj(t j r ′ )− xj(t i r +lh))− ∑ k∈N2 i (xi(t i r +lh)− xk(t i r +lh))− ∑ k∈N2 i (xi(t i r )− xi(t i r +lh))+ ∑ k∈N2 i (xk(t k r ′′ )− xk(t i r +lh)) = − ∑ j∈Ni (xi(t i r +lh)− xj(t i r +lh))− ∑ j∈Ni (ei(t i r +lh)− ej(t i r +lh))− ∑ k∈N2 i (xi(t i r +lh)− xk(t i r +lh))− ∑ k∈N2 i (ei(t i r +lh)−ek(t i r +lh)) (4) t j r ′ = max{t|t ∈ {t j r ,r = 0,1,··· },t ⩽ t i r +lh} t k r ′′ = max {t|t ∈ {t k r ,r = 0,1,··· },t ⩽ t i r +lh} 0,1,2,··· 式中: , ,注意此处 l 的取值可以 是 直到下一事件发生。 由式 (4) 可得,当 t ∈ [rh,(r +1)h) 时,有 x˙(t) = −(L+ L˜)x(rh)−(L+ L˜)e(rh) (5) x = [x1 x2 ··· xn] T e = [e1 e2 ··· en] 式中: T , 。 L˜ L+ L˜ L+ L˜ 在无向连通图中,由于 L 的非对角线元素不大 于零,主对角线元素大于等于零且行和为零, 具有 相同的性质,容易得到 具有同样的性质,所以 仍为拉普拉斯矩阵。 A ∈ R n×n ∀a, b ∈ R n 引理 1 对于半正定对称矩阵 , ,有 |2a TAb| ⩽ a TAa+ b TAb UAUT = Λ Λ = diag(λ1, λ2,··· , λn) λi ⩾ 0,i = 1,2,··· ,n α = Ua 证明 由于 A 是对称矩阵,所以存在正交矩阵 U ,使得 ,其中 , 且 。记 ,则 a TAa = a TU TUAUTUa = α TΛα = λ1α 2 1 +···+λnα 2 n 记 β = Ub ,则 b TAb = b TU TUAUTUb = β TΛβ = λ1β 2 1 +···+λnβ 2 n |2αiβi | ⩽ α 2 i +β 2 i 由于 ,i = 1,2,··· ,n,那么 a TAa+ b TAb = α TΛα+β TΛβ = λ1α 2 1 +···+λnα 2 n +λ1β 2 1 +···+λnβ 2 n = λ1(α 2 1 +β 2 1 )+···+λn(α 2 n +β 2 n ) ⩾ 2(λ1 |α1β1 |+···+λn |αnβn |) = 2|α TΛβ| = 2|a TU TΛUb| = 2|a TAb| 考虑系统的平均状态: x¯(t) = 1 n ∑n i=1 xi(t) 1 T n (L+ L˜) = 0 T n x˙¯ = 1 n ∑n i=1 x˙i(t) = 1 n 1 T n x˙(t) = − 1 n 1 T n (L+ L˜)xˆ(t) ≡ 0 xˆ(t) =[ ˆx1(t) ˆx2(t) ··· xˆn(t)]T 在无向连通图中, ,根据协议 (3) 式 得到 ,其 中 。 因此,x¯(t) 它是时不变的。定义非一致性向量 第 6 期 夏倩倩,等:基于二阶邻居事件触发多智能体系统的一致性 ·835·
·836· 智能系统学报 第12卷 6(t)=x(t)-t)l.=x(t)-1: 考虑李雅普诺夫函数 ha.e(rk)(L.+Lxe(rk)-(2h-)x(rh)L+ V()=() (6) L)x(rh)+(2h-)e'(rh)(L+L)e(rh) 即状态的平方和的1/2。 结合事件触发条件(2)得到 引理2(Lasalle不变原理)设C是有界闭集, 从C内出发的系统票=f的解uoCC,若存 o≤2l.-多ruhL+Lrh+ 1 在V:C一R,具有连续一阶偏导数,满足业。 (2hA-(rh)(L+L)e(rh)= ds0。 又设E=d d=0.reC,McE是最大不变集,则当 h.-+2h-j)o.(hL+Lr(rh 当式(8)成立时,有()≤0。 t→oo时,有x(t,o,o)→M。 由于G为连通图,E={x∈R(0=0}=span(ln, 定理1设系统(1)具有连通通信拓扑,采用协 议(3)的系统(1)在事件触发条件(2)的驱动下,若 由Lasalle不变原理可知所有智能体一致收敛。 条件 采样周期h和σ,i=1,2,…,n的选取需要拓扑 1 1 的全局信息人。根据圆盘定理221及d≤(n-1), 0<h≤2元0<om< (7) 最大特征值n的上界可根据n≤2dmax≤2(n-1)确 或者 定。因此,由式()可知,如果每个智能体都知道整 1 4玩,0<oas月 3 3-4han 个系统的个体数量n,那么采样周期h和σ,可以根 2元sh (4hd.-1) (8) 据下式选择: 成立,其中σmx=max{c,i=1,2,…,,则所有智能 1 1 体的状态都渐近收敛到它们的初始状态平均值。 0<0m<40m-0<h< 4n-1) 证明考虑函数(6)式在t∈h,(r+1)h)时间段 可以通过一个公共标量a,0<α<1,来缩放采样周 内沿(4)生成轨线的时间演变,得到 1 期的最大值保证0<h<4m-9 、成立,即每个智能体 V(t)=xT(t)(t)=-xT(t)(L+L)(x(rh)+e(rh))= ,a、作为它的采样周期。同时注意h., (t-rh)(x(rh)+e(rh))(L+L)(x(rh)+e(rh))- 都选择h=4m- c,i=1,2,…,n只有上限,即h,σ,可以足够小,且σ xT(rh)(L+L)(x(rh)+e(rh))<-x"(rh)(L+ 越小将会使控制更新的频率越高,系统收敛速度越 L(x(rh)+e(rh))+ha(x(rh)+e(rh))(L+ 快,所以在某种意义上,这是一个在性能和控制更 L)(x(rh)+e(rh))=-(1-hAa)x"(rh)(L+L)x(rh)- 新频率之间的取舍问题。 x(rh)(L+Le(rh)+hae(rh(L+L)e(rh)+ 2hAx"(rh)(L+L)e(rh)=-(1-ha)x"(rh)(L+ 3切换拓扑网络下的一致性研究 L)x(rh)+(2hA,-1)xT(rh)(L+L)e(rh)+ 在这部分中,将固定拓扑网络下的研究结果扩 hae"(rh)(L+L)e(rh) 展到了G在连通图之间切换的情况,假定所有可能 应用引理1,当2hdn-1≤0时,有 的连通图构成有限集G,G2,…,Gm},定义下标集 V(t)<-(1-ha)xT(rh)(L+L)x(rh)+(1-2hA) J={1,2,…,m,引人一个分段常数切换信号s0):[0,+o) ((LIh+(r+beh) →J来描述1时刻系统具有的拓扑结构,G表示在 1 采样触发时刻h时的活动拓扑,(亿+L)表示其对 hA.e"(rh)(L+L)e(rh)=-x(rh)(L+L)x(rh)+ 应的由一阶和二阶邻居所确定的拉普拉斯矩阵。 (rL.+be(ck) 在切换拓扑情况下,根据(2)式和(3)式类似地 结合事件触发条件(2)得到 定义事件触发条件和基于事件的一致性协议。在切 换拓扑情形下,李雅普诺夫函数不变,仍是 0≤-uhL+Lxh+号om L+L)()-(1-)(h(L+Lx(rh) V0=2r'0r0 定理2设系统(1)式的通信拓扑网络在有限 当式(⑦)成立时,有0≤0。 个连通图之间进行切换,采用协议(3)式的系统 当2hL.-1>0时,有 (1)式在事件触发条件(2)式的驱动下,若满足下列 V(t)<-(1-ha)x"(rh)(L+L)x(rh)+(2ha-1) 条件 (x(h(L+Lx(rh)+(L+Le(rh)y 2元0<om< 1 1 0<h
δ(t) = x(t)− x¯(t)1n = x(t)− x¯1n 考虑李雅普诺夫函数 V(t) = 1 2 x T (t)x(t) (6) 即状态的平方和的 1/2。 dx dt = f(x) x(t,t0, x0) ⊂ C V(x) : C → R dV dt ⩽ 0 E = {x| dV dt = 0, x ∈ C} M ⊂ E t → ∞ x(t,t0, x0) → M 引理 2 (Lasalle 不变原理) 设 C 是有界闭集, 从 C 内出发的系统 的解 ,若存 在 ,具有连续一阶偏导数,满足 。 又设 , 是最大不变集,则当 时,有 。 定理 1 设系统 (1) 具有连通通信拓扑,采用协 议 (3) 的系统 (1) 在事件触发条件 (2) 的驱动下,若 条件 0 < h ⩽ 1 2λn ,0 < σmax < 1 λ 2 n (7) 或者 1 2λn < h < 3 4λn , 0 < σmax < 3−4hλn (4hλn −1)λ 2 n (8) σmax = max{σi 成立,其中 ,i = 1,2,··· ,n} ,则所有智能 体的状态都渐近收敛到它们的初始状态平均值。 证明 考虑函数 (6) 式在 t ∈ [rh,(r +1)h) 时间段 内沿 (4) 生成轨线的时间演变,得到 V˙ (t) = x T (t)x˙(t) = −x T (t)(L+ L˜)(x(rh)+e(rh)) = (t−rh)(x(rh)+e(rh))T (L+ L˜) 2 (x(rh)+e(rh))− x T (rh)(L+ L˜)(x(rh)+e(rh)) ⩽ −x T (rh)(L+ L˜)(x(rh)+e(rh))+hλn(x(rh)+e(rh))T (L+ L˜)(x(rh)+e(rh)) = −(1−hλn)x T (rh)(L+ L˜)x(rh)− x T (rh)(L+ L˜)e(rh)+hλne T (rh)(L+ L˜)e(rh)+ 2hλn x T (rh)(L+ L˜)e(rh) = −(1−hλn)x T (rh)(L+ L˜)x(rh)+(2hλn −1)x T (rh)(L+ L˜)e(rh)+ hλne T (rh)(L+ L˜)e(rh) 应用引理 1,当 2hλn −1 ⩽ 0 时,有 V˙ (t) ⩽ −(1−hλn)x T (rh)(L+ L˜)x(rh)+(1−2hλn) ( 1 2 x T (rh)(L+ L˜)x(rh)+ 1 2 e T (rh)(L+ L˜)e(rh))+ hλne T (rh)(L+ L˜)e(rh) = − 1 2 x T (rh)(L+ L˜)x(rh)+ 1 2 e T (rh)(L+ L˜)e(rh) 结合事件触发条件 (2) 得到 V˙ (t) ⩽ − 1 2 x T (rh)(L+ L˜)x(rh)+ 1 2 λ 2 nσmax x T (rh) (L+ L˜)x(rh) = − 1 2 (1−λ 2 nσmax)x T (rh)(L+ L˜)x(rh) V˙ 当式 (7) 成立时,有 (t) ⩽ 0。 当 2hλn −1 > 0 时,有 V˙ (t) ⩽ −(1−hλn)x T (rh)(L+ L˜)x(rh)+(2hλn −1) ( 1 2 x T (rh)(L+ L˜)x(rh)+ 1 2 e T (rh)(L+ L˜)e(rh))+ hλne T (rh)(L+ L˜)e(rh) = (2hλn − 3 2 )x T (rh)(L+ L˜)x(rh)+(2hλn − 1 2 )e T (rh)(L+ L˜)e(rh) 结合事件触发条件 (2) 得到 V˙ (t) ⩽ (2hλn − 3 2 )x T (rh)(L+ L˜)x(rh)+ (2hλn − 1 2 )λ 2 nσmaxx T (rh)(L+ L˜)e(rh) = (2hλn − 3 2 +(2hλn − 1 2 )λ 2 nσmax)x T (rh)(L+ L˜)x(rh) V˙ 当式 (8) 成立时,有 (t) ⩽ 0。 E = {x ∈ R n |V˙ 由于 G 为连通图, (t) = 0} = span{1n}, 由 Lasalle 不变原理可知所有智能体一致收敛。 σi i = 1,2,··· ,n λn dmax ⩽ (n−1) λn λn ⩽ 2dmax ⩽ 2(n−1) σi 采样周期 h 和 , 的选取需要拓扑 的全局信息 。根据圆盘定理[ 2 2 ] 及 , 最大特征值 的上界可根据 确 定。因此,由式 (7) 可知,如果每个智能体都知道整 个系统的个体数量 n,那么采样周期 h 和 可以根 据下式选择: 0 < σmax < 1 4(n−1)2 , 0 < h < 1 4(n−1) 0 < α < 1 0 < h < 1 4(n−1) h = α 4(n−1) σi i = 1,2,··· ,n σi σi 可以通过一个公共标量 α, ,来缩放采样周 期的最大值保证 成立,即每个智能体 都选择 作为它的采样周期。同时注意 h, , 只有上限,即 h, 可以足够小,且 越小将会使控制更新的频率越高,系统收敛速度越 快,所以在某种意义上,这是一个在性能和控制更 新频率之间的取舍问题。 3 切换拓扑网络下的一致性研究 {G1,G2,··· ,Gm} J = {1,2,··· ,m} s(t) : [0,+∞) → J Gs(rh) (L+ L˜)s(rh) 在这部分中,将固定拓扑网络下的研究结果扩 展到了 G 在连通图之间切换的情况,假定所有可能 的连通图构成有限集 ,定义下标集 ,引入一个分段常数切换信号 来描述 t 时刻系统具有的拓扑结构, 表示在 采样触发时刻 rh 时的活动拓扑, 表示其对 应的由一阶和二阶邻居所确定的拉普拉斯矩阵。 在切换拓扑情况下,根据 (2) 式和 (3) 式类似地 定义事件触发条件和基于事件的一致性协议。在切 换拓扑情形下,李雅普诺夫函数不变,仍是 V(t) = 1 2 x T (t)x(t) 定理 2 设系统 (1) 式的通信拓扑网络在有限 个连通图之间进行切换,采用协议 (3) 式的系统 (1) 式在事件触发条件 (2) 式的驱动下,若满足下列 条件 0 < h ⩽ 1 2λmax , 0 < σmax < 1 λ 2 max ·836· 智 能 系 统 学 报 第 12 卷
第6期 夏倩倩,等:基于二阶邻居事件触发多智能体系统的一致性 ·837· 或者 图1所示的通信拓扑图中利用事件触发条件(2),在 1 3-4hAmax t∈[0,10]进行仿真。 2入ma 30<mas(4hAmas -1) <h< 其中mar=max{n(G,G∈{G1,…,Gnh,dn(G)是拉普 拉斯矩阵(L+L)(G)的最大特征值,那么所有智能体 的状态都渐近收敛到它们的初始状态平均值。 证明类似于定理1的证明过程得到李雅普诺 夫函数在区间[rh,(r+1)h)内的导数为 图1通信拓扑图 V(t)=-x"(t)(L+L)s(x(rh)+e(rh)) Fig.1 Communication topology 1 1 图2是所有智能体在基于事件一致性协议(3) 0<h≤G'G)或3 1 下的状态演变,从图2可以看出系统达到了一致, 2几.Gh)<h< .G且 所有智能体的状态趋于一个共同的值。 3-4h入.(Gh】 0.6 0<cam<(4hL.G)-1)gG】 0.4 -x3(0 那么类似于固定拓扑情况,有0-1-(G) 0.2 1(0 0 omax)x'(rh(L+irhx(rh),或者V(0≤(2hLn(Gh) 3 装-02个50 1. +(2hl,Gaua)-i。 -0.4x4(0 -0.6 (G)max)x(rh)(L+L)x(rh) 式中:.(Gh)是拉普拉斯矩阵(L+i)的最大特 -0.8 012345678910 征值。 因为系统在有限个连通图之间切换,可得集合 图2智能体的状态 E={x∈R()=O}=span(1n,根据Lasalle不变原 Fig.2 States of the agents 理得到所有智能体的状态都渐近收敛到它们的初始 图3是所有智能体在基于事件一致性协议(3) 状态平均值。 下的非一致向量x(0-1的演变过程,从图3 通过与文献[10]的比较发现:即使多智能体系 可以看出所有智能体的状态都趋于它们的初始状态 统(1)只采用一阶邻居信息用于研究系统的一致性 平均值。 收敛问题,与文献[10]的采样周期0<h≤2 1 1.0 0.9 相比,本文所提出的采样周期的选取范围也比文献 0.8 0 [10]中的采样周期选取范围更大。 4仿真 点04 0.3 在理论分析的基础上,本部分将通过仿真实验 0.2 0.1 对所得出的理论结果进行验证。 0 1 2345678910 考虑由4个智能体组成的多智能体系统,为了 s 便于比较,采用与文献[10]相同的通信拓扑和参 图3非一致向量范数 数。图1是无向连通图,其利用二阶邻居信息所得 Fig.3 Norm of the disagreement vector 的拉普拉斯矩阵为 图4是所有智能体在基于事件一致性协议(3) 下的控制输入的仿真结果,最终所有智能体的控制 -1 L+L= -1 -1 输人都趋于0。 -1 -1-1 图5是所有智能体在基于事件一致性协议(3) 拉普拉斯矩阵的最大特征值n=4,取智能体的 下的事件触发时刻,说明只在特定时刻对智能体施 事件检测器的参数为σ1=σ2=0.033,3=0.02,σ4= 加控制输入系统就能实现一致性。 0.06,所有智能体的采样周期为h=0.002,其中所取 图6和图7分别是文献[7)中所有智能体利用 数值满足σmx<0.0625,h≤0.125。智能体初始状态 一阶邻居信息在基于事件一致性协议下的状态和非 为x(0)=[0.4773-0.33920.5-0.6381F。接下来在 一致向量x(0-1.的演变过程
或者 1 2λmax < h < 3 4λmax , 0 < σmax < 3−4hλmax (4hλmax −1)λ 2 max , λmax = max{λn(G),G ∈ {G1,··· ,Gm}} λn(G) (L+ L˜)(G) 其中 , 是拉普 拉斯矩阵 的最大特征值,那么所有智能体 的状态都渐近收敛到它们的初始状态平均值。 [rh,(r +1)h) 证明 类似于定理 1 的证明过程得到李雅普诺 夫函数在区间 内的导数为 V˙ (t) = −x T (t)(L+ L˜)s(rh)(x(rh)+e(rh)) 0 < h ⩽ 1 2λn(Gs(rh)) 0 < σmax < 1 λ 2 n (Gs(rh)) 1 2λn(Gs(rh)) < h < 3 4λn(Gs(rh)) 若 ,且 ,或者 ,且 0 < σmax < 3−4hλn(Gs(rh)) (4hλn(Gs(rh))−1)λ 2 n (Gs(rh)) V˙ (t)− 1 2 (1−λ 2 n (Gs(rh)) σmax)x T (rh)(L+ L˜)s(rh)x(rh), V˙ (t) ⩽ (2hλn(Gs(rh))− 3 2 +(2hλn(Gs(rh))− 1 2 ) 那么类似于固定拓扑情况,有 或 者 。 λ 2 n (Gs(rh))σmax)x T (rh)(L+ L˜)s(rh)x(rh) λn(Gs(rh)) (L+ L˜ 式中: 是拉普拉斯矩阵 )s(rh) 的最大特 征值。 E = {x ∈ R n |V˙ (t) = 0} = span{1n} 因为系统在有限个连通图之间切换,可得集合 ,根据 Lasalle 不变原 理得到所有智能体的状态都渐近收敛到它们的初始 状态平均值。 0 < h ⩽ 1 2λmax 通过与文献 [10] 的比较发现:即使多智能体系 统 (1) 只采用一阶邻居信息用于研究系统的一致性 收敛问题,与文献 [ 1 0 ] 的采样周期 相比,本文所提出的采样周期的选取范围也比文献 [10] 中的采样周期选取范围更大。 4 仿真 在理论分析的基础上,本部分将通过仿真实验 对所得出的理论结果进行验证。 考虑由 4 个智能体组成的多智能体系统,为了 便于比较,采用与文献 [10] 相同的通信拓扑和参 数。图 1 是无向连通图,其利用二阶邻居信息所得 的拉普拉斯矩阵为 L+ L˜ = 3 −1 −1 −1 −1 3 −1 −1 −1 −1 3 −1 −1 −1 −1 3 λn = 4 σ1 = σ2 = 0.033 σ3 = 0.02 σ4 = h = 0.002 σmax < 0.0625 h ⩽ 0.125 x(0) = [0.4773 −0.3392 0.5 −0.6381]T 拉普拉斯矩阵的最大特征值 ,取智能体的 事件检测器的参数为 , , 0.06,所有智能体的采样周期为 ,其中所取 数值满足 , 。智能体初始状态 为 。接下来在 t ∈ [0,10] 图 1 所示的通信拓扑图中利用事件触发条件 (2),在 进行仿真。 图 2 是所有智能体在基于事件一致性协议 (3) 下的状态演变,从图 2 可以看出系统达到了一致, 所有智能体的状态趋于一个共同的值。 ||x(t)− x¯1n|| 图 3 是所有智能体在基于事件一致性协议 (3) 下的非一致向量 的演变过程,从图 3 可以看出所有智能体的状态都趋于它们的初始状态 平均值。 图 4 是所有智能体在基于事件一致性协议 (3) 下的控制输入的仿真结果,最终所有智能体的控制 输入都趋于 0。 图 5 是所有智能体在基于事件一致性协议 (3) 下的事件触发时刻,说明只在特定时刻对智能体施 加控制输入系统就能实现一致性。 ||x(t)− x¯1n|| 图 6 和图 7 分别是文献 [7] 中所有智能体利用 一阶邻居信息在基于事件一致性协议下的状态和非 一致向量 的演变过程。 1 2 3 4 图 1 通信拓扑图 Fig. 1 Communication topology 0.6 0.4 0.2 0 −0.2 −0.4 −0.6 −0.8 ⟢ᔭ x3 (t) x1 (t) x2 (t) x4 (t) 0 1 2 3 4 5 6 7 8 9 10 t/s 图 2 智能体的状态 Fig. 2 States of the agents 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 1 2 3 4 5 6 7 8 9 10 t/s ||x (t)−x1n|| − 图 3 非一致向量范数 Fig. 3 Norm of the disagreement vector 第 6 期 夏倩倩,等:基于二阶邻居事件触发多智能体系统的一致性 ·837·