第14卷第1期 智能系统学报 Vol.14 No.1 2019年1月 CAAI Transactions on Intelligent Systems Jan.2019 D0:10.11992/tis.201801038 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20180608.1320.004html 多移动机器人协同搬运技术综述 顾大强,郑文钢 (浙江大学机械工程学院.浙江杭州310027) 摘要:多移动机器人协同搬运系统是多移动机器人系统的典型应用,在一些特殊场合中具有较强的应用潜 力。对此,本文综述了多移动机器人协同搬运的相关技术,总结了国内外的发展状况。针对不同的搬运对象, 分析比较了抓取、推拉、锁定3种搬运方案,重点分析了不同搬运方案下的多移动机器人协同搬运策略算法原 理以及各自的优缺点:概述了多移动机器人搬运系统中涉及的周边技术,主要包括多移动机器人任务分配、环 境感知定位、轨迹规划3个方面:最后对多移动机器人协同搬运技术的研究方向进行了展望。 关键词:多智能体系统:机器人搬运:群体智能:非线性控制系统:协同通信:运动规划:导航技术:避障技术 中图分类号:TP242.6文献标志码:A文章编号:1673-4785(2019)01-0020-08 中文引用格式:顾大强,郑文钢.多移动机器人协同搬运技术综述.智能系统学报,2019,14(1):20-27. 英文引用格式:GU Daqiang,ZHENG Wengang.Technologies for cooperative transportation by multiple mobile robots J.CAAl transactions on intelligent systems,2019,14(1):20-27. Technologies for cooperative transportation by multiple mobile robots GU Daqiang,ZHENG Wengang (School of Mechanical Engineering,Zhejiang University,Hangzhou 310027,China) Abstract:Cooperative transportation by multiple mobile robots is a typical application of the multi-robot system,and has strong application potential,especially in specific circumstances.In this review,we summarize the range of cooper- ative transportation technologies and discuss related research progress in China and abroad.With respect to different transportation objectives,we compare three handling schemes,including grab,push,and closure.We then analyze the algorithm principles and respective advantages and disadvantages of each scheme.We introduce the peripheral technolo- gies used in multi-robot transportation systems,including task allocation,environmental perception and location,and motion planning by multiple mobile robots.Finally,we present an overview of the development trend in cooperative transportation technology. Keywords:multi-agent systems;robotics transportation;swarm intelligence;nonlinear control systems;cooperative communication;motion planning;navigation;collision avoidance technology 多移动机器人的研究始于20世纪80年代后 完成的任务复杂性更高;多移动机器人系统能够 期,当时的研究领域主要集中在多移动机器人重 胜任分布式任务;多个简单的移动机器人系统比 构、轨迹规划以及多移动机器人协同合作几个方 复杂的单机器人系统架构更简单,成本更低:多 面。但随着多移动机器人技术的发展,多移动机 移动机器人的并行操作能够更快地执行任务;多 器人的应用领域逐渐扩展到水下机器人、太空空 移动机器人系统能增强系统的鲁棒性。 间、高危场所以及服务领域口。与单移动机器人 系统相比,多移动机器人系统具有一系列的优1多移动机器人搬运的控制策略 势,尤其是在一些特定场景:多移动机器人系统 在多移动机器人系统中,多移动机器人的搬 收稿日期:2018-01-21.网络出版日期:2018-06-08 通信作者:顾大强.E-mail:gudq@zju.edu.cn 运任务是其主要应用领域之一,在很多场合,如
DOI: 10.11992/tis.201801038 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20180608.1320.004.html 多移动机器人协同搬运技术综述 顾大强,郑文钢 (浙江大学 机械工程学院,浙江 杭州 310027) 摘 要:多移动机器人协同搬运系统是多移动机器人系统的典型应用,在一些特殊场合中具有较强的应用潜 力。对此,本文综述了多移动机器人协同搬运的相关技术,总结了国内外的发展状况。针对不同的搬运对象, 分析比较了抓取、推拉、锁定 3 种搬运方案,重点分析了不同搬运方案下的多移动机器人协同搬运策略算法原 理以及各自的优缺点;概述了多移动机器人搬运系统中涉及的周边技术,主要包括多移动机器人任务分配、环 境感知定位、轨迹规划 3 个方面;最后对多移动机器人协同搬运技术的研究方向进行了展望。 关键词:多智能体系统;机器人搬运;群体智能;非线性控制系统;协同通信;运动规划;导航技术;避障技术 中图分类号:TP242.6 文献标志码:A 文章编号:1673−4785(2019)01−0020−08 中文引用格式:顾大强, 郑文钢. 多移动机器人协同搬运技术综述[J]. 智能系统学报, 2019, 14(1): 20–27. 英文引用格式:GU Daqiang, ZHENG Wengang. Technologies for cooperative transportation by multiple mobile robots[J]. CAAI transactions on intelligent systems, 2019, 14(1): 20–27. Technologies for cooperative transportation by multiple mobile robots GU Daqiang,ZHENG Wengang (School of Mechanical Engineering, Zhejiang University, Hangzhou 310027, China) Abstract: Cooperative transportation by multiple mobile robots is a typical application of the multi-robot system, and has strong application potential, especially in specific circumstances. In this review, we summarize the range of cooperative transportation technologies and discuss related research progress in China and abroad. With respect to different transportation objectives, we compare three handling schemes, including grab, push, and closure. We then analyze the algorithm principles and respective advantages and disadvantages of each scheme. We introduce the peripheral technologies used in multi-robot transportation systems, including task allocation, environmental perception and location, and motion planning by multiple mobile robots. Finally, we present an overview of the development trend in cooperative transportation technology. Keywords: multi-agent systems; robotics transportation; swarm intelligence; nonlinear control systems; cooperative communication; motion planning; navigation; collision avoidance technology 多移动机器人的研究始于 20 世纪 80 年代后 期,当时的研究领域主要集中在多移动机器人重 构、轨迹规划以及多移动机器人协同合作几个方 面。但随着多移动机器人技术的发展,多移动机 器人的应用领域逐渐扩展到水下机器人、太空空 间、高危场所以及服务领域[1]。与单移动机器人 系统相比,多移动机器人系统具有一系列的优 势,尤其是在一些特定场景[2] :多移动机器人系统 完成的任务复杂性更高;多移动机器人系统能够 胜任分布式任务;多个简单的移动机器人系统比 复杂的单机器人系统架构更简单,成本更低;多 移动机器人的并行操作能够更快地执行任务;多 移动机器人系统能增强系统的鲁棒性。 1 多移动机器人搬运的控制策略 在多移动机器人系统中,多移动机器人的搬 运任务是其主要应用领域之一,在很多场合,如 收稿日期:2018−01−21. 网络出版日期:2018−06−08. 通信作者:顾大强. E-mail:gudq@zju.edu.cn. 第 14 卷第 1 期 智 能 系 统 学 报 Vol.14 No.1 2019 年 1 月 CAAI Transactions on Intelligent Systems Jan. 2019
第1期 顾大强,等:多移动机器人协同搬运技术综述 ·21· 人员的急救工作、高危工作的执行、工业自动化 任务之间可以相互通信、相互协调,能够满足多 过程、重物搬运等,都可以得到应用。最为经典 移动机器人系统适应复杂环境的需求,同时对任 的搬运问题被称为“推箱问题(box-pushing prob- 务(多移动机器人扫描监测、搬运、构图等)具有 lem)”,是由著名的“钢琴搬运工问题(piano 高度的适应性1叨。MAS在多移动机器人搬运中 movers problem)引申而来的。如图1所示,任 应用很广泛,它的优势在于系统对单个移动机器 意给定一个刚性的多面体,满足将规定的对象从 人的性能要求不高,且单个移动机器人的故障不 原配置位置移动到所需的目标配置位置,很多相 会引起整个系统的崩溃。MAS应用于多移动机 关研究都是围绕这个问题展开的4。 器人搬运任务,一方面可以实现对大型物体的集 体搬运1820],另一方面也适用于实时的多目标搬 目标位置 运212,因此被广泛应用于工业搬运2、物流2等 场所。 基于群体智能(swarm intelligence)的控制理 搬运物体 论研究是基于生物学中的群体行为(如昆虫觅 食、搬运行为等)。在生物群体中,各个个体独立 分布,单个个体的故障不会影响整个系统,同时 机器 个体之间通过非直接通信进行信息交互,使得系 统具有很强的扩展性,适用于MAS系统的控 制。群体智能算法中以蚁群优化算法(ant colony 图1推箱问题示意图 optimization,ACO)和粒子群优化算法(particle Fig.1 Schematic of the“box-pushing problem” swarm optimization,.PSO)最为典型。 对于已知物体的搬运方案可以大致分为3种 蚁群算法是由Dorige0等21于1997年提出。 类型:抓取、推拉、锁定。抓取操作是应用较为普 该算法受蚂蚁觅食行为的启发:蚂蚁在行动过程 遍的一种方式,尤其是对于配有机械臂或多指机 中会留下“信息素”作为标记,其他蚂蚁可以通过 械手的系统,该方案的难点在于保持机器人在抓 感知“信息素”的浓度来选择最佳的路径,大量的 取过程中抓取位置的准确性以及搬运过程中物体 蚂蚁群体会形成一个正反馈,从而找到系统的最 的稳定性,对多移动机器人系统的实时响应性能 优解(最短路径)。 和传感器的精度要求较高。第二种推拉方式较 1)经典的蚁群算法 为典型,“推箱问题”采用的便是这种方式,推拉 t时刻,蚂蚁k从第个节点到下一个节点j是 操作可以认为是一种条件封闭操作(conditional 根据初始信息素x,)和启发信息()的大小进行 closure manipulation),被广泛应用于群体智能(swam 判定,判定原则为伪随机比例原则:节点的蚂蚁 intelligence)机器人的搬运任务中-。另外,通 以一定概率q%转移到下一个节点j,若q≤9o,则满 过大型物体的翻转、抬运31操作进行物体的协 足[x)[①P最大,蚂蚁的状态转移公式为式 同搬运,实际也属于广义动态的推拉操作。第三 (1),否则按照式(2)采用轮盘赌方式选择下一个 种锁定方案,源于机械手抓取过程中的力封闭 节点。 (force closure)和形封闭(form closure)算法,通过 arg max([T(t)]"[nj(t)]).qsqo jeallowed 若干个移动机器人锁定物体,使搬运的物体能够 (1) S.其他 与机器人群作为整个刚体进行运动,实现最终的 [t(t'[(t)P 搬运操作,常见于规则多面体的物体搬运6,应用 P= 王ra0jr.0PjeA (2) 不同的搬运方案主要有以下3种常见的多移动机 SEA 0.jA 器人协同搬运策略。 0=d 1 1.1群体智能 (3) 多智能机器人系统(multi--agent robot systems,. 式中:9为[0,1]区间均匀分布的随机数;α为信息 MAS)作为一个分布式自治系统,其核心在于将 素启发因子,代表信息素的重要程度;B为期望启 整个系统分成若干个智能的、自治的子系统,它 发因子,表征启发信息的重要程度;A表示蚂蚁 们可以是同质的,也可以是异质的,任务的完成 k下一步允许选择的路径集合;d表示待选节点j 可以由若干物理和地理上分散的子任务组成,子 与目标节点g的欧氏距离。信息素需要随着时间
人员的急救工作、高危工作的执行、工业自动化 过程、重物搬运等,都可以得到应用。最为经典 的搬运问题被称为“推箱问题 (box-pushing problem)” ,是由著名的 “ 钢琴搬运工问 题 (piano movers problem)[3] ”引申而来的。如图 1 所示,任 意给定一个刚性的多面体,满足将规定的对象从 原配置位置移动到所需的目标配置位置,很多相 关研究都是围绕这个问题展开的[4-9]。 目标位置 搬运物体 机器人 图 1 推箱问题示意图 Fig. 1 Schematic of the “box-pushing problem” 对于已知物体的搬运方案可以大致分为 3 种 类型:抓取、推拉、锁定。抓取操作是应用较为普 遍的一种方式,尤其是对于配有机械臂或多指机 械手的系统,该方案的难点在于保持机器人在抓 取过程中抓取位置的准确性以及搬运过程中物体 的稳定性,对多移动机器人系统的实时响应性能 和传感器的精度要求较高[10]。第二种推拉方式较 为典型,“推箱问题”采用的便是这种方式,推拉 操作可以认为是一种条件封闭操作 (conditional closure manipulation),被广泛应用于群体智能 (swarm intelligence) 机器人的搬运任务中[11-12]。另外,通 过大型物体的翻转、抬运[13-14]操作进行物体的协 同搬运,实际也属于广义动态的推拉操作。第三 种锁定方案,源于机械手抓取过程中的力封闭 (force closure) 和形封闭 (form closure)算法[15] ,通过 若干个移动机器人锁定物体,使搬运的物体能够 与机器人群作为整个刚体进行运动,实现最终的 搬运操作,常见于规则多面体的物体搬运[16] ,应用 不同的搬运方案主要有以下 3 种常见的多移动机 器人协同搬运策略。 1.1 群体智能 多智能机器人系统 (multi-agent robot systems, MAS) 作为一个分布式自治系统,其核心在于将 整个系统分成若干个智能的、自治的子系统,它 们可以是同质的,也可以是异质的,任务的完成 可以由若干物理和地理上分散的子任务组成,子 任务之间可以相互通信、相互协调,能够满足多 移动机器人系统适应复杂环境的需求,同时对任 务 (多移动机器人扫描监测、搬运、构图等) 具有 高度的适应性 [17]。MAS 在多移动机器人搬运中 应用很广泛,它的优势在于系统对单个移动机器 人的性能要求不高,且单个移动机器人的故障不 会引起整个系统的崩溃。MAS 应用于多移动机 器人搬运任务,一方面可以实现对大型物体的集 体搬运[18-20] ,另一方面也适用于实时的多目标搬 运 [21-22] ,因此被广泛应用于工业搬运[23] 、物流[24]等 场所。 基于群体智能 (swarm intelligence) 的控制理 论研究是基于生物学中的群体行为 (如昆虫觅 食、搬运行为等)。在生物群体中,各个个体独立 分布,单个个体的故障不会影响整个系统,同时 个体之间通过非直接通信进行信息交互,使得系 统具有很强的扩展性,适用于 MAS 系统的控 制。群体智能算法中以蚁群优化算法 (ant colony optimization, ACO) 和粒子群优化算法 (particle swarm optimization, PSO) 最为典型。 蚁群算法是由 Dorigo 等 [25]于 1997 年提出。 该算法受蚂蚁觅食行为的启发:蚂蚁在行动过程 中会留下“信息素”作为标记,其他蚂蚁可以通过 感知“信息素”的浓度来选择最佳的路径,大量的 蚂蚁群体会形成一个正反馈,从而找到系统的最 优解 (最短路径)。 1) 经典的蚁群算法 t k i j τi j (t) ηi j(t) i j q ⩽ q0 [τi j(t)]α [ηi j(t)]β 时刻,蚂蚁 从第 个节点到下一个节点 是 根据初始信息素 和启发信息 的大小进行 判定,判定原则为伪随机比例原则:节点 的蚂蚁 以一定概率 q0 转移到下一个节点 ,若 ,则满 足 最大,蚂蚁的状态转移公式为式 (1),否则按照式 (2) 采用轮盘赌方式选择下一个 节点。 j = argmax j∈allowedk {[τi j(t)]α [ηi j(t)]β }, q ⩽ q0 S, 其他 (1) P k i j(t) = [τi j(t)]α [ηi j(t)]β ∑ s∈Ak [τis(t)]α [ηis(t)]β , j ∈ Ak 0, j < Ak (2) ni j(t) = 1 djg (3) α β Ak k djg j g 式中:q 为[0, 1]区间均匀分布的随机数; 为信息 素启发因子,代表信息素的重要程度; 为期望启 发因子,表征启发信息的重要程度; 表示蚂蚁 下一步允许选择的路径集合; 表示待选节点 与目标节点 的欧氏距离。信息素需要随着时间 第 1 期 顾大强,等:多移动机器人协同搬运技术综述 ·21·
·22· 智能系统学报 第14卷 推移进行更新,传统蚁群算法在完成一次迭代后 在多移动机器人搬运系统中,经常采用的移 通过式(4)、式(⑤)进行信息素的全局更新。 动机器人集中式控制模式被称为Pusher-Watcher' Tii(t+1)=(1-p)Tii()+pATii(t,t+1) (4) 模式例。与“Leader-.Follwer”模式类似,“Pusher- 0 i,jEL Watcher”模式中“Watcher”机器人占据系统控制 △t(t,t+1)= (5) 0,i,j在L 的主要地位,负责对系统环境的扫描、定位、避障 式中:p为全局信息素挥发系数;△r化,t+1)表示 操作,有时还需要检测搬运物体的实时状态3) 亿,1+1)时刻在路径(i,)上的信息素增量:Q为信息素 “Pusher'”机器人则只需根据“Watcher'”机器人的 强度系数;L为蚂蚁k建立的最短路径。在传统的蚁 指示协助机器人进行物体的搬运操作。与传统的 群算法基础上也衍生出了很多优化的蚁群算法s。 集中式控制相比,“Pusher-Watcher”模式能够更 2)粒子群算法 好地响应动态环境,“Watcher'”机器人能够根据具 粒子群算法是一种模拟鸟群觅食过程中的迁 体环境的实时变化作出反应,同时对于同质的 徙和群聚行为的算法,最早由Kennedy和Eber- “Pusher-Watcher”机器人系统,各个机器人往往 hart2提出。它假设在D维的搜索空间内,粒子群 能够在“Watcher'”和“Pusher'”两者之间切换,甚至 的规模是N,第ii=1,2,…,N个粒子的位置是 同时担任两者的功能,系统具有较强的容错性。 x=[xHx2…xol,飞行速度为=[ava…Dl,则 除此之外,类似于“Pusher-Watcher'”模式,东京大 第t次迭代的自身历史最优位置为p,全局粒子 学工业产品造物工程研究中心(research into artifacts 最优位置为ge,粒子通过两个不断更新的极值来 center for engineering,RACE)的Ota等B还提出了 更新自己的速度和位置2。经典的迭代公式为 抓取者-搬运者、翻转者-搬运者模式$6”,以若干 v(t+1)=v(t)+cir(pbest -x(t))+c2r2(gbes-x(t))(6) 特制的移动机器人完成了对大型物体的协同搬运。 x(t+1)=x(t)+v(t+1) (7) 1.3对象锁定 式中:1为当前进化迭代数;学习因子c、c2为非负 多移动机器人搬运的对象锁定(object clos- 常数;、n2为[0,1]区间服从均匀分布的两个独立 ure)策略,策略中的“锁定”概念定义为:在各个移 随机数。程序在达到最大迭代次数或者达到预设 动机器人“到位”之后,物体的可移动区域有界, 精度时终止。粒子群算法的缺陷在于:搜索精度 且当移动机器人之间的相对位置发生改变或者个 低,对参数依赖程度高,改进的粒子群算法有二进 别移动机器人与物体的接触力为零(处于脱离状 制粒子群算法、协同粒子群算法、简化粒子群算 态)时,物体仍在各个移动机器人的控制边界 法等。 内B8-3。图2表示锁定物体的移动机器人群R, 1.2领导-跟随控制模式 位=1,2,3,4)与物体之间的相互关系o1,可见当物 领导-跟随(Leader-Follower)模式是多移动机 体处于锁定状态时,物体的搬运控制可以通过各 器人系统最典型的集中式控制模式3训,它通常 个移动机器人简单的刚性变换来实现。与机械手 由一个功能相对强大的移动机器人作为群体移动 的锁定抓取不同,多移动机器人的协同控制会随 机器人的Leader'”,其他移动机器人受到Lead- 着机器人数目的增多,物体与机器人之间的拓扑 er”的集中控制。所有移动机器人接受到的传感 关系变化而变得愈加复杂,需要借助于高效的分 器信息都需要传递到Leader'”机器人,进行统一 布式算法来实现多移动机器人位置的规划。 分析,对系统的任务分配、路径规划等进行统一 处理,最后一一分配给其他从属机器人。该体系 下,其他从属机器人不具备自主动作与相互协调 R 的功能,只是作为收集信息的执行端。它的优点 搬运对象 是:各移动机器人之间的协调效率高,整个系统 象 的逻辑架构相对简单,但是对“Leader'”机器人的 运算性能要求高,同时由于系统对其的高度依赖 R 性,系统的容错性只能被限定在小范围的错误 图2锁定状态下的移动机器人与物体相对位置 中,主控机器人的故障直接会导致系统的崩溃。 Fig.2 Relative positions of mobile robots with the object 系统的灵活性、自主性、可扩展性和鲁棒性都比 under the object closure state 较差,无法应用于非结构化、动态环境。集中式 目前,常应用人工势场法进行搬运对象的搜 控制模式下,各机器人之间可以有明确的分工协作。 索以及锁定状态的确定。势场法最初应用于虚拟
推移进行更新,传统蚁群算法在完成一次迭代后 通过式 (4)、式 (5) 进行信息素的全局更新。 τi j(t+1) = (1−ρ)τi j(t)+ρ∆τi j(t,t+1) (4) ∆τi j(t,t+1) = Q Lk , i, j ∈ Lk 0, i, j < Lk (5) ρ ∆τi j(t,t+1) (t,t+1) (i, j) Q Lk k 式中: 为全局信息素挥发系数; 表示 时刻在路径 上的信息素增量; 为信息素 强度系数; 为蚂蚁 建立的最短路径。在传统的蚁 群算法基础上也衍生出了很多优化的蚁群算法[26-27]。 2) 粒子群算法 D N i(i = 1,2,··· ,N) xi = [xi1 xi2 ··· xiD] vi = [vi1 vi2 ··· viD] t pbest gbest 粒子群算法是一种模拟鸟群觅食过程中的迁 徙和群聚行为的算法,最早由 Kennedy 和 Eberhart[28]提出。它假设在 维的搜索空间内,粒子群 的规模是 , 第 个粒子的位置是 ,飞行速度为 ,则 第 次迭代的自身历史最优位置为 ,全局粒子 最优位置为 ,粒子通过两个不断更新的极值来 更新自己的速度和位置[29]。经典的迭代公式为 v(t+1) = v(t)+c1r1(pbest − x(t))+c2r2(gbest − x(t)) (6) x(t+1) = x(t)+v(t+1) (7) 式中: t 为当前进化迭代数;学习因子c1、c2为非负 常数;r1、r2 为[0, 1]区间服从均匀分布的两个独立 随机数。程序在达到最大迭代次数或者达到预设 精度时终止。粒子群算法的缺陷在于:搜索精度 低,对参数依赖程度高,改进的粒子群算法有二进 制粒子群算法、协同粒子群算法、简化粒子群算 法等。 1.2 领导−跟随控制模式 领导−跟随 (Leader-Follower) 模式是多移动机 器人系统最典型的集中式控制模式[30-31] ,它通常 由一个功能相对强大的移动机器人作为群体移动 机器人的“Leader”,其他移动机器人受到“Leader”的集中控制。所有移动机器人接受到的传感 器信息都需要传递到“Leader”机器人,进行统一 分析,对系统的任务分配、路径规划等进行统一 处理,最后一一分配给其他从属机器人。该体系 下,其他从属机器人不具备自主动作与相互协调 的功能,只是作为收集信息的执行端。它的优点 是:各移动机器人之间的协调效率高,整个系统 的逻辑架构相对简单,但是对“Leader”机器人的 运算性能要求高,同时由于系统对其的高度依赖 性,系统的容错性只能被限定在小范围的错误 中,主控机器人的故障直接会导致系统的崩溃。 系统的灵活性、自主性、可扩展性和鲁棒性都比 较差,无法应用于非结构化、动态环境。集中式 控制模式下,各机器人之间可以有明确的分工协作。 在多移动机器人搬运系统中,经常采用的移 动机器人集中式控制模式被称为“Pusher-Watcher” 模式[32]。与“Leader-Follwer”模式类似,“PusherWatcher”模式中“Watcher”机器人占据系统控制 的主要地位,负责对系统环境的扫描、定位、避障 操作,有时还需要检测搬运物体的实时状态[33] , “Pusher”机器人则只需根据“Watcher”机器人的 指示协助机器人进行物体的搬运操作。与传统的 集中式控制相比,“Pusher-Watcher”模式能够更 好地响应动态环境,“Watcher”机器人能够根据具 体环境的实时变化作出反应,同时对于同质的 “Pusher-Watcher”机器人系统,各个机器人往往 能够在“Watcher”和“Pusher”两者之间切换,甚至 同时担任两者的功能,系统具有较强的容错性[34]。 除此之外,类似于“Pusher-Watcher”模式,东京大 学工业产品造物工程研究中心 (research into artifacts center for engineering,RACE) 的 Ota 等 [35]还提出了 抓取者-搬运者、翻转者-搬运者模式[36-37] ,以若干 特制的移动机器人完成了对大型物体的协同搬运。 1.3 对象锁定 (i = 1,2,3,4) 多移动机器人搬运的对象锁定 (object closure) 策略,策略中的“锁定”概念定义为:在各个移 动机器人“到位”之后,物体的可移动区域有界, 且当移动机器人之间的相对位置发生改变或者个 别移动机器人与物体的接触力为零 (处于脱离状 态) 时,物体仍在各个移动机器人的控制边界 内 [38−39]。图 2 表示锁定物体的移动机器人群 Ri 与物体之间的相互关系[40] ,可见当物 体处于锁定状态时,物体的搬运控制可以通过各 个移动机器人简单的刚性变换来实现。与机械手 的锁定抓取不同,多移动机器人的协同控制会随 着机器人数目的增多,物体与机器人之间的拓扑 关系变化而变得愈加复杂,需要借助于高效的分 布式算法来实现多移动机器人位置的规划。 搬运 对象 搬运 对象 搬运对象 R4 R4 R4 R1 R1 R1 R2 R2 R2 R3 R3 R3 图 2 锁定状态下的移动机器人与物体相对位置 Fig. 2 Relative positions of mobile robots with the object under the object closure state 目前,常应用人工势场法进行搬运对象的搜 索以及锁定状态的确定。势场法最初应用于虚拟 ·22· 智 能 系 统 学 报 第 14 卷
第1期 顾大强,等:多移动机器人协同搬运技术综述 ·23· 力解决路径规划问题,它将移动机器人所处环境 2.1多移动机器人协同任务分配 信息模拟成虚拟势场,通过斥力势场和引力势场 多移动机器人的任务分配问题是一个最优化 的相互作用,使移动机器人能够避开障碍物,最 问题,可描述为:对一个移动机器人集合、一个任 终安全到达目标点。在移动机器人进行对象搜索 务集合指定系统评价指标,将各个子任务分配到 时,机器人所受到的引力来自搬运物体,斥力来 合适的子机器人,满足整个移动机器人系统在执 自其他移动机器人。搬运物体锁定状态的实现主 行全部任务过程中获得的收益最大。该问题属 要分搜索与锁定两步。 于NP问题),通常采用启发式算法求出其中一 1)假设单个机器人i受到一个2维力向量 个可接受的解。若以多移动机器人完成全部侦查 B,的驱使进行运动,B,由2部分组成,即物体的吸 任务所需要移动的路径总长度作为评价任务分配 引力向量B。的和其他机器人的斥力向量B: 的最优性能指标,静态环境下多移动机器人协同 ;=B: 侦查多个目标点的任务分配问题可以归结为求解 般形式(各移动体的起点、终点不一定相同)的 B:=Bobi+ 多旅行商问题(MTSP)。常用的任务分配算法有 在B,的作用下,各个移动机器人会在搬运物 基于拍卖的分配算法,当系统需要完成任务并 体的周围逐渐形成一个闭环链。 得到最短路径时,通常采用的算法有异质交互式 2)完成1)后各个移动机器人需要围绕着物 文化混合算法(HICHA)、遗传算法(GA)、改进粒 体的边缘不断移动直到物体被“锁定”。物体的锁 子群算法(PSOBA)、蚁群优化算法(ACO)、均衡负 定状态由下式确定: 载规划算法(BPA)等。 实际上,多移动机器人之间的任务分配以及 B:=Bobi3 协同控制还需要考虑多移动机器人系统在时间 式中: 空间、功能上的分布性特点,国内外学者在分布 式机器人系统的控制系统领域展开了很多的研 1. 物体未被锁定 物体被锁定 究。ALLIANCE作为基于行为的软件架构,成 在这两个过程中,基于人工势场式(8)和式 功解决了多移动机器人的容错协同控制。Klavins (9)得到吸引力向量B和斥力向量B: 等4提出了分布式机器人系统的混合控制方法。 B=(pu(0,)-p)×llp,-pu(0,l2- (8) 在该系统中,每个单体任务都由一个控制器进行 0,llp:-pill Lsen 控制,常被应用于自动化生产的机器人装配任务 Bu= (p-).p (9) 中。“三层"(three-tier,3T)架构由Schreckenghost llP:-Pil 等于1998年提出,该架构考虑了远程设备维护 式中:k≥1;pp,表示任意一个机器人位置;pa为 管理的人机交互问题,可以在执行过程中对操作 指向物体边缘的最近的“锁定平衡点”,对应的角 进行合理地人为干预。CLARAty架构由Volpe等胸 度为0;P是为了保证各个机器人相隔距离相等, 提出,属于两层架构,该架构考虑了系统的规划 其值为S(pa)/m,S(pa)为pa路径长度,n为移动机器 层和执行层之间的强耦合问题,其功能层实现了 人总数;L。为机器人传感器探测的范围。最后, 仿真、状态监测和面向对象的系统操作。3T和 Bpm可以通过式(10)确定,Bpn的方向垂直于物 CIARAty架构都已被应用于美国国家航空航天 体的吸引力B方向: 局(NASA)的部分移动机器人项目中。 BspinBot=0 2.2多移动机器人环境感知与定位 IlBspin ill =Bspin >0 (10) 移动机器人一般通过各类传感器来获取外界 2 多移动机器人的相关技术 信息,常见的传感器包括声呐系统、激光测距仪、 摄像头等。移动机器人需要依靠传感器来感知周 在多移动机器人搬运的实际实现过程中,具 边环境,并提取环境中的有效信息加以处理和理 体搬运流程可以概括为:工作环境信息的感知; 解,最终通过所在环境的模型来表达所在环境的 多移动机器人的任务分配与轨迹规划,机器人执 信息,这是实现自主移动机器人定位、导航的前 行过程,根据实时环境进行轨迹再规划;完成搬 提47。 运任务。其中涉及的相关技术主要包括多移动机器 对距离和障碍的探测,目前主要采用声呐和 人任务分配、环境感知与定位及轨迹规划3个方面。 激光测距仪。相对来说,激光测距仪测距的精度
力解决路径规划问题,它将移动机器人所处环境 信息模拟成虚拟势场,通过斥力势场和引力势场 的相互作用,使移动机器人能够避开障碍物,最 终安全到达目标点。在移动机器人进行对象搜索 时,机器人所受到的引力来自搬运物体,斥力来 自其他移动机器人。搬运物体锁定状态的实现主 要分搜索与锁定两步。 i βi βi βobj_i βi j 1) 假设单个机器人 受到一个 2 维力向量 的驱使进行运动, 由 2 部分组成,即物体的吸 引力向量 和其他机器人的斥力向量 : . xi = βi βi = βobj_i + ∑n j=0 βi j 在 βi的作用下,各个移动机器人会在搬运物 体的周围逐渐形成一个闭环链。 2) 完成 1) 后各个移动机器人需要围绕着物 体的边缘不断移动直到物体被“锁定”。物体的锁 定状态由下式确定: βi = βobj_i + ∑n j=0 βi j + kspin_iβspin_i 式中: kspin_i = { 1, 物体未被锁定 0, 物体被锁定 βobj_i βi j 在这两个过程中,基于人工势场式 (8) 和式 (9) 得到吸引力向量 和斥力向量 : βobj_i = (pd(θi)− pi)× ||pi − pd(θi)||(2k−1) (8) βi j = 0, ||pi − pj || > Lsen ||pi − pj ||2k − P 2k d ||pi − pj || (pj − pi), ||pi − pj || < Lsen (9) k ⩾ 1 pd Pd S (pd)/n S (pd) pd n βspin_i βspin_i βobj_i 式中: ;pi、pj 表示任意一个机器人位置; 为 指向物体边缘的最近的“锁定平衡点”,对应的角 度为 θi; 是为了保证各个机器人相隔距离相等, 其值为 , 为 路径长度, 为移动机器 人总数;Lsen 为机器人传感器探测的范围。最后, 可以通过式 (10) 确定, 的方向垂直于物 体的吸引力 方向: { βspin_i ·βobj_i = 0 ||βspin_i || = βspin > 0 (10) 2 多移动机器人的相关技术 在多移动机器人搬运的实际实现过程中,具 体搬运流程可以概括为:工作环境信息的感知; 多移动机器人的任务分配与轨迹规划,机器人执 行过程,根据实时环境进行轨迹再规划;完成搬 运任务。其中涉及的相关技术主要包括多移动机器 人任务分配、环境感知与定位及轨迹规划 3 个方面。 2.1 多移动机器人协同任务分配 多移动机器人的任务分配问题是一个最优化 问题,可描述为:对一个移动机器人集合、一个任 务集合指定系统评价指标,将各个子任务分配到 合适的子机器人,满足整个移动机器人系统在执 行全部任务过程中获得的收益最大。该问题属 于 NP 问题[41] ,通常采用启发式算法求出其中一 个可接受的解。若以多移动机器人完成全部侦查 任务所需要移动的路径总长度作为评价任务分配 的最优性能指标,静态环境下多移动机器人协同 侦查多个目标点的任务分配问题可以归结为求解 一般形式 (各移动体的起点、终点不一定相同) 的 多旅行商问题 (MTSP)。常用的任务分配算法有 基于拍卖的分配算法[42] ,当系统需要完成任务并 得到最短路径时,通常采用的算法有异质交互式 文化混合算法 (HICHA)、遗传算法 (GA)、改进粒 子群算法 (PSOBA)、蚁群优化算法 (ACO)、均衡负 载规划算法 (BPA) 等。 实际上,多移动机器人之间的任务分配以及 协同控制还需要考虑多移动机器人系统在时间、 空间、功能上的分布性特点,国内外学者在分布 式机器人系统的控制系统领域展开了很多的研 究。ALLIANCE[43]作为基于行为的软件架构,成 功解决了多移动机器人的容错协同控制。Klavins 等 [44]提出了分布式机器人系统的混合控制方法。 在该系统中,每个单体任务都由一个控制器进行 控制,常被应用于自动化生产的机器人装配任务 中。“三层”(three-tier, 3T) 架构由 Schreckenghost 等 [45]于 1998 年提出,该架构考虑了远程设备维护 管理的人机交互问题,可以在执行过程中对操作 进行合理地人为干预。CLARAty 架构由 Volpe 等 [46] 提出,属于两层架构,该架构考虑了系统的规划 层和执行层之间的强耦合问题,其功能层实现了 仿真、状态监测和面向对象的系统操作。3T 和 ClARAty 架构都已被应用于美国国家航空航天 局 (NASA) 的部分移动机器人项目中。 2.2 多移动机器人环境感知与定位 移动机器人一般通过各类传感器来获取外界 信息,常见的传感器包括声呐系统、激光测距仪、 摄像头等。移动机器人需要依靠传感器来感知周 边环境,并提取环境中的有效信息加以处理和理 解,最终通过所在环境的模型来表达所在环境的 信息,这是实现自主移动机器人定位、导航的前 提 [47]。 对距离和障碍的探测,目前主要采用声呐和 激光测距仪。相对来说,激光测距仪测距的精度 第 1 期 顾大强,等:多移动机器人协同搬运技术综述 ·23·
·24· 智能系统学报 第14卷 更高,而且不受环境因素的影响,但价格更高,功 境有一定快速感知并处理的能力。目前较为有效 耗更大。机器人的视觉系统分为主动视觉和被动 的避障策略有人工势场法(APF)、栅格法和神经 视觉两种。主动视觉通常自身配备光源,被动视 网络法等。 觉依靠外部光源。从视觉传感器数目上看,机器 人视觉系统可以分为单目视觉、双目视觉以及多 3结束语 目视觉。单目视觉处理简单,只能获取环境的二 随着传感器技术、计算机视觉、人工智能算 维信息,而双目或者多目视觉处理信息更加复 法以及计算机软硬件等相关技术的发展,多移动 杂,能够获取环境中的三维信息。多机器人系统 机器人协同搬运技术的发展必然会越来越成熟。 的一个难点在于如何将不同类型的信息进行整 目前,对多移动机器人协同搬运技术的研究还存 合,即多传感器信息融合问题。目前常用的多 在很多不足,在未来工作中需要对以下几个方面 传感器信息融合算法有卡尔曼滤波、加权平均 作进一步地研究。 法、统计决策理论和神经网络等。 1)提高多移动机器人对工作环境的适应性。 在获得外界信息的基础上,多移动机器人需 目前对多移动机器人搬运技术的研究多集中于协 要对这些信息进行实时处理。信息处理的一个很 同算法、导航技术,较少考虑机器人结构方面的 重要目标是机器人自身的定位问题。具体来说, 问题。所采用的机器人多为轮式或链条式机器 机器人需要根据当前位置估计周围环境地图数据 人,对工作环境尤其是移动面的要求较高。实际 以及外部传感器数据等,经过特定算法处理,得 上多移动机器人的应用场所往往是一些高危或者 到更加精确的当前位置估计。机器人定位可以分 常人难以进入的场所,因此对环境具有高适应性 为2种:相对定位和绝对定位。前者是在给定初 的机器人的开发是极其重要的。 始位置的情况下,确定自己的位置;后者则不需 2)搬运中缺少反馈系统,目前大部分多移动 要给定初始位置。相对定位的实现包括2种定位 机器人搬运系统都是一个开环的系统。一旦满足 方法:惯性导航和测程法。惯性导航依赖于加速 了系统给定的搬运起始状态(夹紧、锁定等)之 度计、陀螺仪、电磁罗盘等传感器,测程法则基于 后,搬运物体在整个过程中便处于自由状态,一 编码器测量信息。绝对定位通常依赖的方法包 些重心较高的物体很容易在搬运过程中发生倾倒 括:导航信标;主动或被动标识;图形匹配:基于 等情况。目前,已有的一些基于视觉反馈系统的 卫星的导航信号,即GPS定位;概率定位。 研究仍然不成熟,在时间响应以及反馈信息处理 2.3多移动机器人轨迹规划 上需要得到进一步的提高。 多移动机器人路径规划目的在于:根据已知 3)多移动机器人控制算法应与人工智能结 的、部分已知的环境信息,由移动机器人群自主 合。虽然机器学习很早就应用于多机器人协同控 规划路径,满足各个移动机器人从各自已知的起 制,但是目前机器学习算法在复杂环境中的响应 始位置出发,绕过障碍物,到达各自的终止位置, 时间和正确率都不令人满意。随着人工智能的不 在整个过程中,各个机器人之间不发生干涉。已 断发展,机器视觉的不断突破,人工智能技术与 有的路径规划算法主要有栅格法、构型空间法 机器人控制的结合应该变得更加密切。 (C-Space)、边界距离模型法等。多移动机器人的 全局路径规划不仅需要保证机器人与障碍物之间 参考文献: 无碰撞,同时还要避免机器人与机器人之间无碰 [1]ARAI T,PAGELLO E,PARKER L E.Guest editorial 撞,并且满足优化条件,可以采用多移动机器人 advances in multirobot systems[J].IEEE transactions on 免疫协同路径规划算法。 robotics and automation,2002.18(5):655-661. 多移动机器人的实时避障、路径规划以及编 [2]PARKER L E.TANG Fang.Building multirobot coali- 队等9s0传统问题一直是国内外的研究热点。但 tions through automated task solution synthesis[J]. 是近年来,多移动机器人的停驻、目标搜索问 Proceedings of the IEEE,2006,94(7):1289-1305. 题5得到了越来越多的关注。该问题的核心在 [3]SCHWARTZ J T,SHARIR M.On the "piano movers"" 于:找到目标物外围的包围圈,并且合理分配包 problem I.The case of a two-dimensional rigid polygonal 围圈上的机器人停驻点,从而获取目标物体各个 body moving amidst polygonal barriers[J].Communica- 方面的信息。在停驻点分配的过程中,需要机器 tions on pure and applied mathematics,1983,36(3): 人有一定的自主避障能力,要求机器人能够对环 345-398
更高,而且不受环境因素的影响,但价格更高,功 耗更大。机器人的视觉系统分为主动视觉和被动 视觉两种。主动视觉通常自身配备光源,被动视 觉依靠外部光源。从视觉传感器数目上看,机器 人视觉系统可以分为单目视觉、双目视觉以及多 目视觉。单目视觉处理简单,只能获取环境的二 维信息,而双目或者多目视觉处理信息更加复 杂,能够获取环境中的三维信息。多机器人系统 的一个难点在于如何将不同类型的信息进行整 合,即多传感器信息融合问题[48]。目前常用的多 传感器信息融合算法有卡尔曼滤波、加权平均 法、统计决策理论和神经网络等。 在获得外界信息的基础上,多移动机器人需 要对这些信息进行实时处理。信息处理的一个很 重要目标是机器人自身的定位问题。具体来说, 机器人需要根据当前位置估计周围环境地图数据 以及外部传感器数据等,经过特定算法处理,得 到更加精确的当前位置估计。机器人定位可以分 为 2 种:相对定位和绝对定位。前者是在给定初 始位置的情况下,确定自己的位置;后者则不需 要给定初始位置。相对定位的实现包括 2 种定位 方法:惯性导航和测程法。惯性导航依赖于加速 度计、陀螺仪、电磁罗盘等传感器,测程法则基于 编码器测量信息。绝对定位通常依赖的方法包 括:导航信标;主动或被动标识;图形匹配;基于 卫星的导航信号,即 GPS 定位;概率定位。 2.3 多移动机器人轨迹规划 多移动机器人路径规划目的在于:根据已知 的、部分已知的环境信息,由移动机器人群自主 规划路径,满足各个移动机器人从各自已知的起 始位置出发,绕过障碍物,到达各自的终止位置, 在整个过程中,各个机器人之间不发生干涉。已 有的路径规划算法主要有栅格法、构型空间法 (C-Space)、边界距离模型法等。多移动机器人的 全局路径规划不仅需要保证机器人与障碍物之间 无碰撞,同时还要避免机器人与机器人之间无碰 撞,并且满足优化条件,可以采用多移动机器人 免疫协同路径规划算法。 多移动机器人的实时避障、路径规划以及编 队等[49-50]传统问题一直是国内外的研究热点。但 是近年来,多移动机器人的停驻、目标搜索问 题 [51-52] 得到了越来越多的关注。该问题的核心在 于:找到目标物外围的包围圈,并且合理分配包 围圈上的机器人停驻点,从而获取目标物体各个 方面的信息。在停驻点分配的过程中,需要机器 人有一定的自主避障能力,要求机器人能够对环 境有一定快速感知并处理的能力。目前较为有效 的避障策略有人工势场法 (APF)、栅格法和神经 网络法等[53]。 3 结束语 随着传感器技术、计算机视觉、人工智能算 法以及计算机软硬件等相关技术的发展,多移动 机器人协同搬运技术的发展必然会越来越成熟。 目前,对多移动机器人协同搬运技术的研究还存 在很多不足,在未来工作中需要对以下几个方面 作进一步地研究。 1) 提高多移动机器人对工作环境的适应性。 目前对多移动机器人搬运技术的研究多集中于协 同算法、导航技术,较少考虑机器人结构方面的 问题。所采用的机器人多为轮式或链条式机器 人,对工作环境尤其是移动面的要求较高。实际 上多移动机器人的应用场所往往是一些高危或者 常人难以进入的场所,因此对环境具有高适应性 的机器人的开发是极其重要的。 2) 搬运中缺少反馈系统,目前大部分多移动 机器人搬运系统都是一个开环的系统。一旦满足 了系统给定的搬运起始状态 (夹紧、锁定等) 之 后,搬运物体在整个过程中便处于自由状态,一 些重心较高的物体很容易在搬运过程中发生倾倒 等情况。目前,已有的一些基于视觉反馈系统的 研究仍然不成熟,在时间响应以及反馈信息处理 上需要得到进一步的提高。 3) 多移动机器人控制算法应与人工智能结 合。虽然机器学习很早就应用于多机器人协同控 制,但是目前机器学习算法在复杂环境中的响应 时间和正确率都不令人满意。随着人工智能的不 断发展,机器视觉的不断突破,人工智能技术与 机器人控制的结合应该变得更加密切。 参考文献: ARAI T, PAGELLO E, PARKER L E. Guest editorial advances in multirobot systems[J]. IEEE transactions on robotics and automation, 2002, 18(5): 655–661. [1] PARKER L E, TANG Fang. Building multirobot coalitions through automated task solution synthesis[J]. Proceedings of the IEEE, 2006, 94(7): 1289–1305. [2] SCHWARTZ J T, SHARIR M. On the “piano movers’” problem I. The case of a two-dimensional rigid polygonal body moving amidst polygonal barriers[J]. Communications on pure and applied mathematics, 1983, 36(3): 345–398. [3] ·24· 智 能 系 统 学 报 第 14 卷