第15卷第2期 智能系统学报 Vol.15 No.2 2020年3月 CAAI Transactions on Intelligent Systems Mar.2020 D0:10.11992tis.201912001 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20200320.1600.020html 人机智能技术及系统研究进展综述 程洪,黄瑞',邱静,马文昊,施柯丞,李骏 (1.电子科技大学机器人研究中心,四川成都611731;2.清华大学车辆与运载学院,北京100084) 摘要:人机智能系统是能够实现人机智能协作的机器人系统,近年来成为了机器人领域的研究热点,具有广 泛的应用前景。针对人机智能系统技术和应用的国内外研究现状,从人机智能系统的关键技术和典型应用领 域两方面进行了进展综述。重点综述了与传统机器人系统存在差异性的人机智能系统关键技术,从建模、交 互、协同和优化4个方面的研究进展分别展开论述,对涉及的典型应用领域及典型人机智能系统进行总结,并 对人机智能系统发展的挑战和未来研究方向进行了展望。 关键词:人机智能系统:系统建模;人机交互;协同控制:混合智能:康复机器人;人机共驾;社会机器人 中图分类号:TP24文献标志码:A文章编号:1673-4785(2020)02-0386-13 中文引用格式:程洪,黄瑞,邱静,等.人机智能技术及系统研究进展综述.智能系统学报,2020,15(2):386-398 英文引用格式:CHENG Hong,HUANG Rui,,QIU Jing,etal.A survey of recent advances in human-robot intelligent systems. CAAI transactions on intelligent systems,2020,15(2):386-398. A survey of recent advances in human-robot intelligent systems CHENG Hong,HUANG Rui,QIU Jing',MA Wenhao',SHI Kecheng',LI Jun? (1.Robotics Research Center,University of Electronic Science and Technology of China,Chengdu 611731,China;2.School of Vehicle and Mobility,Tsinghua University,Beijing 100084,China) Abstract:Human-robot intelligent system is a kind of robotic system which has the ability to cooperative with operat- ors.The human-robot intelligent system has been a popular topic in robotics thanks to its potential applications.Accord- ing to the research status of human-robot intelligent systems,fundamental technologies and typical application domains of human-robot intelligent systems are summarized.In particular,this survey focus on the difference of fundamental technologies between traditional robotic systems and human-robot intelligent systems.The research progress in model- ing,interaction,collaboration and optimization is discussed respectively.Typical human-robot intelligent systems in dif- ferent applications are summarized,in which challenges and potential future development of human-robot intelligent systems are discussed. Keywords:human-robot intelligent system;system modeling;human-robot interaction;collaboration;hybrid intelli- gence;rehabilitation robot;cooperative driving;social robot 随着人工智能和机器人相关技术与产业的发 和机器人各自的优势从而更好地完成复杂的人机 展,越来越多的机器人系统与产品深度地融合到 协同任务,其最终目标是实现人类和机器人在应 各个应用领域,也对传统的机器人技术提出了更 用场景中的自然互融。人机智能技术则是人机智 高的要求,尤其是在如何与人更好地进行交互和能系统为实现目标的理论与技术支撑,主要通过 协同方面。这一类需要与人进行交互和协同的 结合传统机器人技术和人工智能技术,从系统建 机器人系统称为人机智能系统,其通过结合人类 模、感知与交互、协同控制和人在回路优化等方 收稿日期:2019-12-02.网络出版日期:2020-03-23. 面提升机器人与人交互和协同的自然性、安全性 基金项目:国家重点研发计划项目(2017YFB1302300):国家自 和鲁棒性。本文将从人机智能系统关键技术和典 然科学基金项目(61603078.61673088). 通信作者:程洪.E-mail:hcheng@uestc..edu.cn 型应用场景出发,对近年来人机智能系统研究领
DOI: 10.11992/tis.201912001 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20200320.1600.020.html 人机智能技术及系统研究进展综述 程洪1 ,黄瑞1 ,邱静1 ,马文昊1 ,施柯丞1 ,李骏2 (1. 电子科技大学 机器人研究中心,四川 成都 611731; 2. 清华大学 车辆与运载学院,北京 100084) 摘 要:人机智能系统是能够实现人机智能协作的机器人系统,近年来成为了机器人领域的研究热点,具有广 泛的应用前景。针对人机智能系统技术和应用的国内外研究现状,从人机智能系统的关键技术和典型应用领 域两方面进行了进展综述。重点综述了与传统机器人系统存在差异性的人机智能系统关键技术,从建模、交 互、协同和优化 4 个方面的研究进展分别展开论述,对涉及的典型应用领域及典型人机智能系统进行总结,并 对人机智能系统发展的挑战和未来研究方向进行了展望。 关键词:人机智能系统;系统建模;人机交互;协同控制;混合智能;康复机器人;人机共驾;社会机器人 中图分类号:TP24 文献标志码:A 文章编号:1673−4785(2020)02−0386−13 中文引用格式:程洪, 黄瑞, 邱静, 等. 人机智能技术及系统研究进展综述 [J]. 智能系统学报, 2020, 15(2): 386–398. 英文引用格式:CHENG Hong, HUANG Rui, QIU Jing, et al. A survey of recent advances in human-robot intelligent systems[J]. CAAI transactions on intelligent systems, 2020, 15(2): 386–398. A survey of recent advances in human-robot intelligent systems CHENG Hong1 ,HUANG Rui1 ,QIU Jing1 ,MA Wenhao1 ,SHI Kecheng1 ,LI Jun2 (1. Robotics Research Center, University of Electronic Science and Technology of China, Chengdu 611731, China; 2. School of Vehicle and Mobility, Tsinghua University, Beijing 100084, China) Abstract: Human-robot intelligent system is a kind of robotic system which has the ability to cooperative with operators. The human-robot intelligent system has been a popular topic in robotics thanks to its potential applications. According to the research status of human-robot intelligent systems, fundamental technologies and typical application domains of human-robot intelligent systems are summarized. In particular, this survey focus on the difference of fundamental technologies between traditional robotic systems and human-robot intelligent systems. The research progress in modeling, interaction, collaboration and optimization is discussed respectively. Typical human-robot intelligent systems in different applications are summarized, in which challenges and potential future development of human-robot intelligent systems are discussed. Keywords: human-robot intelligent system; system modeling; human-robot interaction; collaboration; hybrid intelligence; rehabilitation robot; cooperative driving; social robot 随着人工智能和机器人相关技术与产业的发 展,越来越多的机器人系统与产品深度地融合到 各个应用领域,也对传统的机器人技术提出了更 高的要求,尤其是在如何与人更好地进行交互和 协同方面[1]。这一类需要与人进行交互和协同的 机器人系统称为人机智能系统,其通过结合人类 和机器人各自的优势从而更好地完成复杂的人机 协同任务,其最终目标是实现人类和机器人在应 用场景中的自然互融。人机智能技术则是人机智 能系统为实现目标的理论与技术支撑,主要通过 结合传统机器人技术和人工智能技术,从系统建 模、感知与交互、协同控制和人在回路优化等方 面提升机器人与人交互和协同的自然性、安全性 和鲁棒性。本文将从人机智能系统关键技术和典 型应用场景出发,对近年来人机智能系统研究领 收稿日期:2019−12−02. 网络出版日期:2020−03−23. 基金项目:国家重点研发计划项目 (2017YFB1302300);国家自 然科学基金项目 (61603078,61673088). 通信作者:程洪. E-mail:hcheng@uestc.edu.cn. 第 15 卷第 2 期 智 能 系 统 学 报 Vol.15 No.2 2020 年 3 月 CAAI Transactions on Intelligent Systems Mar. 2020
第2期 程洪,等:人机智能技术及系统研究进展综述 ·387· 域的主要进展和部分代表性技术和系统进行介 务分类的方式,提升人机协同任务执行过程中的 绍,为国内从事人机智能系统研究的科研人员提 精确性和安全性,这类人机智能系统以手术机器 供参考。 人)和工业协作机器人为代表。在人在环上阶 段,人机智能系统除了需要考虑协同任务的复杂 1人机智能技术与系统概述 度外,还需要解决操作者使用者能力缺失或不足 随着机器人系统的不断发展和在各行业的深 而导致的人机交互失效问题。这类人机智能系统 度应用,实际应用场景的需求也逐步增加,而人 通过建立物理和认知双向交互通道,并结合机器 工智能技术的引入从一定层面上提高了机器人的 人的环境感知和理解能力,实现复杂场景和人机 智能程度,但是这一类机器人系统在动态且复杂 协同任务中的混合决策,这类人机智能系统以外 的人机协同任务中,仍具有非常大的局限性。人 骨骼机器人)、人机共驾系统为代表。在人在 机智能系统则是面向复杂人机协同应用场景的智 环外阶段,人机智能系统主要以机器人为主进行 能机器人系统,其核心技术挑战是如何融合人类 感知、决策和控制,这类人机智能系统以无人车可 智能和机器智能以实现自然、安全、鲁棒的人机 为代表。本文主要针对人在回路和人在环上两个 交互与协同,并解决实际应用场景和任务中人机 阶段,对其中人机智能系统的关键技术和典型应 协同的不确定性、脆弱性和开放性等难题。 用场景中的人机智能系统进行综述。 人机智能系统的发展大致可以分为4个阶 表1人机智能系统发展阶段及特点 段,如图1所示,包括人机系统阶段、人在回路阶 Table 1 Development stages and characteristics of human- 段、人在环上阶段和人在环外阶段,其分别对应 robot intelligent systems 机械时代、信息时代、智能时代和无人时代。 发展阶段 代表性系统 主要特点 可人为操控 Human-machine system Human-in-the-loop 人机系统阶段 电动轮椅、汽车 智能性差 ①(机械时代) ②(信息时代) 手术机器人、 人在回路阶段 人机物理交互、 工业协作机器人 任务分类 外骨骼机器人、 物理认知双向交互、 人在环上阶段 人机共驾 人机混合决策 人在环外阶段 以机器为主进行感知 无人车 决策和控制 2人机智能系统的关键技术 作为一种需要与人类进行交互和协同的智能 机器人系统,人机智能系统涉及到的关键技术主 要有:1)人机系统建模;2)人机系统运动协作; 3)认知人机交互;4)人在回路的人机系统优化。 本文将从上述4个方面对人机智能系统关键技术 的进展进行介绍。 Human-out-of-the-loop Human-on-of-the-loop 2.1人机系统建模 ④(无人时代) ③(智能时代) 与传统的机器人系统相比,人机智能系统模 图1人机智能系统的4个发展阶段 型的最大特点是由于人类的深度介入而导致人机 Fig.1 Development stages of human-robot intelligent sys- 系统的动力学特性发生了改变。因此,在人机 tems 系统的建模方法研究中,除了对本身机器人系统 如表1所示,在人机智能系统发展初期,电动 进行建模之外,还需要着重研究人机系统中人类 轮椅和汽车等可人为操控的人机系统是该阶段人 与机器人系统产生物理耦合部分的模型。这一 机系统的典型案例,这一类人机系统的智能性较 类人机智能系统称为紧耦合物理人机智能系统, 差,一般直接通过人机操作接口的方式实现人类 其中可穿戴机器人和智能假肢中的人机系统建模 对机器的控制。在人在回路发展阶段,人机智 更具有挑战性,得到了深入广泛的研究。 能系统的特点是人和机器人能通过物理交互和任 在对于人机智能系统中机器人系统本身的建
域的主要进展和部分代表性技术和系统进行介 绍,为国内从事人机智能系统研究的科研人员提 供参考。 1 人机智能技术与系统概述 随着机器人系统的不断发展和在各行业的深 度应用,实际应用场景的需求也逐步增加,而人 工智能技术的引入从一定层面上提高了机器人的 智能程度,但是这一类机器人系统在动态且复杂 的人机协同任务中,仍具有非常大的局限性。人 机智能系统则是面向复杂人机协同应用场景的智 能机器人系统,其核心技术挑战是如何融合人类 智能和机器智能以实现自然、安全、鲁棒的人机 交互与协同,并解决实际应用场景和任务中人机 协同的不确定性、脆弱性和开放性等难题。 人机智能系统的发展大致可以分为 4 个阶 段,如图 1 所示,包括人机系统阶段、人在回路阶 段、人在环上阶段和人在环外阶段,其分别对应 机械时代、信息时代、智能时代和无人时代。 Human-out-of-the-loop ④ (无人时代) Human-on-of-the-loop ③ (智能时代) Human-machine system ① (机械时代) Human-in-the-loop ② (信息时代) 图 1 人机智能系统的 4 个发展阶段 Fig. 1 Development stages of human-robot intelligent systems 如表 1 所示,在人机智能系统发展初期,电动 轮椅和汽车等可人为操控的人机系统是该阶段人 机系统的典型案例,这一类人机系统的智能性较 差,一般直接通过人机操作接口的方式实现人类 对机器的控制[2]。在人在回路发展阶段,人机智 能系统的特点是人和机器人能通过物理交互和任 务分类的方式,提升人机协同任务执行过程中的 精确性和安全性,这类人机智能系统以手术机器 人 [3] 和工业协作机器人[4] 为代表。在人在环上阶 段,人机智能系统除了需要考虑协同任务的复杂 度外,还需要解决操作者/使用者能力缺失或不足 而导致的人机交互失效问题。这类人机智能系统 通过建立物理和认知双向交互通道,并结合机器 人的环境感知和理解能力,实现复杂场景和人机 协同任务中的混合决策,这类人机智能系统以外 骨骼机器人[5] 、人机共驾系统[6] 为代表。在人在 环外阶段,人机智能系统主要以机器人为主进行 感知、决策和控制,这类人机智能系统以无人车[7] 为代表。本文主要针对人在回路和人在环上两个 阶段,对其中人机智能系统的关键技术和典型应 用场景中的人机智能系统进行综述。 表 1 人机智能系统发展阶段及特点 Table 1 Development stages and characteristics of humanrobot intelligent systems 发展阶段 代表性系统 主要特点 人机系统阶段 电动轮椅、汽车 可人为操控、 智能性差 人在回路阶段 手术机器人、 工业协作机器人 人机物理交互、 任务分类 人在环上阶段 外骨骼机器人、 人机共驾 物理认知双向交互、 人机混合决策 人在环外阶段 无人车 以机器为主进行感知、 决策和控制 2 人机智能系统的关键技术 作为一种需要与人类进行交互和协同的智能 机器人系统,人机智能系统涉及到的关键技术主 要有:1) 人机系统建模;2) 人机系统运动协作; 3) 认知人机交互;4) 人在回路的人机系统优化。 本文将从上述 4 个方面对人机智能系统关键技术 的进展进行介绍。 2.1 人机系统建模 与传统的机器人系统相比,人机智能系统模 型的最大特点是由于人类的深度介入而导致人机 系统的动力学特性发生了改变[8]。因此,在人机 系统的建模方法研究中,除了对本身机器人系统 进行建模之外,还需要着重研究人机系统中人类 与机器人系统产生物理耦合部分的模型[9]。这一 类人机智能系统称为紧耦合物理人机智能系统, 其中可穿戴机器人和智能假肢中的人机系统建模 更具有挑战性,得到了深入广泛的研究[10]。 在对于人机智能系统中机器人系统本身的建 第 2 期 程洪,等:人机智能技术及系统研究进展综述 ·387·
·388· 智能系统学 报 第15卷 模研究中,大部分都是基于传统的机器人建模方 系统控制接口研究。 法来描述人机系统的运动学山和动力学模型 在基于视觉的人机智能系统信息交互研究方 在可穿戴机器人方面,传统的机器人建模方法往 面,主要方法原理是通过视觉和图像传感器对人 往会忽略人机智能系统的紧耦合部分而将人和机 的肢体动作进行捕捉,再将捕捉到的肢体动作与 器看作一个整体,这导致了其在人机智能系统上 样本集中的动作进行匹配,得到该肢体动作下人 控制效果和精度的不理想。为了减小人机智能系 的意图,最终让机器做出该意图下的动作反馈。 统紧耦合部分对其自身运动学和动力学模型的影 在基于视觉的认知人机交互中,对于手势的研究 响,Berkeleyl1采用了系统辨识的方法,通过设计 与应用最为广泛。Wu等四提出了一种用户自定 一系列系统辨识实验,重新标定了人机智能系 义手势的方法,解决了人机智能系统手势认知交 统中运动学和动力学模型的系统参数,最终得到 互中用户在同一场景下不同手势习惯和表示偏差 了一个比原运动学和动力学模型精度更高的动态 的问题,将该方法应用在虚拟现实沉浸式购物系 模型。与Berkeley所不同的是,Tran等关注的 统中,结果显示所提出的方法可以有效准确地识 是人机智能系统的控制器参数。他们发现在人机 别用户的动作意图。Vargas等21利用深度学习 智能系统的运动过程中,传统的机器人建模方法 技术,构建了一个3DCNN神经网络结构来优化 无法明确地描述人与机器人之间的相互作用力, 视频序列中的连续手势识别性能,该方法能够有 而这一作用力可以通过人与机器之间的运动角 效地提取时空特征并进行精确度高达73%的手 度、速度和加速度差进行体现。因此可以根据人 势识别,可以实现在真实场景中通过视频记录手 机之间运动学信息差值的反馈,通过RFB神经网 势来控制机器人系统。 络6和模糊评价)等数学方法对人机系统控制 随着人机智能系统所面临任务和场景的复杂 器的参数进行在线学习,使得控制器参数根据运 化,根据人体简单肢体动作进行意图识别的方法 动学差值进行自适应变化,以减小人和机器人之 误判率较高,因此很多学者倾向于通过生物信号 间的相互作用力,最终达到提高人机智能系统建 来进行人机智能系统的认知交互,其主要方法是 模精度的效果。 通过采集人机交互过程中用户的生理电信号来识 在智能假肢的人机系统建模中,系统建模的 别其运动意图,之后将用户的运动意图作为一种 关键在于所建立的动力学模型如何符合人体运动 控制指令来控制人机智能系统。常用的生理电信 特性,以及基于运动学模型得到的控制器参数是 号有表面肌电信号(sEMG)、脑电信号(EEG)以及 否能够适应外部环境参数的变化,其中较为典型 眼电信号(EOG)。日本筑波大学的HAL下肢助 的环境参数变化情况就是穿戴者运动状态和行走 行外骨骼采用sEMG信号对穿戴者的运动意图进 地形的变化。Eilenberg等9将肌肉运动机理引 行识别,帮助穿戴者完成起坐、行走等日常动作。 入到动力学模型中,设计出的人机智能系统可以 与HAL下肢外骨骼不同的是,Hamaya等Po让用 有效适应穿戴者不同的行走速度以及行走地面坡 户按照自身的运动意图来执行任务,同时将用户 度的变化。Wen等o考虑到难以获得精确的动力 的肌电信号作为当前外骨骼系统辅助用户运动的 学模型,提出了一种无模型自适应动态规划方法 成本,通过模型强化学习框架来尽量减小用户运 (ADP),该方法能够根据环境参数的变化自动调节 动的成本,间接的让外骨骼理解人的意图,从而 控制器的参数,并表现出了较好的效果。 做出对应的反馈动作。中科院深圳研究院也对此 2.2认知人机交互 进行了深入研究,他们设计了一个脑机接口 不同于传统的机器人系统,人机智能系统是 (BC)来控制外骨骼机器人系统,通过脑电图信号 将机器人视为一个认知主体的人机交互系统。认 解码和多模态认知方法来实现整个系统运动模式 知人机交互的目标是使得机器具有人类的认知交 的切换2),同时利用sEMG信号来控制外骨骼系 互特点,可以在与人的交互过程中对环境信息进 统对用户运动的实时跟踪2 行自主感知、理解、学习并反馈川。在人机系统 除了外骨骼人机智能系统,基于生物信号的 的认知交互方法研究中,其关键问题在于如何让 人机智能系统控制接口研究还广泛地应用于智能 机器在不确定性条件下理解人的意图,并对人的 轮椅2、智能假肢30、智能家居Bu以及远程机器 意图做出反馈。国内外学者对此问题进行了深入 人B23川等机智能系统上。雷煜等B通过基于脑电 研究,其主要研究方向包括:)基于视觉的人机 信号的视觉信息解读方法,成功地控制无人机完 智能系统信息交互;2)基于生物信号的人机智能 成了飞行任务
模研究中,大部分都是基于传统的机器人建模方 法来描述人机系统的运动学[11] 和动力学模型[12]。 在可穿戴机器人方面,传统的机器人建模方法往 往会忽略人机智能系统的紧耦合部分而将人和机 器看作一个整体,这导致了其在人机智能系统上 控制效果和精度的不理想。为了减小人机智能系 统紧耦合部分对其自身运动学和动力学模型的影 响,Berkeley[13] 采用了系统辨识的方法,通过设计 一系列系统辨识实验[14] ,重新标定了人机智能系 统中运动学和动力学模型的系统参数,最终得到 了一个比原运动学和动力学模型精度更高的动态 模型。与 Berkeley 所不同的是,Tran 等 [15] 关注的 是人机智能系统的控制器参数。他们发现在人机 智能系统的运动过程中,传统的机器人建模方法 无法明确地描述人与机器人之间的相互作用力, 而这一作用力可以通过人与机器之间的运动角 度、速度和加速度差进行体现。因此可以根据人 机之间运动学信息差值的反馈,通过 RFB 神经网 络 [16] 和模糊评价[17] 等数学方法对人机系统控制 器的参数进行在线学习,使得控制器参数根据运 动学差值进行自适应变化,以减小人和机器人之 间的相互作用力,最终达到提高人机智能系统建 模精度的效果。 在智能假肢的人机系统建模中,系统建模的 关键在于所建立的动力学模型如何符合人体运动 特性,以及基于运动学模型得到的控制器参数是 否能够适应外部环境参数的变化,其中较为典型 的环境参数变化情况就是穿戴者运动状态和行走 地形的变化[18]。Eilenberg 等 [19] 将肌肉运动机理引 入到动力学模型中,设计出的人机智能系统可以 有效适应穿戴者不同的行走速度以及行走地面坡 度的变化。Wen 等 [20] 考虑到难以获得精确的动力 学模型,提出了一种无模型自适应动态规划方法 (ADP),该方法能够根据环境参数的变化自动调节 控制器的参数,并表现出了较好的效果。 2.2 认知人机交互 不同于传统的机器人系统,人机智能系统是 将机器人视为一个认知主体的人机交互系统。认 知人机交互的目标是使得机器具有人类的认知交 互特点,可以在与人的交互过程中对环境信息进 行自主感知、理解、学习并反馈[21]。在人机系统 的认知交互方法研究中,其关键问题在于如何让 机器在不确定性条件下理解人的意图,并对人的 意图做出反馈。国内外学者对此问题进行了深入 研究,其主要研究方向包括:1) 基于视觉的人机 智能系统信息交互;2) 基于生物信号的人机智能 系统控制接口研究。 在基于视觉的人机智能系统信息交互研究方 面,主要方法原理是通过视觉和图像传感器对人 的肢体动作进行捕捉,再将捕捉到的肢体动作与 样本集中的动作进行匹配,得到该肢体动作下人 的意图,最终让机器做出该意图下的动作反馈。 在基于视觉的认知人机交互中,对于手势的研究 与应用最为广泛。Wu 等 [22] 提出了一种用户自定 义手势的方法,解决了人机智能系统手势认知交 互中用户在同一场景下不同手势习惯和表示偏差 的问题,将该方法应用在虚拟现实沉浸式购物系 统中,结果显示所提出的方法可以有效准确地识 别用户的动作意图。Vargas 等 [23] 利用深度学习 技术,构建了一个 3DCNN 神经网络结构来优化 视频序列中的连续手势识别性能,该方法能够有 效地提取时空特征并进行精确度高达 73% 的手 势识别,可以实现在真实场景中通过视频记录手 势来控制机器人系统。 随着人机智能系统所面临任务和场景的复杂 化,根据人体简单肢体动作进行意图识别的方法 误判率较高,因此很多学者倾向于通过生物信号 来进行人机智能系统的认知交互,其主要方法是 通过采集人机交互过程中用户的生理电信号来识 别其运动意图,之后将用户的运动意图作为一种 控制指令来控制人机智能系统。常用的生理电信 号有表面肌电信号 (sEMG)、脑电信号 (EEG) 以及 眼电信号 (EOG)。日本筑波大学的 HAL 下肢助 行外骨骼采用 sEMG 信号对穿戴者的运动意图进 行识别[24] ,帮助穿戴者完成起坐、行走等日常动作[25]。 与 HAL 下肢外骨骼不同的是,Hamaya 等 [26] 让用 户按照自身的运动意图来执行任务,同时将用户 的肌电信号作为当前外骨骼系统辅助用户运动的 成本,通过模型强化学习框架来尽量减小用户运 动的成本,间接的让外骨骼理解人的意图,从而 做出对应的反馈动作。中科院深圳研究院也对此 进行了深入研究,他们设计了一个脑机接 口 (BCI) 来控制外骨骼机器人系统,通过脑电图信号 解码和多模态认知方法来实现整个系统运动模式 的切换[27] ,同时利用 sEMG 信号来控制外骨骼系 统对用户运动的实时跟踪[28]。 除了外骨骼人机智能系统,基于生物信号的 人机智能系统控制接口研究还广泛地应用于智能 轮椅[29] 、智能假肢[30] 、智能家居[31] 以及远程机器 人 [32-33] 等机智能系统上。雷煜等[34]通过基于脑电 信号的视觉信息解读方法,成功地控制无人机完 成了飞行任务。 ·388· 智 能 系 统 学 报 第 15 卷
第2期 程洪,等:人机智能技术及系统研究进展综述 ·389· 2.3人机系统运动协作 系统做出对应的运动。同样的,Darvish等也提 对于人机系统的不同任务,一个挑战性的问 出一个名为FlexHRC的工业协作机器人协作框 题是如何实现人和机器人系统的运动协作。随着 架,该协作框架集传感、理解、规划和控制结构于 人机系统应用领域的逐渐增加,其面对的任务场 一体,通过可穿戴传感设备进行用户意图识别以 景需求也逐渐的多元化,因此在不同任务场景需 及协作模式的选择,最终根据协作模式对机器人 求下采用不同运动模型和控制策略以保证人机之 系统的运动轨迹进行规划,完成人机智能系统的 间的自然融合成为了人机智能系统的核心要求。 运动协作。 可穿戴机器人和工业机器人作为典型的人机系 2.4人在回路的人机系统优化 统,所面对任务场景的多样性使得其迅速成为了 随着人机智能系统的不断发展,人机交互过 人机系统运动协作研究方向的热点对象。 程中机器被赋予的“控制权”也越来越高,然而人 在可穿戴机器人领域,其运动协作的核心问 机系统所面临的许多问题往往具有复杂性、不确 题在于如何让机器人能够自然跟随穿戴者在不同 定性和开放性,这些特性导致机器人系统在人机 地形下的不同运动步态,因此其关键技术在于不 交互过程中始终存在一定风险。为了提高人机智 同地形下的步态建模和步态规划。ZOu等针对 能系统的置信度,必须引入人员监督和参与,构 不同斜坡坡度的可穿戴机器人步态轨迹规划问 建人在环路的混合增强智能。人在环路的混合增 题,提出了一种基于传统捕捉点(CP)理论和动态 强智能被定义为一种需要人类交互的智能模型啊, 运动基元(DMP)方法的自适应步态规划方法,该 在包含这类模型的人机智能系统中,人始终是系 方法可以生成适应于不同坡度的步态轨迹,并能 统的一部分,对于机器人系统给出的执行结果, 够有效作用于实际的人机智能系统中。类似的, 人始终会对结果做进一步的判断,即人在环路的 Chen6-3等也是在DMP方法的基础上,结合机器 人机系统优化。 学习方法来动态调整DMPs方法中的模型参数, 在人在环路的人机系统优化中,大多数的研 最终生成适应于当前地形和运动情况下的步态轨 究集中于将人的生理信息,例如人体代谢率等作 迹。他们将该方法框架应用于上楼梯和平地 为系统指标,通过建立优化模型干预优化人机智 行走可场景下,实现了人机智能系统在不同地形 能系统中的控制参数s。Zhang等7将用户的代 下的动态平衡和动作协作;Deng等B1针对可穿戴 谢率作为系统指标,通过代谢模型来估计并优化 机器人上楼梯的任务场景,提出了一种新型的人 单踝外骨骼行走过程中的控制律,最终使穿戴者 引导外骨骼机器人的运动协作策略,采用自适应 代谢能耗减少了24.2%;类似的,Ding等a8.41 控制器解决了动力学模型参数的不确定性问题。 人使用贝叶斯优化方法来优化外骨骼行走过程中 该策略最终应用在实际系统中,可以帮助穿戴者 髋关节的控制参数8和人机系统的步行频率, 在无拐杖的情况下完成可穿戴机器人上楼梯的任 有效地减少了穿戴者的代谢能耗。Thatte等B提 务。与上述针对截瘫患者的可穿戴机器人运动协 出了一种适用于下肢外骨骼和智能假肢的基于定 作不同,针对偏瘫患者的人机运动协作实现难度 性偏好反馈的人在环路的控制策略优化算法,该 较为轻松,Bortole39和Unluhisarcikli等利用穿 方法在贝叶斯优化方法的基础上结合了基于用户 戴者健侧腿的运动学信息,来对穿戴患者侧腿的 偏好的学习算法,可以更准确高效的优化人机智 步态进行规划,以完成人机智能系统在不同的地 能系统。 形的运动协作。 除了穿戴者的生理信息,另一部分学者将目 在工业协作机器人领域,由于其面临的任务 光关注到了人机智能系统的紧耦合物理部分,以 场景过于灵活多变,因此其运动协作的核心关键 人机之间的交互力作为系统指标,通过增强学习 在于人机智能系统的控制方法上。随着人与机械 方法来优化并学习人机智能系统控制器的参数, 臂的近距离接触,拖动示教方法已被广泛应用于 最终达到人在回路的人机系统优化。Huang等s 协作机器人中,其中部分机器人还集成了视觉系 利用增强学习来学习灵敏度放大控制方法中的模 统,可以通过观察用户的运动进行学习和调整。 型参数,有效地减少了人机智能系统之间的人机 K.Darvish等)针对装配任务,提出了一个人机 交互力,并在实际系统平台上进行了验证。为了 运动协作框架,该框架通过用户手腕上配戴的可 进一步降低人机交互力,他们还提出了一种层次 穿戴设备捕捉用户的运动轨迹,从而控制机器人 交互学习策略s2s1。采用动态运动基元(DMPs)
2.3 人机系统运动协作 对于人机系统的不同任务,一个挑战性的问 题是如何实现人和机器人系统的运动协作。随着 人机系统应用领域的逐渐增加,其面对的任务场 景需求也逐渐的多元化,因此在不同任务场景需 求下采用不同运动模型和控制策略以保证人机之 间的自然融合成为了人机智能系统的核心要求。 可穿戴机器人和工业机器人作为典型的人机系 统,所面对任务场景的多样性使得其迅速成为了 人机系统运动协作研究方向的热点对象。 在可穿戴机器人领域,其运动协作的核心问 题在于如何让机器人能够自然跟随穿戴者在不同 地形下的不同运动步态,因此其关键技术在于不 同地形下的步态建模和步态规划。Zou 等 [35] 针对 不同斜坡坡度的可穿戴机器人步态轨迹规划问 题,提出了一种基于传统捕捉点 (CP) 理论和动态 运动基元 (DMP) 方法的自适应步态规划方法,该 方法可以生成适应于不同坡度的步态轨迹,并能 够有效作用于实际的人机智能系统中。类似的, Chen[36-37] 等也是在 DMP 方法的基础上,结合机器 学习方法来动态调整 DMPs 方法中的模型参数, 最终生成适应于当前地形和运动情况下的步态轨 迹。他们将该方法框架应用于上楼梯[36] 和平地 行走[37] 场景下,实现了人机智能系统在不同地形 下的动态平衡和动作协作;Deng 等 [38] 针对可穿戴 机器人上楼梯的任务场景,提出了一种新型的人 引导外骨骼机器人的运动协作策略,采用自适应 控制器解决了动力学模型参数的不确定性问题。 该策略最终应用在实际系统中,可以帮助穿戴者 在无拐杖的情况下完成可穿戴机器人上楼梯的任 务。与上述针对截瘫患者的可穿戴机器人运动协 作不同,针对偏瘫患者的人机运动协作实现难度 较为轻松,Bortole[39] 和 Unluhisarcikli[40] 等利用穿 戴者健侧腿的运动学信息,来对穿戴患者侧腿的 步态进行规划,以完成人机智能系统在不同的地 形的运动协作。 在工业协作机器人领域,由于其面临的任务 场景过于灵活多变,因此其运动协作的核心关键 在于人机智能系统的控制方法上。随着人与机械 臂的近距离接触,拖动示教方法已被广泛应用于 协作机器人中[41] ,其中部分机器人还集成了视觉系 统,可以通过观察用户的运动进行学习和调整[42]。 K. Darvish 等 [43] 针对装配任务,提出了一个人机 运动协作框架,该框架通过用户手腕上配戴的可 穿戴设备捕捉用户的运动轨迹,从而控制机器人 系统做出对应的运动。同样的,Darvish 等 [44] 也提 出一个名为 FlexHRC 的工业协作机器人协作框 架,该协作框架集传感、理解、规划和控制结构于 一体,通过可穿戴传感设备进行用户意图识别以 及协作模式的选择,最终根据协作模式对机器人 系统的运动轨迹进行规划,完成人机智能系统的 运动协作。 2.4 人在回路的人机系统优化 随着人机智能系统的不断发展,人机交互过 程中机器被赋予的“控制权”也越来越高,然而人 机系统所面临的许多问题往往具有复杂性、不确 定性和开放性,这些特性导致机器人系统在人机 交互过程中始终存在一定风险。为了提高人机智 能系统的置信度,必须引入人员监督和参与,构 建人在环路的混合增强智能。人在环路的混合增 强智能被定义为一种需要人类交互的智能模型[45] , 在包含这类模型的人机智能系统中,人始终是系 统的一部分,对于机器人系统给出的执行结果, 人始终会对结果做进一步的判断,即人在环路的 人机系统优化。 在人在环路的人机系统优化中,大多数的研 究集中于将人的生理信息,例如人体代谢率等作 为系统指标,通过建立优化模型干预优化人机智 能系统中的控制参数[46]。Zhang 等 [47] 将用户的代 谢率作为系统指标,通过代谢模型来估计并优化 单踝外骨骼行走过程中的控制律,最终使穿戴者 代谢能耗减少了 24.2%;类似的,Ding 等 [ 4 8 - 4 9 ] 人使用贝叶斯优化方法来优化外骨骼行走过程中 髋关节的控制参数[48] 和人机系统的步行频率[49] , 有效地减少了穿戴者的代谢能耗。Thatte 等 [50] 提 出了一种适用于下肢外骨骼和智能假肢的基于定 性偏好反馈的人在环路的控制策略优化算法,该 方法在贝叶斯优化方法的基础上结合了基于用户 偏好的学习算法,可以更准确高效的优化人机智 能系统。 除了穿戴者的生理信息,另一部分学者将目 光关注到了人机智能系统的紧耦合物理部分,以 人机之间的交互力作为系统指标,通过增强学习 方法来优化并学习人机智能系统控制器的参数, 最终达到人在回路的人机系统优化。Huang 等 [51] 利用增强学习来学习灵敏度放大控制方法中的模 型参数,有效地减少了人机智能系统之间的人机 交互力,并在实际系统平台上进行了验证。为了 进一步降低人机交互力,他们还提出了一种层次 交互学习策略[52-53]。采用动态运动基元 (DMPs) 第 2 期 程洪,等:人机智能技术及系统研究进展综述 ·389·
·390· 智能系统学报 第15卷 和局部加权回归(LWR)对高阶运动轨迹进行建 模和学习,采用强化学习(RL)对基于模型的低阶 控制器进行学习,最终在单自由度的系统平台上 验证了所提策略的有效性。考虑到系统优化参数 的泛化性,Hamaya等s定义了一个任务参数化 的辅助控制策略,利用机器学习方法对多组不同 任务下的人机交互数据进行学习,得到了一组泛 化能力强的辅助控制策略参数,有效地减少了人 影响处理平台患者手术平台 医生控制台 机交互力。 图2达芬奇手术机器人系统 3典型人机智能系统及其应用 Fig.2 Da Vinci surgical robot system 由外科医生和手术机器人构成的人机智能系 基于上述人机智能系统关键技术的不断提升 统,相较于传统人工手术,其主要优势在于通过 和进步,人机智能系统的应用范围和产业规模正 将生物智能与机器智能相结合,实现人与机器的 在不断的扩大,本节将针对现阶段3类典型的人 优势互补。机器相较于人类,在执行手术操作时 机智能系统及其应用场景进行介绍。 动作更加稳定、精准,不会因为长时间高强度的 3.1医疗康复机器人 工作而产生疲劳和抖动,而作为手术机器人操作 人机智能在医疗康复机器人领域的应用,对 者的外科医生,对于未知的复杂情况具有更优秀 于传统医学而言,在理念上和技术上都产生了重 的决策能力,能够可靠地处置手术中千变外化的 大影响,成为了现代医学领域必不可少的重要组 突发情况。所以,只有通过精准、自然的人机协 成部分。医疗康复机器人能够突破现有机器人 同工作,才能够保证外科手术在安全、稳定、精确 技术的局限性,将人与机器有机融合,凭借机器 的操作下进行。 人对于生物和环境等信息的强大感知、获取和运 3.1.2康复外骨骼机器人 算能力,结合人脑对于未知复杂情况所具有的优 随着全球人口老龄化以及残疾人群体的不 秀的决策能力,实现人机的优势互补。因此,人 断扩大,对应的医疗需求也在不断增长。康复外 机智能系统在医疗康复机器人领域应用的重要特 骨骼机器人能够使下肢偏瘫或截瘫患者在直立 点是人与机器在交互环境中的共同协作。目前人 的状态下进行步态康复训练,这样不但可以提高 机智能系统在医疗康复机器人领域的研究和应用 患者康复训练积极性,加速患者功能恢复,同时 热点主要包括手术机器人、康复机器人以及智能 对患者消化系统、循环系统以及心理状态的恢复 假肢5。 也都有着显著作用6,这些研究都说明相较于传 3.1.1手术机器人 统的康复设备,康复外骨骼拥有更加全面的康复 手术机器人是一种辅助外科医生进行手术的 效果。 早期的康复外骨骼机器人结构简单,功能较 智能机械设备,它是医疗康复机器人的重要组成 部分例。以达芬奇手术机器人(见图2)为代表的 为单一,传感系统不够完善,康复机器人穿戴者 只能作为被动接受康复训练者的角色,通过控制 手术机器人已经将外科手术的精度和可行性提升 器按键,触发预先规划的固定运动曲线进行康复 到一个全新的高度$侧,手术机器人正在逐步普及 训练,穿戴者和机器人之间属于“命令-执行”的关 并开创一种全新的手术模式。 系,人机系统耦合性较弱6。国外具有代表性的 手术机器人的发展势头之所以能够如此猛 康复外骨骼产品主要包括:以色列“Rewalk”公司 烈,得益于其自身的3个主要优点:1)手术机器 的康复下肢外骨骼6(图3(a),它能够通过姿态传 人的高精度视觉系统,可以扩宽医生的手术视 感器,检测穿戴者的肢体动作和重心的变化,模 野,帮助医生更加准确地确定手术位置;2)自由 仿人类自然行走的步态,并能根据实际情况控制 度高的机械手使手术机器人在执行任务时更加灵 步行速度。美国“Eks0”外骨骼机器人6(图3b) 活,能够在最佳手术姿态下完成对患者的治疗; 创建了3种不同的康复模式,用户可根据自身康 3)能够避免手术医生双手的生理震颤,实现精准 复情况选择对应模式进行康复训练。国内康复外 切除,减少患者出血量。 骨骼机器人市场主要有大艾外骨骼机器人“AiLegs'6例
和局部加权回归 (LWR) 对高阶运动轨迹进行建 模和学习,采用强化学习 (RL) 对基于模型的低阶 控制器进行学习,最终在单自由度的系统平台上 验证了所提策略的有效性。考虑到系统优化参数 的泛化性,Hamaya 等 [54] 定义了一个任务参数化 的辅助控制策略,利用机器学习方法对多组不同 任务下的人机交互数据进行学习,得到了一组泛 化能力强的辅助控制策略参数,有效地减少了人 机交互力。 3 典型人机智能系统及其应用 基于上述人机智能系统关键技术的不断提升 和进步,人机智能系统的应用范围和产业规模正 在不断的扩大,本节将针对现阶段 3 类典型的人 机智能系统及其应用场景进行介绍。 3.1 医疗康复机器人 人机智能在医疗康复机器人领域的应用,对 于传统医学而言,在理念上和技术上都产生了重 大影响,成为了现代医学领域必不可少的重要组 成部分[55]。医疗康复机器人能够突破现有机器人 技术的局限性,将人与机器有机融合,凭借机器 人对于生物和环境等信息的强大感知、获取和运 算能力,结合人脑对于未知复杂情况所具有的优 秀的决策能力,实现人机的优势互补。因此,人 机智能系统在医疗康复机器人领域应用的重要特 点是人与机器在交互环境中的共同协作。目前人 机智能系统在医疗康复机器人领域的研究和应用 热点主要包括手术机器人、康复机器人以及智能 假肢[56]。 3.1.1 手术机器人 手术机器人是一种辅助外科医生进行手术的 智能机械设备,它是医疗康复机器人的重要组成 部分[57]。以达芬奇手术机器人 (见图 2) 为代表的 手术机器人已经将外科手术的精度和可行性提升 到一个全新的高度[58] ,手术机器人正在逐步普及 并开创一种全新的手术模式。 手术机器人的发展势头之所以能够如此猛 烈,得益于其自身的 3 个主要优点[59] :1) 手术机器 人的高精度视觉系统,可以扩宽医生的手术视 野,帮助医生更加准确地确定手术位置;2) 自由 度高的机械手使手术机器人在执行任务时更加灵 活,能够在最佳手术姿态下完成对患者的治疗; 3) 能够避免手术医生双手的生理震颤,实现精准 切除,减少患者出血量。 影响处理平台 患者手术平台 医生控制台 图 2 达芬奇手术机器人系统 Fig. 2 Da Vinci surgical robot system 由外科医生和手术机器人构成的人机智能系 统,相较于传统人工手术,其主要优势在于通过 将生物智能与机器智能相结合,实现人与机器的 优势互补。机器相较于人类,在执行手术操作时 动作更加稳定、精准,不会因为长时间高强度的 工作而产生疲劳和抖动,而作为手术机器人操作 者的外科医生,对于未知的复杂情况具有更优秀 的决策能力,能够可靠地处置手术中千变外化的 突发情况。所以,只有通过精准、自然的人机协 同工作,才能够保证外科手术在安全、稳定、精确 的操作下进行。 3.1.2 康复外骨骼机器人 随着全球人口老龄化以及残疾人群体的不 断扩大,对应的医疗需求也在不断增长。康复外 骨骼机器人能够使下肢偏瘫或截瘫患者在直立 的状态下进行步态康复训练,这样不但可以提高 患者康复训练积极性,加速患者功能恢复,同时 对患者消化系统、循环系统以及心理状态的恢复 也都有着显著作用[60] ,这些研究都说明相较于传 统的康复设备,康复外骨骼拥有更加全面的康复 效果。 早期的康复外骨骼机器人结构简单,功能较 为单一,传感系统不够完善,康复机器人穿戴者 只能作为被动接受康复训练者的角色,通过控制 器按键,触发预先规划的固定运动曲线进行康复 训练,穿戴者和机器人之间属于“命令−执行”的关 系,人机系统耦合性较弱[61]。国外具有代表性的 康复外骨骼产品主要包括:以色列“Rewalk”公司 的康复下肢外骨骼[62] (图 3(a)),它能够通过姿态传 感器,检测穿戴者的肢体动作和重心的变化,模 仿人类自然行走的步态,并能根据实际情况控制 步行速度。美国“Ekso”外骨骼机器人[63] (图 3(b)) 创建了 3 种不同的康复模式,用户可根据自身康 复情况选择对应模式进行康复训练。国内康复外 骨骼机器人市场主要有大艾外骨骼机器人“AiLegs”[64] ·390· 智 能 系 统 学 报 第 15 卷