第16卷第1期 智能系统学报 Vol.16 No.1 2021年1月 CAAI Transactions on Intelligent Systems Jan.2021 D0:10.11992/tis.202007025 室外未知环境下的AGV地貌主动探索感知 张威',葛泉波2,刘华平3,孙富春3 (1.上海海事大学物流工程学院,上海201306,2.同济大学电子与信息工程学院,上海201804,3.清华大学计算 机科学与技术系,北京100084) 摘要:智能机器人对复杂地貌环境的识别一直是机器人应用领域研究的前沿问题,移动机器人在不同的地貌 上采取的运动方式并非一成不变,所以选择的运动方式对于迅速准确识别所处地貌的类型至关重要。针对该 问题本文提出了一种基于贝叶斯框架的主动感知探索方法,使移动机器人能够主动探索有兴趣的运动方式并 且感知识别和运动之间的匹配关系,可以优化在地貌识别之中的模糊不确定性;为了进一步验证实验的可靠 性,还使用了被动感知策略来比较和分析不同策略之间的差异。实验结果表明:主动感知方法能够规划出有效 的地貌识别动作序列,能够引导移动机器人主动感知目标地貌,该框架对于室外未知环境下主动感知后的地貌 识别效果优于被动感知。 关键词:移动机器人;运动方式;贝叶斯框架:主动感知;被动感知;地貌识别:振动数据;室外地貌 中图分类号:TP391文献标志码:A文章编号:1673-4785(2021)01-0152-10 中文引用格式:张威,葛泉波,刘华平,等.室外未知环境下的AGV地貌主动探索感知.智能系统学报,2021,16(1): 152-161. 英文引用格式:ZHANG Wei,,GE Quanbo,LIU Huaping,.etal.AGV active landform exploration and perception in an unknown outdoor environmentJ].CAAI transactions on intelligent systems,2021,16(1):152-161. AGV active landform exploration and perception in an unknown outdoor environment ZHANG Wei,GE Quanbo',LIU Huaping',SUN Fuchun' (1.Logistics Engineering College,Shanghai Maritime University,Shanghai 201306,China;2.School of Electronics and Information Engineering,Tongji University,Shanghai 201804,China;3.Department of Computer Science and Technology,Tsinghua University, Beijing 100084,China) Abstract:The recognition of a complex landform environment by an intelligent robot has been the frontier problem of research in the field of robotics applications.The motion modes adopted by mobile robots differ between landforms,so the selected motion mode is crucial for quickly and accurately identifying the type of landform.To solve this problem, an active perception exploration method is proposed in this paper based on a Bayesian framework.It enables mobile ro- bots to actively explore interesting motion modes and recognize the matching relationship between landform and move- ment.It can optimize the fuzzy uncertainty in landform recognition.To further verify the reliability of the experiment, we also use a passive recognition strategy to compare and analyze the differences between different strategies.The ex- perimental results show that the active perception method can plan effective landform recognition action sequences and guide mobile robots to actively perceive the target landform.The landform recognition effect of active perception is bet- ter than that of passive perception in an unknown outdoor environment. Keywords:mobile robot;movement methods;bayesian framework;active perception;passive perception;geomorphic recognition;vibration data;outdoor geomorphology 收稿日期:2020-07-12. 移动机器人行驶在复杂的环境中,如:火星和 基金项目:国家自然科学基金项目(61773147,U1509203:浙江 省自然科学基金项目(LR17F030005). 月球表面、火灾和战争现场等,在这些危险地带 通信作者:刘华平.E-mail:hpliu(@tsinghua.edu.cn 或者是遥远的不适合远程控制的时候,机器人
DOI: 10.11992/tis.202007025 室外未知环境下的 AGV 地貌主动探索感知 张威1 ,葛泉波2 ,刘华平3 ,孙富春3 (1. 上海海事大学 物流工程学院,上海 201306; 2. 同济大学 电子与信息工程学院,上海 201804; 3. 清华大学 计算 机科学与技术系 ,北京 100084) 摘 要:智能机器人对复杂地貌环境的识别一直是机器人应用领域研究的前沿问题,移动机器人在不同的地貌 上采取的运动方式并非一成不变,所以选择的运动方式对于迅速准确识别所处地貌的类型至关重要。针对该 问题本文提出了一种基于贝叶斯框架的主动感知探索方法,使移动机器人能够主动探索有兴趣的运动方式并 且感知识别和运动之间的匹配关系,可以优化在地貌识别之中的模糊不确定性;为了进一步验证实验的可靠 性,还使用了被动感知策略来比较和分析不同策略之间的差异。实验结果表明:主动感知方法能够规划出有效 的地貌识别动作序列,能够引导移动机器人主动感知目标地貌,该框架对于室外未知环境下主动感知后的地貌 识别效果优于被动感知。 关键词:移动机器人;运动方式;贝叶斯框架;主动感知;被动感知;地貌识别;振动数据;室外地貌 中图分类号:TP391 文献标志码:A 文章编号:1673−4785(2021)01−0152−10 中文引用格式:张威, 葛泉波, 刘华平, 等. 室外未知环境下的 AGV 地貌主动探索感知 [J]. 智能系统学报, 2021, 16(1): 152–161. 英文引用格式:ZHANG Wei, GE Quanbo, LIU Huaping, et al. AGV active landform exploration and perception in an unknown outdoor environment[J]. CAAI transactions on intelligent systems, 2021, 16(1): 152–161. AGV active landform exploration and perception in an unknown outdoor environment ZHANG Wei1 ,GE Quanbo2 ,LIU Huaping3 ,SUN Fuchun3 (1. Logistics Engineering College, Shanghai Maritime University, Shanghai 201306, China; 2. School of Electronics and Information Engineering, Tongji University, Shanghai 201804, China; 3. Department of Computer Science and Technology, Tsinghua University, Beijing 100084, China) Abstract: The recognition of a complex landform environment by an intelligent robot has been the frontier problem of research in the field of robotics applications. The motion modes adopted by mobile robots differ between landforms, so the selected motion mode is crucial for quickly and accurately identifying the type of landform. To solve this problem, an active perception exploration method is proposed in this paper based on a Bayesian framework. It enables mobile robots to actively explore interesting motion modes and recognize the matching relationship between landform and movement. It can optimize the fuzzy uncertainty in landform recognition. To further verify the reliability of the experiment, we also use a passive recognition strategy to compare and analyze the differences between different strategies. The experimental results show that the active perception method can plan effective landform recognition action sequences and guide mobile robots to actively perceive the target landform. The landform recognition effect of active perception is better than that of passive perception in an unknown outdoor environment. Keywords: mobile robot; movement methods; bayesian framework; active perception; passive perception; geomorphic recognition; vibration data; outdoor geomorphology 移动机器人行驶在复杂的环境中,如:火星和 月球表面、火灾和战争现场等,在这些危险地带 或者是遥远的不适合远程控制的时候[1-2] ,机器人 收稿日期:2020−07−12. 基金项目:国家自然科学基金项目 (61773147,U1509203);浙江 省自然科学基金项目 (LR17F030005). 通信作者:刘华平. E-mail:hpliu@tsinghua.edu.cn. 第 16 卷第 1 期 智 能 系 统 学 报 Vol.16 No.1 2021 年 1 月 CAAI Transactions on Intelligent Systems Jan. 2021
·153· 张威,等:室外未知环境下的AGV地貌主动探索感知 第1期 若能够拥有像人类一样不仅和地面进行振动式的 确的地形环境特征,但是大量的数据处理起来很 接触,而且能够感知到并且有目的选择运动的方 繁重,需要的训练样本集庞大,此外,移动机器人 式,通过探索性的过程,自主增强感知正在行驶 以不同速度或者不同的运动方式行驶时,对所得 或者即将行驶在正发生着变化的地面类型上,可 到的分类影响也不小22,但是这也反应出移动 靠、高效的地貌感知系统能够准确地让移动机器 机器人对于某种地貌下的低水平和高水平识别的 人探索出地面的几何特性和非几何特性),这很 运动方式:随着人工智能的不断发展,传统的机 大程度上决定着移动机器人的自主移动性,甚至 器学习分类方法28,、卷积神经网络(convolutional 是后期的任务是否圆满完成。 neural networks,CNN)和无监督学习s0的智能算 当前,许多专家学者已经对多种传感器的地 法更多地被用于地貌识别,这些用于地貌的硬分 形分类做了研究,研究最多的是基于视觉41、雷 类机器学习算法是对单个特征样本进行所属地面 达0、触觉山以及多传感器融合2的地貌分类 类型的识别,对于连续观测样本之间的时间相关 方法,视觉最容易受到外部光线的干扰,雷达也 性是不考虑的。 会因为天气的影响而失效,小型移动机器人会受 所以在本文中,提出了一种新颖的地貌探测 到自身体积和空间的限制,搭载太多的设备会存 识别方法,它允许移动机器人自主地探索在某种 在困难;最早在2002年麻省理工学院的lagne- 地貌上感兴趣的运动方式,从而可以获得更好的 mma等61提出利用振动信号的特征对地面进行 信息改善感知,本文的方法是由一种振动感知的 分类,这相比于传统的基于激光雷达或者是视觉 贝叶斯公式和主动的运动探索策略组成,贝叶斯 技术镜像的感官方法能够有效地避免几何危害四, 公式和动作顺序分析方法允许机器人自主地积累 但是很大程度上易受到光照和地面遮盖物的干 证据并做出正在探索地貌类别的运动动作决定, 扰,严重影响到对非几何危害的识别能力20-22。 这种主动的运动策略有目的的使移动机器人选择 尽管基于振动的方法能够感知地面承载层的信 低水平或者高水平识别所处地貌的运动方式。 息,但一直以来机器人仅仅被动地收集振动传感 1移动机器人主动地貌识别问题描述 器反馈得到的信号作为地形识别的依据,再对获 取的大量信号采取适当的方法进行特征表达,常 本文以Autolabor Pro1移动机器人基础平台 用到的是时域分析法和频域分析法32刈提取对应 设计了主动地貌感知方法,整个主动地貌识别系 地貌特征信息,尽管其中的一些方法可以获得准 统如图1所示。 =1动作1 主动地貌识别 0.2m/s 前进 我身处何处? =2动作6 1.0 0.4m/s 后退 0.5 23456 动 =9动作9 择 三轴振动 向 0. 传感器 转弯 34567 ◆信号采集 仁10动作10 ◆地貌识别 ◆运动状态 喜 识别目标的信念 56 图1主动地貌探索感知 Fig.1 Active landscape exploration perception 其中,移动机器人身处未知地形之中,只有一 感器负责感知与未知地面交互产生的振动信息, 种位于车底盘附近,靠近地面位置的三轴振动传 在此情况下,并不能可视周围地貌状况,所以也不
若能够拥有像人类一样不仅和地面进行振动式的 接触,而且能够感知到并且有目的选择运动的方 式,通过探索性的过程,自主增强感知正在行驶 或者即将行驶在正发生着变化的地面类型上,可 靠、高效的地貌感知系统能够准确地让移动机器 人探索出地面的几何特性和非几何特性[3] ,这很 大程度上决定着移动机器人的自主移动性,甚至 是后期的任务是否圆满完成。 当前,许多专家学者已经对多种传感器的地 形分类做了研究,研究最多的是基于视觉[4-8] 、雷 达 [9-10] 、触觉[11] 以及多传感器融合[12-15] 的地貌分类 方法,视觉最容易受到外部光线的干扰,雷达也 会因为天气的影响而失效,小型移动机器人会受 到自身体积和空间的限制,搭载太多的设备会存 在困难;最早在 2002 年麻省理工学院的 Iagnemma 等 [16-18] 提出利用振动信号的特征对地面进行 分类,这相比于传统的基于激光雷达或者是视觉 技术镜像的感官方法能够有效地避免几何危害[19] , 但是很大程度上易受到光照和地面遮盖物的干 扰,严重影响到对非几何危害的识别能力[20-22]。 尽管基于振动的方法能够感知地面承载层的信 息,但一直以来机器人仅仅被动地收集振动传感 器反馈得到的信号作为地形识别的依据,再对获 取的大量信号采取适当的方法进行特征表达,常 用到的是时域分析法和频域分析法[23-24] 提取对应 地貌特征信息,尽管其中的一些方法可以获得准 确的地形环境特征,但是大量的数据处理起来很 繁重,需要的训练样本集庞大,此外,移动机器人 以不同速度或者不同的运动方式行驶时,对所得 到的分类影响也不小[25-26] ,但是这也反应出移动 机器人对于某种地貌下的低水平和高水平识别的 运动方式;随着人工智能的不断发展,传统的机 器学习分类方法[28] 、卷积神经网络 (convolutional neural networks, CNN) 和无监督学习[29-30] 的智能算 法更多地被用于地貌识别,这些用于地貌的硬分 类机器学习算法是对单个特征样本进行所属地面 类型的识别,对于连续观测样本之间的时间相关 性是不考虑的。 所以在本文中,提出了一种新颖的地貌探测 识别方法,它允许移动机器人自主地探索在某种 地貌上感兴趣的运动方式,从而可以获得更好的 信息改善感知,本文的方法是由一种振动感知的 贝叶斯公式和主动的运动探索策略组成,贝叶斯 公式和动作顺序分析方法允许机器人自主地积累 证据并做出正在探索地貌类别的运动动作决定, 这种主动的运动策略有目的的使移动机器人选择 低水平或者高水平识别所处地貌的运动方式。 1 移动机器人主动地貌识别问题描述 本文以 Autolabor Pro 1 移动机器人基础平台 设计了主动地貌感知方法,整个主动地貌识别系 统如图 1 所示。 主动地貌识别 0.2 m/s 前进 0.4 m/s 后退 向左 转弯 向右 转弯 我身处何处? 三轴振动 传感器 信号采集 地貌识别 运动状态 识别目标的信念 1.2 0 10 t=1 动作 1 t=2 动作 6 t=9 动作 9 t=10 动作 10 20 30 40 50 60 0 10 20 30 40 50 60 0 10 20 30 40 50 60 0 10 20 30 40 50 60 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1.1 1.0 0.9 0.8 1.2 1.1 1.0 0.9 0.8 1.2 1.1 1.0 0.9 0.8 1.2 1.1 1.0 0.9 0.8 1.0 0.5 0 1.0 0.5 0 1.0 0.5 0 1.0 0.5 0 主 动 选 择 加速度值 加速度值 加速度值 加速度值 样本序列 样本序列 样本序列 样本序列 图 1 主动地貌探索感知 Fig. 1 Active landscape exploration perception 其中,移动机器人身处未知地形之中,只有一 种位于车底盘附近,靠近地面位置的三轴振动传 感器负责感知与未知地面交互产生的振动信息, 在此情况下,并不能可视周围地貌状况,所以也不 ·153· 张威,等:室外未知环境下的 AGV 地貌主动探索感知 第 1 期
第16卷 智能系统学报 ·154· 会有太大的动作范围感知所处的地形,这样只能 2,…,N(W=14)定义;探索时间1是移动机器人与 通过选择自身的不同运动状态,在一个较小的运 每种地貌交互时所进行动作的顺序;二,代表着观 动范围快速感知所处的地貌。然而,常规的地貌 测值,而对于每一个地貌类别,,分别是由相应探 识别在观测噪声较大、有遮挡、光线条件不足等复 索时间1收集的交互振动信号组成;P(sl)是后 杂场景下对于目标跟踪预测表现得并不是很优秀。 验概率;P(snk-)和P(zsn)分别是探索时间t时 本文研究的地面识别方法是在对外界环境不 的先验概率和似然概率密度,只有>0,才有在探 明确的状况下,移动机器人系统选择一套高效的 索时间仁1时的后验概率对先验概率进行更新:边 运动状态快速感知所处地貌,将主动感知的方法 缘概率P(z-)需要在0,1]做适当的归一化处理。 运用于基于振动信号的移动机器人地貌分类实验 采集10种运动状态 中,使得移动机器人可获得更多有利信息,减少 下的14种地貌数据 地貌识别中的不确定性;贝叶斯方法和主动探索 行为相结合应用于14种地貌分类实验中,不需要 训练模型,计算量少。 数据预处理 主动挑选下一动作 2主动感知算法描述 贝叶斯概率方法 低感知和高感知 概率模型在开发机器人的应用中提供了一种 计算后验概率 探索动作 有效的方法,例如移动机器人通过与环境的交互 N 来感知和学习。在本文的研究中使用贝叶斯公式 是否大于置信 N 执行动作数是 并结合序列分析方法,利用移动机器人的运动方 网值 否大于10 式和振动信息,为地貌类别的感知和探索提供了 一个精确的框架。贝叶斯主动感知系统如图2 Y 所示,主要由3个部分组成:物理层面、感知层面 地貌感知最好的 选择最大的后验概 和决策层面。在物理层面包含机-地交互振动数 决策动作 率采取的运动状态 据采集和数据预处理;接下来的感知层是利用贝 图2贝叶斯主动感知系统 叶斯公式处理分析,这个过程迭代地积累证据直 Fig.2 Bayesian active perception system 到超过信念阈值:最终,决策层评估每个探索动 2.1.2先验概率 作的后验概率,以评估是否需要更多的传感器测 假设所有被探索的实验对象初始都符合均匀 量或有足够的信息来作出决定,其中总的探索动 分布的先验概率密度。目标探索过程的初始先验 作设定为10种,具体运动方式命名如下:左转弯 概率定义为 (LT)、右转弯(RT)、0.2m/s前进(LSF)、0.4m/s前 1 P(s.)=P(sako)=N (2) 进(MSF)、0.6m/s前进(MHSF)、0.8m/s前进 (HSF)、0.2m/s后退(LSB)、0.4m/s后退(MSB)、 式中:Sn代表着地貌类别;则代表着在=0初始 0.6m/s后退(MHSB)、0.8m/s后退(HSB)。 状态感知的交互振动;W代表着用于探索的测试 2.1贝叶斯振动感知 对象的数量。 2.1.3测量模型和似然概率评估 概率模型为开发机器人领域的鲁棒应用提供 了一种灵活的方法,以贝叶斯方法为基础,构建地 交互振动信号由安装在移动机器人底盘靠近 貌知识库相对于观测特征集的后验概率,并据此 车轮附近的三轴振动传感器感知得到,利用这些 建立观测特征集与已编目地貌相似程度的度量。 信号建立了基于直方图的非参数测量模型,Mar- 2.1.1构建贝叶斯振动感知概率模型 tinez-Hernandez等Bu也做过类似的工作,直方图 贝叶斯概率公式从先验概率和似然的乘积递 可以清楚地显示在探索时间1处评估每个观察 归地估计后验概率,采用信念阈值交叉分析的序 ,的分布情况,并估算感知地貌类别s.的似然概 列分析方法,控制地貌识别过程的自动停止,贝 率,测量模型为 叶斯方法为 hen (b) P.(blsn)= (3) P(sm,)P(zls)P(sal-1) p(sb)-p(ak-) (1) ∑h6 P(zl3-1) 式中:要被评估的对象地貌类别用sm∈n=1, 式中:b表示直方图间隔数;hn(b)表示对应地貌
会有太大的动作范围感知所处的地形,这样只能 通过选择自身的不同运动状态,在一个较小的运 动范围快速感知所处的地貌。然而,常规的地貌 识别在观测噪声较大、有遮挡、光线条件不足等复 杂场景下对于目标跟踪预测表现得并不是很优秀。 本文研究的地面识别方法是在对外界环境不 明确的状况下,移动机器人系统选择一套高效的 运动状态快速感知所处地貌,将主动感知的方法 运用于基于振动信号的移动机器人地貌分类实验 中,使得移动机器人可获得更多有利信息,减少 地貌识别中的不确定性;贝叶斯方法和主动探索 行为相结合应用于 14 种地貌分类实验中,不需要 训练模型,计算量少。 2 主动感知算法描述 概率模型在开发机器人的应用中提供了一种 有效的方法,例如移动机器人通过与环境的交互 来感知和学习。在本文的研究中使用贝叶斯公式 并结合序列分析方法,利用移动机器人的运动方 式和振动信息,为地貌类别的感知和探索提供了 一个精确的框架。贝叶斯主动感知系统如图 2 所示,主要由 3 个部分组成:物理层面、感知层面 和决策层面。在物理层面包含机−地交互振动数 据采集和数据预处理;接下来的感知层是利用贝 叶斯公式处理分析,这个过程迭代地积累证据直 到超过信念阈值;最终,决策层评估每个探索动 作的后验概率,以评估是否需要更多的传感器测 量或有足够的信息来作出决定,其中总的探索动 作设定为 10 种,具体运动方式命名如下:左转弯 (LT)、右转弯 (RT)、0.2 m/s 前进 (LSF)、0.4 m/s 前 进 (MSF)、0.6 m/s 前进 (MHSF)、0.8 m/s前进 (HSF)、0.2 m/s 后退 (LSB)、0.4 m/s 后退 (MSB)、 0.6 m/s 后 退 (MHSB)、 0.8 m/s 后 退 (HSB)。 2.1 贝叶斯振动感知 概率模型为开发机器人领域的鲁棒应用提供 了一种灵活的方法,以贝叶斯方法为基础,构建地 貌知识库相对于观测特征集的后验概率,并据此 建立观测特征集与已编目地貌相似程度的度量。 2.1.1 构建贝叶斯振动感知概率模型 贝叶斯概率公式从先验概率和似然的乘积递 归地估计后验概率,采用信念阈值交叉分析的序 列分析方法,控制地貌识别过程的自动停止,贝 叶斯方法为 P(sn |zt)= P(sn,zt) P(zt |zt−1) = P(zt |sn)P(sn|zt−1) P(zt |zt−1) (1) 式中:要被评估的对象地貌类别 用 s n∈n =1, P(sn|zt) P(sn|zt−1) P(zt |sn) t P(zt |zt−1) 2,…, N(N=14) 定义;探索时间 t 是移动机器人与 每种地貌交互时所进行动作的顺序;zt 代表着观 测值,而对于每一个地貌类别,zt 分别是由相应探 索时间 t 收集的交互振动信号组成; 是后 验概率; 和 分别是探索时间 时 的先验概率和似然概率密度,只有 t>0,才有在探 索时间 t−1 时的后验概率对先验概率进行更新;边 缘概率 需要在 [0,1] 做适当的归一化处理。 采集10种运动状态 下的14种地貌数据 Y Y N N 数据预处理 贝叶斯概率方法 计算后验概率 是否大于置信 阈值 地貌感知最好的 决策动作 主动挑选下一动作 低感知和高感知 探索动作 执行动作数是 否大于10 选择最大的后验概 率采取的运动状态 图 2 贝叶斯主动感知系统 Fig. 2 Bayesian active perception system 2.1.2 先验概率 假设所有被探索的实验对象初始都符合均匀 分布的先验概率密度。目标探索过程的初始先验 概率定义为 P(sn) = P(sn|z0) = 1 N (2) 式中:sn 代表着地貌类别;z0 则代表着在 t=0 初始 状态感知的交互振动;N 代表着用于探索的测试 对象的数量。 2.1.3 测量模型和似然概率评估 交互振动信号由安装在移动机器人底盘靠近 车轮附近的三轴振动传感器感知得到,利用这些 信号建立了基于直方图的非参数测量模型,Martinez-Hernandez 等 [31] 也做过类似的工作,直方图 可以清楚地显示在探索时间 t 处评估每个观察 zt 的分布情况,并估算感知地貌类别 sn 的似然概 率,测量模型为 Pv (b|sn) = hv,n (b) ∑Nbins b=1 h(b) (3) 式中:b 表示直方图间隔数; hv,n (b) 表示对应地貌 第 16 卷 智 能 系 统 学 报 ·154·
·155· 张威,等:室外未知环境下的AGV地貌主动探索感知 第1期 类别sn的训练样本数据分布在直方图b中的样 想,由式(6)、(⑦)可以定义主动控制移动机器人 本计数。将采集的数据最大值和最小值之间划分 的探测动作,为 成Ns个间隔,均匀地构造直方图,P(blsn)最终 Mhigh arg max I (PM(t)) 被方4归一化为总和是1的概率。 PM Miow arg max I(PM(t)) (8) PM =1 通过上述评估方程对所有训练样本进行评 3实验 估,探索1时刻交互振动观测值:,的可能性为 log P.(d,(j)Is) 3.1实验平台 log P(zls)= (4) 人 Nsamples 本实验采用型号为Autolabor Prol(APl)的移 式中:d()表示传感器采集的样本;P(zs)是给 动机器人,平台如图3所示,其在室内外均可实现 定感知地貌类别sn的观测值z,的可能性。使用基 稳定作业,且适用于全地形,车身尺寸726mm× 于先前探索仁1观测结果的边际概率,确保正确 617mm×273mm,负载能力约50kg。AP1共具有 的归一化值为 4种速度档位,分别是0.2m/s、0.4m/s、0.6m/s和 0.8m/s。在移动机器人车身一侧,平行且靠近地 P(l-1)= P(zs)P(sk1) (5) 面的位置配备一个AKF392B三轴向加速度计,它 n=l 提供的输出速率范围为5~1000Hz,共有8种选 2.1.4主动地貌识别停止决策 择,偏差典型值小于01%,具有输出稳定,环境性 当贝叶斯更新过程的证据积累到超过了设定 能好等优点。加速度计采样频率选择200Hz采 的置信阈值,主动探索过程就会停止,地貌感知 集不同地形的三维振动信号。 类别是由最大后验估计得到的,表达为当任何 P(snl)>Breshold时,5=arg max P(sa,),其中5表示 在探索时刻1感知出的地貌类别,其中置信阈值 为Behd 2.2主动探索行为 当移动机器人被有目的地引导去探索对地貌 识别度高的运动方式以提高感知能力时,这种主 动探索行为受启发于人类对于周围环境的探索、 互动和操作,能够影响感知精度和反应时间,本 文的主动探索行为有别于传统的地貌识别中单一 图3实验采集平台 的动作模式下固定的阈值设置区别已知类地貌和 Fig.3 Experimental acquisition platform 未知地貌,考虑了移动机器人每一步的动作都会 3.2数据集 对下一步识别产生影响的特点,采用下列方式控 3.2.1地貌种类选择 制机器人的探索动作。 根据路面材质选取自然界中常见的若干类室 2.2.1预测误差 外地形,本实验中共涉及14类室外地形,如图4 预测误差即为贝叶斯更新的后验概率和用来 所示,分别是新修沥青路面(new asphalt)、粗糙混 作为决策标准的置信阈值之间的差距,贝叶斯更 凝土(rough concrete)、马赛克砖块路(mosaic 新的后验概率包含在每种地貌类别中探索时间 road)、废旧水泥砖块路(old cement brick road)、大 1处计算得到的概率为 理石块(marble cubes)、压实碎石子路面(com- pacted crushed stone road)、木板(wood)、覆盖落叶 e1(t)=P(Salz)-Bthreshold (6) 的土壤(deciduous soil)、茂盛草丛(lush grass)、枯 2.2.2低水平感知和高水平感知的预测模型 草地(dry grass)、粗石子(coarse stone)、鹅卵石 I(PM(t))=e,(t-1)e,(t) (7) (cobble)、松散沙土(loose sand)以及新修混凝土 式中:IPM()是在探索时间1的感知水平;e()、 (new concrete)。其中,松散砂土是起伏不平的路 e,(t-1)是当前探索时间1和前一探索时间1~1的 面,马赛克路是岩石材质组成的方格路面,新旧 预测误差,使用最低和最高的预测误差来模拟低 混凝土路面是使用年限不同而造成的路面损伤程 感知行为和高感知行为。结合内在动机模型的思 度不一,具体地貌类别如图4所示,采集地点均在
sn Nbins Pv (b|sn) ∑Nbins b=1 h(b) 类别 的训练样本数据分布在直方图 b 中的样 本计数。将采集的数据最大值和最小值之间划分 成 个间隔,均匀地构造直方图, 最终 被 归一化为总和是 1 的概率。 通过上述评估方程对所有训练样本进行评 估,探索 t 时刻交互振动观测值 zt 的可能性为 logP(zt |sn) = N∑samples j=1 logPv (dv (j)|sn) Nsamples (4) dv (j) P(zt 式中: 表示传感器采集的样本; |sn) 是给 定感知地貌类别 sn 的观测值 zt 的可能性。使用基 于先前探索 t=1 观测结果的边际概率,确保正确 的归一化值为 P(zt |zt−1) = ∑N n=1 P(zt |sn)P(sn|zt−1) (5) 2.1.4 主动地貌识别停止决策 P(sn|zt) > βthreshold s¯ = arg max S P(sn,zt) s¯ βthreshold 当贝叶斯更新过程的证据积累到超过了设定 的置信阈值,主动探索过程就会停止,地貌感知 类别是由最大后验估计得到的,表达为当任何 时, ,其中 表示 在探索时刻 t 感知出的地貌类别,其中置信阈值 为 。 2.2 主动探索行为 当移动机器人被有目的地引导去探索对地貌 识别度高的运动方式以提高感知能力时,这种主 动探索行为受启发于人类对于周围环境的探索、 互动和操作,能够影响感知精度和反应时间,本 文的主动探索行为有别于传统的地貌识别中单一 的动作模式下固定的阈值设置区别已知类地貌和 未知地貌,考虑了移动机器人每一步的动作都会 对下一步识别产生影响的特点,采用下列方式控 制机器人的探索动作。 2.2.1 预测误差 预测误差即为贝叶斯更新的后验概率和用来 作为决策标准的置信阈值之间的差距,贝叶斯更 新的后验概率包含在每种地貌类别中探索时间 t 处计算得到的概率为 eI (t) = P(sn|zt)−βthreshold (6) 2.2.2 低水平感知和高水平感知的预测模型 I(PM(t)) = eI (t−1) eI (t) (7) I(PM(t)) eI (t) eI (t−1) 式中: 是在探索时间 t 的感知水平; 、 是当前探索时间 t 和前一探索时间 t−1 的 预测误差,使用最低和最高的预测误差来模拟低 感知行为和高感知行为。结合内在动机模型的思 想 [32] ,由式 (6)、(7) 可以定义主动控制移动机器人 的探测动作,为 Mhigh = arg max PM I(PM(t)) Mlow = arg max PM I(PM(t)) (8) 3 实验 3.1 实验平台 本实验采用型号为 Autolabor Pro1(AP1) 的移 动机器人,平台如图 3 所示,其在室内外均可实现 稳定作业,且适用于全地形,车身尺寸 726 mm× 617 mm×273 mm,负载能力约 50 kg。AP1 共具有 4 种速度档位,分别是 0.2 m/s、0.4 m/s、0.6 m/s 和 0.8 m/s。在移动机器人车身一侧,平行且靠近地 面的位置配备一个 AKF392B 三轴向加速度计,它 提供的输出速率范围为 5~1 000 Hz,共有 8 种选 择,偏差典型值小于 0.1%,具有输出稳定,环境性 能好等优点。加速度计采样频率选择 200 Hz 采 集不同地形的三维振动信号。 图 3 实验采集平台 Fig. 3 Experimental acquisition platform 3.2 数据集 3.2.1 地貌种类选择 根据路面材质选取自然界中常见的若干类室 外地形,本实验中共涉及 14 类室外地形,如图 4 所示,分别是新修沥青路面 (new asphalt)、粗糙混 凝土 (rough concrete)、马赛克砖块路 (mosaic road)、废旧水泥砖块路 (old cement brick road)、大 理石块 (marble cubes)、压实碎石子路面 (compacted crushed stone road)、木板 (wood)、覆盖落叶 的土壤 (deciduous soil)、茂盛草丛 (lush grass)、枯 草地 (dry grass)、粗石子 (coarse stone)、鹅卵石 (cobble)、松散沙土 (loose sand) 以及新修混凝土 (new concrete)。其中,松散砂土是起伏不平的路 面,马赛克路是岩石材质组成的方格路面,新旧 混凝土路面是使用年限不同而造成的路面损伤程 度不一,具体地貌类别如图 4 所示,采集地点均在 ·155· 张威,等:室外未知环境下的 AGV 地貌主动探索感知 第 1 期
第16卷 智能系统学报 ·156· 清华大学校园内,采集时间多集中在夏末秋初时 间段。 (a)粗糙混凝土 (b)粗石子(c)大理石块(d)鹅卵石 (e)废I旧水泥()覆盖落叶的土壤(g)枯草地 砖块路 h)马赛克砖块路 (①木板路 )茂盛草丛 (k)松散沙土(新修混凝土()新修沥青路面 (n)压实碎 石子路面 图414种地貌类别 Fig.4 14 geomorphic categories 3.2.2运动状态和交互振动数据采集 (RT)、0.2m/s前进(LSF)、0.4m/s前进(MSF) 根据移动机器人自身可控的4种速度模式和 0.6m/s前进(MHSF)、0.8m/s前进(HSF)、0.2m/s 2种前后运动状态排列组合为8种运动方式,以 后退(LSB)、0.4m/s后退(MSB)、0.6m/s后退 及左右2种转弯运动状态,由于移动机器人平台 (MHSB)、0.8m/s后退(HSB),总共设定10种移动 自身的重量不同也会对地貌变化产生的敏感度不 机器人的可控运动模式;控制移动机器人以上述 同],在本文的实验中移动机器人质量分布是不 10种运动模式在3.2.1选取的各类地貌上行驶, 均匀的,重心和几何中心是不重合的,所以会选 通过移动机器人上搭载的三轴加速度计采集各种 择机器人在前进和倒车2种运动状态下的振动数 场景下的三维振动信号中的Z轴振动信号作为交 据,具体运动方式命名如下:左转弯(LT)、右转弯 互振动数据样本,移动机器人采集情景如图5所示。 20.8m/s前进 左转弯 (a)0.8m/s前进状态 (b)左转弯状态 2.0 2.0 1.5 wyA人 1.0 0.5 0.5 50 100150200250300350400 50 100150200250300350400 样本序列 样本序列 (c)0.8m/s前进振动数据 (d左转弯振动数据 图5新修沥青路面下的两种运动方式获取的振动信号 Fig.5 Vibration signals obtained by two kinds of motion modes under the new asphalt pavement 本文中控制AP1机器人在14种地貌上进行 10种运动模式和200Hz采样频率下采集了近 10种运动方式,移动机器人在每种地形上分别行 200万个数据点,其中在落叶覆盖的土壤路面分 驶了l0min,每种运动模式运动近似1min,在 别采集左转弯、右转弯、0.2m/s前进、0.4m/s前
清华大学校园内,采集时间多集中在夏末秋初时 间段。 (f) 覆盖落叶的土壤 (g) 枯草地 (h) 马赛克砖块路 (i) 木板路 (j) 茂盛草丛 (k) 松散沙土 (l) 新修混凝土 (m) 新修沥青路面 (n) 压实碎 石子路面 (a) 粗糙混凝土 (b) 粗石子 (c) 大理石块 (d) 鹅卵石 (e) 废旧水泥 砖块路 图 4 14 种地貌类别 Fig. 4 14 geomorphic categories 3.2.2 运动状态和交互振动数据采集 根据移动机器人自身可控的 4 种速度模式和 2 种前后运动状态排列组合为 8 种运动方式,以 及左右 2 种转弯运动状态,由于移动机器人平台 自身的重量不同也会对地貌变化产生的敏感度不 同 [25] ,在本文的实验中移动机器人质量分布是不 均匀的,重心和几何中心是不重合的,所以会选 择机器人在前进和倒车 2 种运动状态下的振动数 据,具体运动方式命名如下:左转弯 (LT)、右转弯 (RT)、0.2 m/s 前进 (LSF)、0.4 m/s 前进 (MSF)、 0.6 m/s 前进 (MHSF)、0.8 m/s 前进 (HSF)、0.2 m/s 后退 (LSB)、0.4 m/s 后退 (MSB)、0.6 m/s 后退 (MHSB)、0.8 m/s 后退 (HSB),总共设定 10 种移动 机器人的可控运动模式;控制移动机器人以上述 10 种运动模式在 3.2.1 选取的各类地貌上行驶, 通过移动机器人上搭载的三轴加速度计采集各种 场景下的三维振动信号中的 Z 轴振动信号作为交 互振动数据样本,移动机器人采集情景如图 5 所示。 0.8 m/s 前进 左转弯 2.0 1.5 1.0 0.5 0 50 100 150 200 250 300 350 400 加速度值/(m·s−2 ) 样本序列 (c) 0.8 m/s 前进振动数据 50 100 150 200 250 300 350 400 2.0 1.5 1.0 0.5 0 加速度值/(m·s−2 ) (d) 左转弯振动数据 (a) 0.8 m/s 前进状态 (b) 左转弯状态 样本序列 图 5 新修沥青路面下的两种运动方式获取的振动信号 Fig. 5 Vibration signals obtained by two kinds of motion modes under the new asphalt pavement 本文中控制 AP1 机器人在 14 种地貌上进行 10 种运动方式,移动机器人在每种地形上分别行 驶了 10 min,每种运动模式运动近似 1 min,在 10 种运动模式和 200 Hz 采样频率下采集了近 200 万个数据点,其中在落叶覆盖的土壤路面分 别采集左转弯、右转弯、0.2 m/s 前进、0.4 m/s 前 第 16 卷 智 能 系 统 学 报 ·156·