当前位置：和泉文库 > 工程 > 浏览文档

基于深度循环神经网络的协作机器人动力学误差补偿

由于协作机器人的结构比普通工业机器人更为轻巧，一般动力学模型所忽略的复杂特性占比较大，导致协作机器人的计算预测力矩误差较大。据此提出在考虑重力、科里奥利力、惯性力和摩擦力等的基础上，采用深度循环神经网络中的长短期记忆模型对自主研发的六自由度协作机器人动力学模型进行误差补偿。在实验中采用优化后的基于傅里叶级数的激励轨迹驱动机器人运动，以电机电流估算关节力矩，获取的原始数据用来训练长短期记忆模型(LSTM)补偿网络。网络的训练结果和评价指标为预测力矩相比实际力矩的均方根误差。计算与实验结果表明，补偿后的协作机器人动力学模型对实际力矩具有更好的预测效果，各轴预测力矩与实际力矩的均方根误差相比于未补偿的传统模型降低了61.8%至78.9%不等，表明了文中所提出补偿方法的有效性。

文件格式：PDF，文件大小：1.18MB，售价：3.24元

文档详细内容（约9页）

工程科学学报 Chinese Journal of Engineering 基于深度循环神经网络的协作机器人动力学误差补偿徐征张弓汪火明侯至丞杨文林梁济民王建顾星 Error compensation of collaborative robot dynamics based on deep recurrent neural network XU Zheng,ZHANG Gong.WANG Huo-ming.HOU Zhi-cheng,YANG Wen-lin,LIANG Ji-min.WANG Jian.GU Xing 引用本文：徐征，张弓，汪火明，侯至丞，杨文林，梁济民，王建，顾星.基于深度循环神经网络的协作机器人动力学误差补偿工程科学学报，2021,43(7)：995-1002.doi:10.13374.issn2095-9389.2020.04.30.003 XU Zheng.ZHANG Gong,WANG Huo-ming.HOU Zhi-cheng.YANG Wen-lin,LIANG Ji-min,WANG Jian,GU Xing.Error compensation of collaborative robot dynamics based on deep recurrent neural network [J].Chinese Journal of Engineering,2021, 43(7):995-1002.doi:10.13374.issn2095-9389.2020.04.30.003 在线阅读View online:https::/oi.org10.13374.issn2095-9389.2020.04.30.003 您可能感兴趣的其他文章 Articles you may be interested in 基于BP神经网络的机器人波动摩擦力矩修正方法 Wave friction correction method for a robot based on BP neural network 工程科学学报.2019,41(8)：1085 https:/1doi.org/10.13374.issn2095-9389.2019.08.014 机器人负载的动力学参数辨识 Identification methods for robot payload dynamical parameters 工程科学学报.2017,3912：1907htps:1doi.org10.13374.issn2095-9389.2017.12.018 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报.2019,41(10)：1229 https:/1doi.org/10.13374.issn2095-9389.2019.03.27.002 基于机器学习的北京市PM2.5浓度预测模型及模拟分析 Machine-learning-based model and simulation analysis of PM2.5 concentration prediction in Beijing 工程科学学报.2019,41(3：401 https:/1doi.org10.13374j.issn2095-9389.2019.03.014 基于集成神经网络的剩余寿命预测 Remaining useful life prediction based on an integrated neural network 工程科学学报.2020,42(10：1372 https:/oi.org/10.13374.issn2095-9389.2019.10.10.005 BP神经网络F钢铝耗的预测模型 Prediction model of aluminum consumption with BP neural networks in IF steel production 工程科学学报.2017,394：511 https::/1doi.org10.13374.issn2095-9389.2017.04.005

基于深度循环神经网络的协作机器人动力学误差补偿徐征张弓汪火明侯至丞杨文林梁济民王建顾星 Error compensation of collaborative robot dynamics based on deep recurrent neural network XU Zheng, ZHANG Gong, WANG Huo-ming, HOU Zhi-cheng, YANG Wen-lin, LIANG Ji-min, WANG Jian, GU Xing 引用本文: 徐征, 张弓, 汪火明, 侯至丞, 杨文林, 梁济民, 王建, 顾星. 基于深度循环神经网络的协作机器人动力学误差补偿[J]. 工程科学学报, 2021, 43(7): 995-1002. doi: 10.13374/j.issn2095-9389.2020.04.30.003 XU Zheng, ZHANG Gong, WANG Huo-ming, HOU Zhi-cheng, YANG Wen-lin, LIANG Ji-min, WANG Jian, GU Xing. Error compensation of collaborative robot dynamics based on deep recurrent neural network [J]. Chinese Journal of Engineering, 2021, 43(7): 995-1002. doi: 10.13374/j.issn2095-9389.2020.04.30.003 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2020.04.30.003 您可能感兴趣的其他文章 Articles you may be interested in 基于BP神经网络的机器人波动摩擦力矩修正方法 Wave friction correction method for a robot based on BP neural network 工程科学学报. 2019, 41(8): 1085 https://doi.org/10.13374/j.issn2095-9389.2019.08.014 机器人负载的动力学参数辨识 Identification methods for robot payload dynamical parameters 工程科学学报. 2017, 39(12): 1907 https://doi.org/10.13374/j.issn2095-9389.2017.12.018 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报. 2019, 41(10): 1229 https://doi.org/10.13374/j.issn2095-9389.2019.03.27.002 基于机器学习的北京市PM2.5浓度预测模型及模拟分析 Machine-learning-based model and simulation analysis of PM2.5 concentration prediction in Beijing 工程科学学报. 2019, 41(3): 401 https://doi.org/10.13374/j.issn2095-9389.2019.03.014 基于集成神经网络的剩余寿命预测 Remaining useful life prediction based on an integrated neural network 工程科学学报. 2020, 42(10): 1372 https://doi.org/10.13374/j.issn2095-9389.2019.10.10.005 BP神经网络IF钢铝耗的预测模型 Prediction model of aluminum consumption with BP neural networks in IF steel production 工程科学学报. 2017, 39(4): 511 https://doi.org/10.13374/j.issn2095-9389.2017.04.005

工程科学学报.第43卷，第7期：995-1002.2021年7月 Chinese Journal of Engineering,Vol.43,No.7:995-1002,July 2021 https://doi.org/10.13374/j.issn2095-9389.2020.04.30.003;http://cje.ustb.edu.cn 基于深度循环神经网络的协作机器人动力学误差补偿徐征，张弓)区，汪火明2，侯至丞，杨文林，梁济民”，王建)，顾星) 1)广州中国科学院先进技术研究所机器人与智能装备中心，广州5114582)中国地质大学机械与电子信息学院，武汉430074 区通信作者，E-mail:gong2hang@gat.ac.cn 摘要由于协作机器人的结构比普通工业机器人更为轻巧.一般动力学模型所忽略的复杂特性占比较大，导致协作机器人的计算预测力矩误差较大.据此提出在考虑重力、科里奥利力、惯性力和摩擦力等的基础上，采用深度循环神经网络中的长短期记忆模型对自主研发的六自由度协作机器人动力学模型进行误差补偿.在实验中采用优化后的基于傅里叶级数的激励轨迹驱动机器人运动，以电机电流估算关节力矩，获取的原始数据用来训练长短期记忆模型(LSTM补偿网络.网络的训练结果和评价指标为预测力矩相比实际力矩的均方根误差，计算与实验结果表明，补偿后的协作机器人动力学模型对实际力矩具有更好的预测效果，各轴预测力矩与实际力矩的均方根误差相比于未补偿的传统模型降低了61.8%至78.9%不等，表明了文中所提出补偿方法的有效性关键词协作机器人：动力学模型：模型误差补偿：循环神经网络：长短期记忆模型分类号TP242.2 Error compensation of collaborative robot dynamics based on deep recurrent neural network XU Zheng,ZHANG Gong,WANG Huo-ming2),HOU Zhi-cheng,YANG Wen-lin,LIANG Ji-min,WANG Jian,GU XingY 1)Intelligent Robot Equipment Center,Guangzhou Institute of Advanced Technology,Chinese Academy of Science,Guangzhou 511458,China 2)School of Mechanical Engineering and Electronic Information,China University of Geosciences,Wuhan 430074,China Corresponding author,E-mail:gong.zhang @giat.ac.cn ABSTRACT Establishing the dynamics model of robot and its parameters is significant for simulation analysis,control algorithm verification,and implementation of human-machine interaction.Especially under various working conditions,the errors of the calcu- lated predicted torque of each axis have the most direct negative effect.The general robot dynamics model rarely takes the minor and complex characteristics into consideration,such as the reducer flexibility,inertia force of motor rotors,and friction.However,as the structure of collaborative robots is lighter and smaller than the ordinary industrial robots,the characteristics neglected by general dynamics models account for a relatively large amount.The above facts result in a large error in the calculation and prediction of collaborative robots analysis.To address the short comings of general robot dynamics model,a network based on long short-term memory (LSTM)in deep recurrent neural network was proposed.The network compensates the general dynamics model of a self- developed six-degree-of-freedom collaborative robot based on the consideration of gravity,Coriolis force,inertial force,and friction force.In the experiment,the nondisassembly experimental measurement combined with least-squares method was used to identify the parameters.The motor current was used to evaluate the joint torque instead of mounting an expensive and inconvenient torque sensor 收稿日期：2020-04-30 基金项目：国家重点研发计划资助项目(2018YFA0902903):国家自然科学基金资助项目(62073092)：广东省自然科学基金资助项目 (2021A1515012638):广州市基础研究计划资助项目(202002030320)

基于深度循环神经网络的协作机器人动力学误差补偿徐征1)，张弓1) 苣，汪火明1,2)，侯至丞1)，杨文林1)，梁济民1)，王建1)，顾星1) 1) 广州中国科学院先进技术研究所机器人与智能装备中心，广州 511458 2) 中国地质大学机械与电子信息学院，武汉 430074 苣通信作者，E-mail: gong.zhang@giat.ac.cn 摘要由于协作机器人的结构比普通工业机器人更为轻巧，一般动力学模型所忽略的复杂特性占比较大，导致协作机器人的计算预测力矩误差较大. 据此提出在考虑重力、科里奥利力、惯性力和摩擦力等的基础上，采用深度循环神经网络中的长短期记忆模型对自主研发的六自由度协作机器人动力学模型进行误差补偿. 在实验中采用优化后的基于傅里叶级数的激励轨迹驱动机器人运动，以电机电流估算关节力矩，获取的原始数据用来训练长短期记忆模型 (LSTM) 补偿网络. 网络的训练结果和评价指标为预测力矩相比实际力矩的均方根误差. 计算与实验结果表明，补偿后的协作机器人动力学模型对实际力矩具有更好的预测效果，各轴预测力矩与实际力矩的均方根误差相比于未补偿的传统模型降低了 61.8% 至 78.9% 不等，表明了文中所提出补偿方法的有效性. 关键词协作机器人；动力学模型；模型误差补偿；循环神经网络；长短期记忆模型分类号 TP242.2 Error compensation of collaborative robot dynamics based on deep recurrent neural network XU Zheng1) ，ZHANG Gong1) 苣，WANG Huo-ming1,2) ，HOU Zhi-cheng1) ，YANG Wen-lin1) ，LIANG Ji-min1) ，WANG Jian1) ，GU Xing1) 1) Intelligent Robot & Equipment Center, Guangzhou Institute of Advanced Technology, Chinese Academy of Science, Guangzhou 511458, China 2) School of Mechanical Engineering and Electronic Information, China University of Geosciences, Wuhan 430074, China 苣 Corresponding author, E-mail: gong.zhang@giat.ac.cn ABSTRACT Establishing the dynamics model of robot and its parameters is significant for simulation analysis, control algorithm verification, and implementation of human–machine interaction. Especially under various working conditions, the errors of the calculated predicted torque of each axis have the most direct negative effect. The general robot dynamics model rarely takes the minor and complex characteristics into consideration, such as the reducer flexibility, inertia force of motor rotors, and friction. However, as the structure of collaborative robots is lighter and smaller than the ordinary industrial robots, the characteristics neglected by general dynamics models account for a relatively large amount. The above facts result in a large error in the calculation and prediction of collaborative robots analysis. To address the short comings of general robot dynamics model, a network based on long short-term memory (LSTM) in deep recurrent neural network was proposed. The network compensates the general dynamics model of a selfdeveloped six-degree-of-freedom collaborative robot based on the consideration of gravity, Coriolis force, inertial force, and friction force. In the experiment, the nondisassembly experimental measurement combined with least-squares method was used to identify the parameters. The motor current was used to evaluate the joint torque instead of mounting an expensive and inconvenient torque sensor. 收稿日期: 2020−04−30 基金项目: 国家重点研发计划资助项目（ 2018YFA0902903）；国家自然科学基金资助项目（ 62073092）；广东省自然科学基金资助项目（2021A1515012638）；广州市基础研究计划资助项目（202002030320）工程科学学报，第 43 卷，第 7 期：995−1002，2021 年 7 月 Chinese Journal of Engineering, Vol. 43, No. 7: 995−1002, July 2021 https://doi.org/10.13374/j.issn2095-9389.2020.04.30.003; http://cje.ustb.edu.cn

996 工程科学学报，第43卷，第7期 The excitation trajectory based on the Fourier series was optimized.The raw experimental data were used to train the proposed LSTM network.About the accuracy of the dynamic model and the compensation method for the collaborative robot,the root-mean-square error of the calculated torque relative to the actual measured torque was used to train the network and evaluate the proposed method.The analysis and the results of the experiment show that the compensated collaborative robot dynamics model based on LSTM network displays a good prediction on the actual torque,and the root-mean-square error between predicted and actual torques is reduced from 61.8%to 78.9%compared to the traditional model,the effectiveness of the proposed error compensation policy is verified. KEY WORDS collaborative robot;dynamics model;error compensation;recurrent neural network;long short-term memory 准确的机器人动力学模型是搭建仿真模型，且安装不便的力矩传感器，以完成补偿方法的实验证先进控制算法和对控制系统进行深度分析的验验证基础-)随着对机器人动态性能要求的提高和协 1 协作机器人动力学模型作机器人概念的兴起，常规无模型控制方法，如 PID算法不仅轨迹跟踪精度较低，抗干扰能力较本研究基于自主研发的六自由度协作机器差，尤其无法实现碰撞检测、柔顺控制等人机交互人，图1和图2分别为其三维模型图和Denavit- 功能 Hartenberg(D-H)模型图，从图中可以看到轴2、3、对于多轴串联机器人进行动力学建模一般会 4的相互平行，逆运动学存在封闭解.考虑重力、考虑重力、科里奥利力、惯性力和摩擦力等主要科里奥利力、惯性离心力和摩擦力，采用欧拉-拉因素，但是对于较复杂的特性，例如减速机柔性、格朗日法计算关节力矩，得到机器人刚体动力学连杆弹性、摩擦力随工况的变化、电机转子惯性方程：力等，较少建立其数学模型4，从而导致计算力矩 T=M(q)q+H(g,q)+G(q)+T (1) 与实际力矩误差较大，阻碍了协作机器人碰撞检测、拖动示教和柔顺控制的良好实现.有学者对 Axis-6 Axis-4- 此进行了研究，文献[6-8]各自建立了摩擦特性模型并提出了针对性的补偿方法，也有采用机器学习方法的，如利用反向传播(Back propagation,BP) Axis-5 神经网络和径向基函数(Radial basis function, RBF)网络进行拟合或补偿0-川，有些也提出了对应的控制方法，但鲜有研究对各种复杂特性综 Axis-3 合起来考虑的对于参数辨识技术，有解体测量计算方法3-、解体实验测量法s6、不解体实验测量方法？1图 Axis- 和理论辨识9等方法.解体方法无法或难以计算 -Axis-2 机器人关节特性2，理论辨识法得到的惯性张量矩阵在任意形位上不一定是正定的，实际中也不图1协作机器人三维模型图 Fig.1 3D model of the collaborative robot 可能存在，其控制也不稳定为此，本文提出利用深度循环神经网络对协作机器人动力学模型进行误差补偿，首先建立动力学方程，然后采用不解体实验测量方法结合最小二乘法对其中参数进行辨识.接着，针对协作机器人的未建模特性或建模不精确的问题，采用深度循环神经网络进行补偿，以减小动力学模型误差并提高力矩预测精度.最后在实验中，以电机电流等效作为关节力矩信号，把电机电流和电机常数的乘积作为输出轴力矩，同时结合摩擦力模型图2协作机器人D-H模型图计算得到机器人关节的输出力矩，代替价格高昂 Fig.2 D-H structure of the collaborative robot

The excitation trajectory based on the Fourier series was optimized. The raw experimental data were used to train the proposed LSTM network. About the accuracy of the dynamic model and the compensation method for the collaborative robot, the root-mean-square error of the calculated torque relative to the actual measured torque was used to train the network and evaluate the proposed method. The analysis and the results of the experiment show that the compensated collaborative robot dynamics model based on LSTM network displays a good prediction on the actual torque, and the root-mean-square error between predicted and actual torques is reduced from 61.8% to 78.9% compared to the traditional model, the effectiveness of the proposed error compensation policy is verified. KEY WORDS collaborative robot；dynamics model；error compensation；recurrent neural network；long short-term memory 准确的机器人动力学模型是搭建仿真模型，验证先进控制算法和对控制系统进行深度分析的基础[1–2] . 随着对机器人动态性能要求的提高和协作机器人概念的兴起，常规无模型控制方法，如 PID 算法不仅轨迹跟踪精度较低，抗干扰能力较差，尤其无法实现碰撞检测、柔顺控制等人机交互功能[3] . 对于多轴串联机器人进行动力学建模一般会考虑重力、科里奥利力、惯性力和摩擦力等主要因素，但是对于较复杂的特性，例如减速机柔性、连杆弹性、摩擦力随工况的变化、电机转子惯性力等，较少建立其数学模型[4–5] ，从而导致计算力矩与实际力矩误差较大，阻碍了协作机器人碰撞检测、拖动示教和柔顺控制的良好实现. 有学者对此进行了研究，文献 [6–8] 各自建立了摩擦特性模型并提出了针对性的补偿方法，也有采用机器学习方法的，如利用反向传播（Back propagation，BP）神经网络 [9] 和径向基函数（ Radial basis function， RBF）网络进行拟合或补偿[10–11] ，有些也提出了对应的控制方法[12] ，但鲜有研究对各种复杂特性综合起来考虑的. 对于参数辨识技术，有解体测量计算方法[13–14]、解体实验测量法[15– 16]、不解体实验测量方法[17– 18] 和理论辨识[19] 等方法. 解体方法无法或难以计算机器人关节特性[20] ，理论辨识法得到的惯性张量矩阵在任意形位上不一定是正定的，实际中也不可能存在，其控制也不稳定[21] . 为此，本文提出利用深度循环神经网络对协作机器人动力学模型进行误差补偿，首先建立动力学方程，然后采用不解体实验测量方法结合最小二乘法对其中参数进行辨识. 接着，针对协作机器人的未建模特性或建模不精确的问题，采用深度循环神经网络进行补偿，以减小动力学模型误差并提高力矩预测精度. 最后在实验中，以电机电流等效作为关节力矩信号，把电机电流和电机常数的乘积作为输出轴力矩，同时结合摩擦力模型计算得到机器人关节的输出力矩，代替价格高昂且安装不便的力矩传感器，以完成补偿方法的实验验证. 1 协作机器人动力学模型本研究基于自主研发的六自由度协作机器人，图 1 和图 2 分别为其三维模型图和 DenavitHartenberg（D-H）模型图，从图中可以看到轴 2、3、 4 的相互平行，逆运动学存在封闭解. 考虑重力、科里奥利力、惯性离心力和摩擦力，采用欧拉–拉格朗日法计算关节力矩，得到机器人刚体动力学方程： τ = M(q) q¨ + H(q, q˙)+G(q)+τf （1） Axis-4 Axis-3 Axis-1 Axis-2 Axis-5 Axis-6 图 1 协作机器人三维模型图 Fig.1 3D model of the collaborative robot y x z y y a2 a3 d5 d6 d4 x x z z y y y x z y x x x z z z d1 图 2 协作机器人 D-H 模型图 Fig.2 D-H structure of the collaborative robot · 996 · 工程科学学报，第 43 卷，第 7 期

徐征等：基于深度循环神经网络的协作机器人动力学误差补偿 997 式中：g为关节角向量：g为关节角速度向量：为关器通信采集位移、速度和电流等信息节角加速度向量；M(q)为机械臂惯性矩阵； H(g,)为离心力和科里奥利力矩阵：G(g)为重力矩 gm0=gn+∑(@usinGu+-hacosto》) (6) 阵；为摩擦力项式中：q:()∈R"为关节i在关节空间中的轨迹关于机器人关节的减速机、轴承等带来的摩擦影时间1的函数；wr是基频；qio(①)∈R"为常量偏移；每响较大啊，导致角速度换向处，即在速度零点附条轨迹包含11个参数，即ak,bk,q0和wr=1 近，计算力矩相对实际误差较大.针对该现象，采激励轨迹的优劣与观测矩阵抑制噪声的能力用Stribeck摩擦力模型对关节摩擦机械建模，其摩和其病态性息息相关，直接影响辨识参数的精度，擦力矩为：这里通过观测矩阵W的条件数来定义目标函数： (2) J=Cond(W) (7) Tr Dq+usgn (g) 式中：D为黏滞摩擦系数矩阵；μ为库伦摩擦系数式中：Cond(W=omax(W)/cmin(W),omax(W)和cmim 综合式(1)和(2)，可以得到方程： (W分别为W的最大和最小奇异值. 目标函数值越小，则辨识参数对测量误差的 T=M(g)+(g.q)+G(g)+Dq+usgn(g) (3) 敏感度越低，实验辨识得到的参数精度就有可能故方程(1)可改成如下线性形式：更高.同时还要考虑实际机器人有运动性能的限 T:=(g.q.q)0+T (4) 制，以运动范围、起始和停止阶段的速度和加速度式中，(q,4,为观测矩阵，仅与关节位置、速度、为约束，则该激励轨迹优化问题可描述为：加速度及机器人的结构参数相关.表示基本惯性 min() 参数向量，其包括机器人连杆质量、质心和转动惯 qmin≤lqi(tl≤qmax Yi,t 量等参数，但由于结构和安装特点，有部分参数对 gmin≤l9i(tl≤qmax Yi,t 机器人工作时的力矩没有贡献，在方程组中系数始 9min≤li(tl≤max Yi.t (8) gi(to)=gi(MM)=0 Yi.t 终为0，这部分参数是无法辨识得到的；还有部分 qi(to)=qi(mM)=0 Yi,t 元素在动力学方程中组合出现，是线性相关的，无 :(o)=:(M)=0 Yi.t 法辨识得到单独数值，只能求得组合值.经过对惯式中：qmin、gmin、min、qmax、gmax和amax是各个关节性参数进行重组后，得到能够可辨识参数的最小角，关节速度，关节加速度的边界值；to、tM分别为集合，即最小惯性参数集，式(4)可进一步表达为：表示起始和终止时刻，由于采用傅里叶变换作为 Tr=Φr(q,q,4)8+Tr (5) 激励曲线，其周期性确保了起始和终止时刻的运式中：中为重组后的观测矩阵：a为最小惯性参数动参数一致连续性，在实际优化计算中省略对终集向量. 止时刻的约束对于模型精度，本文以预测力矩（计算力矩）式(8)是一个非线性多约束的优化问题，可以相对于实际测量力矩的均方根误差作为评价标采用NSGA等目标优化算法四对其进行优化，得准.若均方根误差较小，则说明模型精度高，反之到优化后的激励轨迹如图3所示.三张图中，横轴则精度较低均为时间，纵轴依次为角位移，角速度和角加速度.从图中可以看出，轨迹变化平滑，起止点均为 2激励轨迹生成零，运动幅值较大，但也未超出限制范围，该优化不解体实验测量方法需要驱动机器人运动以后的激励轨迹将用于第4节的实验研究获取数据，考虑到计算精度和实验可行性，机器人 3 深度循环神经网络误差补偿运动轨迹即激励轨迹需要满足多种条件.六轴机器人动力学运算复杂度高，在辨识后三轴的动力循环神经网络(Recurrent neural network,RNN) 学参数时可以锁定前三轴单独实验，辨识的难度是一类用于处理序列数据的神经网络，其中的长大大降低，更具针对性且减小了运算量限于篇短期记忆(Long short-term memory,LSTM)单元网幅和运算量，本文仅对协作机器人末端轴4至轴络相比于普通的人工神经网络，解决了早期 6的动力学参数进行了辨识和研究.实验采用傅 RNN网络存在的长时期依赖，梯度爆炸和梯度消里叶级数前五项，即式(5)作为激励轨迹.由于是失等问题？2刘，在对历史信息的保留和对未来信周期函数，便于重复多次进行该实验，同时与驱动息的预测上有较大进步.本研究将进一步探索LSTM

q q˙ q¨ M(q) H(q, q˙) G(q) τf 式中：为关节角向量；为关节角速度向量；为关节角加速度向量；为机械臂惯性矩阵；为离心力和科里奥利力矩阵；为重力矩阵；为摩擦力项. 机器人关节的减速机、轴承等带来的摩擦影响较大[15] ，导致角速度换向处，即在速度零点附近，计算力矩相对实际误差较大. 针对该现象，采用 Stribeck 摩擦力模型对关节摩擦机械建模，其摩擦力矩为： τf = Dq˙ +µsgn(q˙) （2）式中： D 为黏滞摩擦系数矩阵； µ 为库伦摩擦系数. 综合式（1）和（2），可以得到方程： τ = M(q) q¨ + H(q, q˙)+G(q)+ Dq˙ +µsgn(q˙) （3）故方程（1）可改成如下线性形式： τr = Φ(q, q˙, q¨)θ+τf （4） Φ(q, q˙, q¨) θ 式中，为观测矩阵，仅与关节位置、速度、加速度及机器人的结构参数相关. 表示基本惯性参数向量，其包括机器人连杆质量、质心和转动惯量等参数，但由于结构和安装特点，有部分参数对机器人工作时的力矩没有贡献，在方程组中系数始终为 0，这部分参数是无法辨识得到的；还有部分元素在动力学方程中组合出现，是线性相关的，无法辨识得到单独数值，只能求得组合值. 经过对惯性参数进行重组后，得到能够可辨识参数的最小集合，即最小惯性参数集，式（4）可进一步表达为： τr = Φr(q, q˙, q¨)θr +τf （5）式中： Φr为重组后的观测矩阵； θr为最小惯性参数集向量. 对于模型精度，本文以预测力矩（计算力矩）相对于实际测量力矩的均方根误差作为评价标准. 若均方根误差较小，则说明模型精度高，反之则精度较低. 2 激励轨迹生成不解体实验测量方法需要驱动机器人运动以获取数据，考虑到计算精度和实验可行性，机器人运动轨迹即激励轨迹需要满足多种条件. 六轴机器人动力学运算复杂度高，在辨识后三轴的动力学参数时可以锁定前三轴单独实验，辨识的难度大大降低，更具针对性且减小了运算量[16] . 限于篇幅和运算量，本文仅对协作机器人末端轴 4 至轴 6 的动力学参数进行了辨识和研究. 实验采用傅里叶级数前五项，即式（5）作为激励轨迹. 由于是周期函数，便于重复多次进行该实验，同时与驱动器通信采集位移、速度和电流等信息. qi(t) = qi,0 + ∑5 k ( ai,ksin(kωf t)+bi,kcos(kωf t) ) （6） qi(t) ∈ R n ωf qi,0 (t) ∈ R n ai,k bi,k qi,0 ωf = 1 式中：为关节 i 在关节空间中的轨迹关于时间 t 的函数；是基频；为常量偏移；每条轨迹包含 11 个参数，即，，和 . 激励轨迹的优劣与观测矩阵抑制噪声的能力和其病态性息息相关，直接影响辨识参数的精度，这里通过观测矩阵 W 的条件数来定义目标函数： J = Cond(W) （7） Cond(W) = σmax (W) /σmin (W) σmax (W) σmin (W) 式中：，和分别为 W 的最大和最小奇异值. 目标函数值越小，则辨识参数 θ 对测量误差的敏感度越低，实验辨识得到的参数精度就有可能更高. 同时还要考虑实际机器人有运动性能的限制，以运动范围、起始和停止阶段的速度和加速度为约束，则该激励轨迹优化问题可描述为：    min(J) qmin ⩽ |qi(t)| ⩽ qmax ∀i,t q˙min ⩽ |q˙i(t)| ⩽ q˙max ∀i,t q¨min ⩽ |q˙i(t)| ⩽ q¨max ∀i,t qi(t0) = qi(tM) = 0 ∀i,t q˙i(t0) = q˙i(tM) = 0 ∀i,t q¨i(t0) = q¨i(tM) = 0 ∀i,t （8） qmin q˙min q¨min qmax q˙max q¨maxt0 tM 式中：、、、、和是各个关节角，关节速度，关节加速度的边界值；、分别为表示起始和终止时刻，由于采用傅里叶变换作为激励曲线，其周期性确保了起始和终止时刻的运动参数一致连续性，在实际优化计算中省略对终止时刻的约束. 式（8）是一个非线性多约束的优化问题，可以采用 NSGA 等目标优化算法[22] 对其进行优化，得到优化后的激励轨迹如图 3 所示. 三张图中，横轴均为时间，纵轴依次为角位移，角速度和角加速度. 从图中可以看出，轨迹变化平滑，起止点均为零，运动幅值较大，但也未超出限制范围，该优化后的激励轨迹将用于第 4 节的实验研究. 3 深度循环神经网络误差补偿循环神经网络（Recurrent neural network，RNN）是一类用于处理序列数据的神经网络，其中的长短期记忆（Long short-term memory，LSTM）单元网络相比于普通的人工神经网络，解决了早期 RNN 网络存在的长时期依赖，梯度爆炸和梯度消失等问题[23– 24] ，在对历史信息的保留和对未来信息的预测上有较大进步. 本研究将进一步探索 LSTM 徐征等：基于深度循环神经网络的协作机器人动力学误差补偿 · 997 ·

998 工程科学学报，第43卷，第7期 2.5 3 (a) Axis-4 (b) 2.0 -Axis-5 A时 15 --Axis-6 \xis-6 1.0 0.5 0 0 -0.5 -1.0 -1.5 2 -2.0 -3 0 1000200030004000500060007000 01000200030004000500060007000 Time/ms Time/ms 5 (c) Axis-4 Axis-5 3 Axis-6 (s-P)o 2 0 1000200030004000500060007000 Time/ms 图3参数辨识所用激励轨迹.(a)位移：(b)速度：(c)加速度 Fig.3 Excitation trajectory for parameter identification:(a)position;(b)velocity;(c)acceleration 在机器人动力学方面的应用机器人运动学和动力学数据在时间上连续相关，且摩擦力的记忆特性和电机参数随温度变化带来的时变特性，采用LSTM网络可以很好地补偿这些因素.本研究采用具有细胞状态和门控结 C-1h 构的LSTM细胞单元以期实现较好的补偿效果如图4所示，LSTM细胞单元增加了细胞状态 tanh 向量C和相关的门控结构，以控制遗忘和记忆的方法较好地解决了普通RNN Cell存在的梯度爆炸和梯度消失问题其前向运算过程为： fi=(Wr [h-1,x]+be) 图4LSTM隐含层细胞结构 i4=o(W:·[h-l,x]+b) Fig.4 LSTM cell of hidden layer C:tanh (Wc.[h-1,x]+bc) (9) Cr=fi*C1-1+ir*C LSTM网络训练过程采用是随时间反向传播 or=(Wo [h-1,x]+bo) 算法(Back propagation trough time,BPTT),与经典 h:=o:*tanh(C) 的反向传播算法类似，包括前向计算、反向计算、式中：o为sigmoid函数；f为遗忘门输出量：W% 计算梯度、更新参数等步骤 W、Wc和W。依次为遗忘门、输入门、更新状和输其中基于梯度的优化算法种类众多，本文选出门状态参数；brb、bc和b依次为遗忘门、输人用适应性动量估计(Adaptive moment estimation, 门、更新状和输出门状态的偏移量：C和h分别为 Adam)算法2.该算法是一种有效的基于梯度的细胞输出向量和隐含状态，x为输入向量，i和C为随机优化方法，能够对不同参数计算适应性学习细胞更新状态中间变量，0为输出门中间变量，以率且占用存储资源较少，相比于其他随机优化方上各变量下角标为时间序列编号，法，Adam算法在实际应用中整体表现更优

在机器人动力学方面的应用. 机器人运动学和动力学数据在时间上连续相关，且摩擦力的记忆特性和电机参数随温度变化带来的时变特性，采用 LSTM 网络可以很好地补偿这些因素. 本研究采用具有细胞状态和门控结构的 LSTM 细胞单元以期实现较好的补偿效果. 如图 4 所示，LSTM 细胞单元增加了细胞状态向量 C 和相关的门控结构，以控制遗忘和记忆的方法较好地解决了普通 RNN Cell 存在的梯度爆炸和梯度消失问题. 其前向运算过程为：    ft = σ(Wf ·[ht−1, xt]+bf) it = σ(Wi ·[ht−1, xt]+bi) C˜ t = tanh(WC ·[ht−1, xt]+bC) Ct = ft∗Ct−1 +it ∗C˜ t ot = σ(Wo [ht−1, xt]+bo) ht = ot ∗ tanh(Ct) （9） C˜ 式中： σ 为 sigmoid 函数； f t 为遗忘门输出量； Wf， Wi、WC 和 Wo 依次为遗忘门、输入门、更新状和输出门状态参数；bf，bi、bC 和 bo 依次为遗忘门、输入门、更新状和输出门状态的偏移量；C 和 h 分别为细胞输出向量和隐含状态，x 为输入向量，i 和为细胞更新状态中间变量，o 为输出门中间变量，以上各变量下角标为时间序列编号. LSTM 网络训练过程采用是随时间反向传播算法 (Back propagation trough time，BPTT)，与经典的反向传播算法类似，包括前向计算、反向计算、计算梯度、更新参数等步骤. 其中基于梯度的优化算法种类众多，本文选用适应性动量估计 (Adaptive moment estimation， Adam) 算法[25] . 该算法是一种有效的基于梯度的随机优化方法，能够对不同参数计算适应性学习率且占用存储资源较少，相比于其他随机优化方法，Adam 算法在实际应用中整体表现更优. (a) 2.5 2.0 1.5 1.0 0.5 0 −0.5 −1.0 −1.5 −2.0 3 2 1 0 −1 −2 −3 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 Position/rad Acceleration/(rad·s−2 ) Velocity/(rad·s−1 ) (c) 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 (b) 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 5 4 3 2 1 0 −1 −2 −3 −4 −5 Axis-4 Axis-5 Axis-6 Axis-4 Axis-5 Axis-6 Axis-4 Axis-5 Axis-6 图 3 参数辨识所用激励轨迹. （a）位移；（b）速度；（c）加速度 Fig.3 Excitation trajectory for parameter identification: (a) position; (b) velocity; (c) acceleration Ct−1 ht−1 xt σ σ σ tanh tanh ht ft it Ct Ot Ct ht ~ 图 4 LSTM 隐含层细胞结构 Fig.4 LSTM cell of hidden layer · 998 · 工程科学学报，第 43 卷，第 7 期

点击进入文档下载页（PDF格式）

共9页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录