工程科学学报 Chinese Journal of Engineering 基于深度循环神经网络的协作机器人动力学误差补偿 徐征张弓汪火明侯至丞杨文林梁济民王建顾星 Error compensation of collaborative robot dynamics based on deep recurrent neural network XU Zheng,ZHANG Gong.WANG Huo-ming.HOU Zhi-cheng,YANG Wen-lin,LIANG Ji-min.WANG Jian.GU Xing 引用本文: 徐征,张弓,汪火明,侯至丞,杨文林,梁济民,王建,顾星.基于深度循环神经网络的协作机器人动力学误差补偿工程科 学学报,2021,43(7):995-1002.doi:10.13374.issn2095-9389.2020.04.30.003 XU Zheng.ZHANG Gong,WANG Huo-ming.HOU Zhi-cheng.YANG Wen-lin,LIANG Ji-min,WANG Jian,GU Xing.Error compensation of collaborative robot dynamics based on deep recurrent neural network [J].Chinese Journal of Engineering,2021, 43(7):995-1002.doi:10.13374.issn2095-9389.2020.04.30.003 在线阅读View online:https::/oi.org10.13374.issn2095-9389.2020.04.30.003 您可能感兴趣的其他文章 Articles you may be interested in 基于BP神经网络的机器人波动摩擦力矩修正方法 Wave friction correction method for a robot based on BP neural network 工程科学学报.2019,41(8):1085 https:/1doi.org/10.13374.issn2095-9389.2019.08.014 机器人负载的动力学参数辨识 Identification methods for robot payload dynamical parameters 工程科学学报.2017,3912:1907htps:1doi.org10.13374.issn2095-9389.2017.12.018 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报.2019,41(10):1229 https:/1doi.org/10.13374.issn2095-9389.2019.03.27.002 基于机器学习的北京市PM2.5浓度预测模型及模拟分析 Machine-learning-based model and simulation analysis of PM2.5 concentration prediction in Beijing 工程科学学报.2019,41(3:401 https:/1doi.org10.13374j.issn2095-9389.2019.03.014 基于集成神经网络的剩余寿命预测 Remaining useful life prediction based on an integrated neural network 工程科学学报.2020,42(10:1372 https:/oi.org/10.13374.issn2095-9389.2019.10.10.005 BP神经网络F钢铝耗的预测模型 Prediction model of aluminum consumption with BP neural networks in IF steel production 工程科学学报.2017,394:511 https::/1doi.org10.13374.issn2095-9389.2017.04.005
基于深度循环神经网络的协作机器人动力学误差补偿 徐征 张弓 汪火明 侯至丞 杨文林 梁济民 王建 顾星 Error compensation of collaborative robot dynamics based on deep recurrent neural network XU Zheng, ZHANG Gong, WANG Huo-ming, HOU Zhi-cheng, YANG Wen-lin, LIANG Ji-min, WANG Jian, GU Xing 引用本文: 徐征, 张弓, 汪火明, 侯至丞, 杨文林, 梁济民, 王建, 顾星. 基于深度循环神经网络的协作机器人动力学误差补偿[J]. 工程科 学学报, 2021, 43(7): 995-1002. doi: 10.13374/j.issn2095-9389.2020.04.30.003 XU Zheng, ZHANG Gong, WANG Huo-ming, HOU Zhi-cheng, YANG Wen-lin, LIANG Ji-min, WANG Jian, GU Xing. Error compensation of collaborative robot dynamics based on deep recurrent neural network [J]. Chinese Journal of Engineering, 2021, 43(7): 995-1002. doi: 10.13374/j.issn2095-9389.2020.04.30.003 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2020.04.30.003 您可能感兴趣的其他文章 Articles you may be interested in 基于BP神经网络的机器人波动摩擦力矩修正方法 Wave friction correction method for a robot based on BP neural network 工程科学学报. 2019, 41(8): 1085 https://doi.org/10.13374/j.issn2095-9389.2019.08.014 机器人负载的动力学参数辨识 Identification methods for robot payload dynamical parameters 工程科学学报. 2017, 39(12): 1907 https://doi.org/10.13374/j.issn2095-9389.2017.12.018 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报. 2019, 41(10): 1229 https://doi.org/10.13374/j.issn2095-9389.2019.03.27.002 基于机器学习的北京市PM2.5浓度预测模型及模拟分析 Machine-learning-based model and simulation analysis of PM2.5 concentration prediction in Beijing 工程科学学报. 2019, 41(3): 401 https://doi.org/10.13374/j.issn2095-9389.2019.03.014 基于集成神经网络的剩余寿命预测 Remaining useful life prediction based on an integrated neural network 工程科学学报. 2020, 42(10): 1372 https://doi.org/10.13374/j.issn2095-9389.2019.10.10.005 BP神经网络IF钢铝耗的预测模型 Prediction model of aluminum consumption with BP neural networks in IF steel production 工程科学学报. 2017, 39(4): 511 https://doi.org/10.13374/j.issn2095-9389.2017.04.005
工程科学学报.第43卷,第7期:995-1002.2021年7月 Chinese Journal of Engineering,Vol.43,No.7:995-1002,July 2021 https://doi.org/10.13374/j.issn2095-9389.2020.04.30.003;http://cje.ustb.edu.cn 基于深度循环神经网络的协作机器人动力学误差补偿 徐 征,张弓)区,汪火明2,侯至丞,杨文林,梁济民”, 王 建),顾 星) 1)广州中国科学院先进技术研究所机器人与智能装备中心,广州5114582)中国地质大学机械与电子信息学院,武汉430074 区通信作者,E-mail:gong2hang@gat.ac.cn 摘要由于协作机器人的结构比普通工业机器人更为轻巧.一般动力学模型所忽略的复杂特性占比较大,导致协作机器人 的计算预测力矩误差较大.据此提出在考虑重力、科里奥利力、惯性力和摩擦力等的基础上,采用深度循环神经网络中的长 短期记忆模型对自主研发的六自由度协作机器人动力学模型进行误差补偿.在实验中采用优化后的基于傅里叶级数的激励 轨迹驱动机器人运动,以电机电流估算关节力矩,获取的原始数据用来训练长短期记忆模型(LSTM补偿网络.网络的训练 结果和评价指标为预测力矩相比实际力矩的均方根误差,计算与实验结果表明,补偿后的协作机器人动力学模型对实际力 矩具有更好的预测效果,各轴预测力矩与实际力矩的均方根误差相比于未补偿的传统模型降低了61.8%至78.9%不等,表明 了文中所提出补偿方法的有效性 关键词协作机器人:动力学模型:模型误差补偿:循环神经网络:长短期记忆模型 分类号TP242.2 Error compensation of collaborative robot dynamics based on deep recurrent neural network XU Zheng,ZHANG Gong,WANG Huo-ming2),HOU Zhi-cheng,YANG Wen-lin,LIANG Ji-min,WANG Jian,GU XingY 1)Intelligent Robot Equipment Center,Guangzhou Institute of Advanced Technology,Chinese Academy of Science,Guangzhou 511458,China 2)School of Mechanical Engineering and Electronic Information,China University of Geosciences,Wuhan 430074,China Corresponding author,E-mail:gong.zhang @giat.ac.cn ABSTRACT Establishing the dynamics model of robot and its parameters is significant for simulation analysis,control algorithm verification,and implementation of human-machine interaction.Especially under various working conditions,the errors of the calcu- lated predicted torque of each axis have the most direct negative effect.The general robot dynamics model rarely takes the minor and complex characteristics into consideration,such as the reducer flexibility,inertia force of motor rotors,and friction.However,as the structure of collaborative robots is lighter and smaller than the ordinary industrial robots,the characteristics neglected by general dynamics models account for a relatively large amount.The above facts result in a large error in the calculation and prediction of collaborative robots analysis.To address the short comings of general robot dynamics model,a network based on long short-term memory (LSTM)in deep recurrent neural network was proposed.The network compensates the general dynamics model of a self- developed six-degree-of-freedom collaborative robot based on the consideration of gravity,Coriolis force,inertial force,and friction force.In the experiment,the nondisassembly experimental measurement combined with least-squares method was used to identify the parameters.The motor current was used to evaluate the joint torque instead of mounting an expensive and inconvenient torque sensor 收稿日期:2020-04-30 基金项目:国家重点研发计划资助项目(2018YFA0902903):国家自然科学基金资助项目(62073092):广东省自然科学基金资助项目 (2021A1515012638):广州市基础研究计划资助项目(202002030320)
基于深度循环神经网络的协作机器人动力学误差补偿 徐 征1),张 弓1) 苣,汪火明1,2),侯至丞1),杨文林1),梁济民1), 王 建1),顾 星1) 1) 广州中国科学院先进技术研究所机器人与智能装备中心,广州 511458 2) 中国地质大学机械与电子信息学院,武汉 430074 苣通信作者,E-mail: gong.zhang@giat.ac.cn 摘 要 由于协作机器人的结构比普通工业机器人更为轻巧,一般动力学模型所忽略的复杂特性占比较大,导致协作机器人 的计算预测力矩误差较大. 据此提出在考虑重力、科里奥利力、惯性力和摩擦力等的基础上,采用深度循环神经网络中的长 短期记忆模型对自主研发的六自由度协作机器人动力学模型进行误差补偿. 在实验中采用优化后的基于傅里叶级数的激励 轨迹驱动机器人运动,以电机电流估算关节力矩,获取的原始数据用来训练长短期记忆模型 (LSTM) 补偿网络. 网络的训练 结果和评价指标为预测力矩相比实际力矩的均方根误差. 计算与实验结果表明,补偿后的协作机器人动力学模型对实际力 矩具有更好的预测效果,各轴预测力矩与实际力矩的均方根误差相比于未补偿的传统模型降低了 61.8% 至 78.9% 不等,表明 了文中所提出补偿方法的有效性. 关键词 协作机器人;动力学模型;模型误差补偿;循环神经网络;长短期记忆模型 分类号 TP242.2 Error compensation of collaborative robot dynamics based on deep recurrent neural network XU Zheng1) ,ZHANG Gong1) 苣 ,WANG Huo-ming1,2) ,HOU Zhi-cheng1) ,YANG Wen-lin1) ,LIANG Ji-min1) ,WANG Jian1) ,GU Xing1) 1) Intelligent Robot & Equipment Center, Guangzhou Institute of Advanced Technology, Chinese Academy of Science, Guangzhou 511458, China 2) School of Mechanical Engineering and Electronic Information, China University of Geosciences, Wuhan 430074, China 苣 Corresponding author, E-mail: gong.zhang@giat.ac.cn ABSTRACT Establishing the dynamics model of robot and its parameters is significant for simulation analysis, control algorithm verification, and implementation of human–machine interaction. Especially under various working conditions, the errors of the calculated predicted torque of each axis have the most direct negative effect. The general robot dynamics model rarely takes the minor and complex characteristics into consideration, such as the reducer flexibility, inertia force of motor rotors, and friction. However, as the structure of collaborative robots is lighter and smaller than the ordinary industrial robots, the characteristics neglected by general dynamics models account for a relatively large amount. The above facts result in a large error in the calculation and prediction of collaborative robots analysis. To address the short comings of general robot dynamics model, a network based on long short-term memory (LSTM) in deep recurrent neural network was proposed. The network compensates the general dynamics model of a selfdeveloped six-degree-of-freedom collaborative robot based on the consideration of gravity, Coriolis force, inertial force, and friction force. In the experiment, the nondisassembly experimental measurement combined with least-squares method was used to identify the parameters. The motor current was used to evaluate the joint torque instead of mounting an expensive and inconvenient torque sensor. 收稿日期: 2020−04−30 基金项目: 国家重点研发计划资助项目( 2018YFA0902903);国家自然科学基金资助项目( 62073092);广东省自然科学基金资助项目 (2021A1515012638);广州市基础研究计划资助项目(202002030320) 工程科学学报,第 43 卷,第 7 期:995−1002,2021 年 7 月 Chinese Journal of Engineering, Vol. 43, No. 7: 995−1002, July 2021 https://doi.org/10.13374/j.issn2095-9389.2020.04.30.003; http://cje.ustb.edu.cn
996 工程科学学报,第43卷,第7期 The excitation trajectory based on the Fourier series was optimized.The raw experimental data were used to train the proposed LSTM network.About the accuracy of the dynamic model and the compensation method for the collaborative robot,the root-mean-square error of the calculated torque relative to the actual measured torque was used to train the network and evaluate the proposed method.The analysis and the results of the experiment show that the compensated collaborative robot dynamics model based on LSTM network displays a good prediction on the actual torque,and the root-mean-square error between predicted and actual torques is reduced from 61.8%to 78.9%compared to the traditional model,the effectiveness of the proposed error compensation policy is verified. KEY WORDS collaborative robot;dynamics model;error compensation;recurrent neural network;long short-term memory 准确的机器人动力学模型是搭建仿真模型, 且安装不便的力矩传感器,以完成补偿方法的实 验证先进控制算法和对控制系统进行深度分析的 验验证 基础-)随着对机器人动态性能要求的提高和协 1 协作机器人动力学模型 作机器人概念的兴起,常规无模型控制方法,如 PID算法不仅轨迹跟踪精度较低,抗干扰能力较 本研究基于自主研发的六自由度协作机器 差,尤其无法实现碰撞检测、柔顺控制等人机交互 人,图1和图2分别为其三维模型图和Denavit- 功能 Hartenberg(D-H)模型图,从图中可以看到轴2、3、 对于多轴串联机器人进行动力学建模一般会 4的相互平行,逆运动学存在封闭解.考虑重力、 考虑重力、科里奥利力、惯性力和摩擦力等主要 科里奥利力、惯性离心力和摩擦力,采用欧拉-拉 因素,但是对于较复杂的特性,例如减速机柔性、 格朗日法计算关节力矩,得到机器人刚体动力学 连杆弹性、摩擦力随工况的变化、电机转子惯性 方程: 力等,较少建立其数学模型4,从而导致计算力矩 T=M(q)q+H(g,q)+G(q)+T (1) 与实际力矩误差较大,阻碍了协作机器人碰撞检 测、拖动示教和柔顺控制的良好实现.有学者对 Axis-6 Axis-4- 此进行了研究,文献[6-8]各自建立了摩擦特性模 型并提出了针对性的补偿方法,也有采用机器学 习方法的,如利用反向传播(Back propagation,BP) Axis-5 神经网络和径向基函数(Radial basis function, RBF)网络进行拟合或补偿0-川,有些也提出了对 应的控制方法,但鲜有研究对各种复杂特性综 Axis-3 合起来考虑的 对于参数辨识技术,有解体测量计算方法3-、 解体实验测量法s6、不解体实验测量方法?1图 Axis- 和理论辨识9等方法.解体方法无法或难以计算 -Axis-2 机器人关节特性2,理论辨识法得到的惯性张量 矩阵在任意形位上不一定是正定的,实际中也不 图1协作机器人三维模型图 Fig.1 3D model of the collaborative robot 可能存在,其控制也不稳定 为此,本文提出利用深度循环神经网络对协 作机器人动力学模型进行误差补偿,首先建立动 力学方程,然后采用不解体实验测量方法结合最 小二乘法对其中参数进行辨识.接着,针对协作机 器人的未建模特性或建模不精确的问题,采用深 度循环神经网络进行补偿,以减小动力学模型误 差并提高力矩预测精度.最后在实验中,以电机电 流等效作为关节力矩信号,把电机电流和电机常 数的乘积作为输出轴力矩,同时结合摩擦力模型 图2协作机器人D-H模型图 计算得到机器人关节的输出力矩,代替价格高昂 Fig.2 D-H structure of the collaborative robot
The excitation trajectory based on the Fourier series was optimized. The raw experimental data were used to train the proposed LSTM network. About the accuracy of the dynamic model and the compensation method for the collaborative robot, the root-mean-square error of the calculated torque relative to the actual measured torque was used to train the network and evaluate the proposed method. The analysis and the results of the experiment show that the compensated collaborative robot dynamics model based on LSTM network displays a good prediction on the actual torque, and the root-mean-square error between predicted and actual torques is reduced from 61.8% to 78.9% compared to the traditional model, the effectiveness of the proposed error compensation policy is verified. KEY WORDS collaborative robot;dynamics model;error compensation;recurrent neural network;long short-term memory 准确的机器人动力学模型是搭建仿真模型, 验证先进控制算法和对控制系统进行深度分析的 基础[1–2] . 随着对机器人动态性能要求的提高和协 作机器人概念的兴起,常规无模型控制方法,如 PID 算法不仅轨迹跟踪精度较低,抗干扰能力较 差,尤其无法实现碰撞检测、柔顺控制等人机交互 功能[3] . 对于多轴串联机器人进行动力学建模一般会 考虑重力、科里奥利力、惯性力和摩擦力等主要 因素,但是对于较复杂的特性,例如减速机柔性、 连杆弹性、摩擦力随工况的变化、电机转子惯性 力等,较少建立其数学模型[4–5] ,从而导致计算力矩 与实际力矩误差较大,阻碍了协作机器人碰撞检 测、拖动示教和柔顺控制的良好实现. 有学者对 此进行了研究,文献 [6–8] 各自建立了摩擦特性模 型并提出了针对性的补偿方法,也有采用机器学 习方法的,如利用反向传播(Back propagation,BP) 神经网络 [9] 和径向基函数 ( Radial basis function, RBF)网络进行拟合或补偿[10–11] ,有些也提出了对 应的控制方法[12] ,但鲜有研究对各种复杂特性综 合起来考虑的. 对于参数辨识技术,有解体测量计算方法[13–14]、 解体实验测量法[15– 16]、不解体实验测量方法[17– 18] 和理论辨识[19] 等方法. 解体方法无法或难以计算 机器人关节特性[20] ,理论辨识法得到的惯性张量 矩阵在任意形位上不一定是正定的,实际中也不 可能存在,其控制也不稳定[21] . 为此,本文提出利用深度循环神经网络对协 作机器人动力学模型进行误差补偿,首先建立动 力学方程,然后采用不解体实验测量方法结合最 小二乘法对其中参数进行辨识. 接着,针对协作机 器人的未建模特性或建模不精确的问题,采用深 度循环神经网络进行补偿,以减小动力学模型误 差并提高力矩预测精度. 最后在实验中,以电机电 流等效作为关节力矩信号,把电机电流和电机常 数的乘积作为输出轴力矩,同时结合摩擦力模型 计算得到机器人关节的输出力矩,代替价格高昂 且安装不便的力矩传感器,以完成补偿方法的实 验验证. 1 协作机器人动力学模型 本研究基于自主研发的六自由度协作机器 人 ,图 1 和图 2 分别为其三维模型图和 DenavitHartenberg(D-H)模型图,从图中可以看到轴 2、3、 4 的相互平行,逆运动学存在封闭解. 考虑重力、 科里奥利力、惯性离心力和摩擦力,采用欧拉–拉 格朗日法计算关节力矩,得到机器人刚体动力学 方程: τ = M(q) q¨ + H(q, q˙)+G(q)+τf (1) Axis-4 Axis-3 Axis-1 Axis-2 Axis-5 Axis-6 图 1 协作机器人三维模型图 Fig.1 3D model of the collaborative robot y x z y y a2 a3 d5 d6 d4 x x z z y y y x z y x x x z z z d1 图 2 协作机器人 D-H 模型图 Fig.2 D-H structure of the collaborative robot · 996 · 工程科学学报,第 43 卷,第 7 期
徐征等:基于深度循环神经网络的协作机器人动力学误差补偿 997 式中:g为关节角向量:g为关节角速度向量:为关 器通信采集位移、速度和电流等信息 节角加速度向量;M(q)为机械臂惯性矩阵; H(g,)为离心力和科里奥利力矩阵:G(g)为重力矩 gm0=gn+∑(@usinGu+-hacosto》) (6) 阵;为摩擦力项 式中:q:()∈R"为关节i在关节空间中的轨迹关于 机器人关节的减速机、轴承等带来的摩擦影 时间1的函数;wr是基频;qio(①)∈R"为常量偏移;每 响较大啊,导致角速度换向处,即在速度零点附 条轨迹包含11个参数,即ak,bk,q0和wr=1 近,计算力矩相对实际误差较大.针对该现象,采 激励轨迹的优劣与观测矩阵抑制噪声的能力 用Stribeck摩擦力模型对关节摩擦机械建模,其摩 和其病态性息息相关,直接影响辨识参数的精度, 擦力矩为: 这里通过观测矩阵W的条件数来定义目标函数: (2) J=Cond(W) (7) Tr Dq+usgn (g) 式中:D为黏滞摩擦系数矩阵;μ为库伦摩擦系数 式中:Cond(W=omax(W)/cmin(W),omax(W)和cmim 综合式(1)和(2),可以得到方程: (W分别为W的最大和最小奇异值. 目标函数值越小,则辨识参数对测量误差的 T=M(g)+(g.q)+G(g)+Dq+usgn(g) (3) 敏感度越低,实验辨识得到的参数精度就有可能 故方程(1)可改成如下线性形式: 更高.同时还要考虑实际机器人有运动性能的限 T:=(g.q.q)0+T (4) 制,以运动范围、起始和停止阶段的速度和加速度 式中,(q,4,为观测矩阵,仅与关节位置、速度、 为约束,则该激励轨迹优化问题可描述为: 加速度及机器人的结构参数相关.表示基本惯性 min() 参数向量,其包括机器人连杆质量、质心和转动惯 qmin≤lqi(tl≤qmax Yi,t 量等参数,但由于结构和安装特点,有部分参数对 gmin≤l9i(tl≤qmax Yi,t 机器人工作时的力矩没有贡献,在方程组中系数始 9min≤li(tl≤max Yi.t (8) gi(to)=gi(MM)=0 Yi.t 终为0,这部分参数是无法辨识得到的;还有部分 qi(to)=qi(mM)=0 Yi,t 元素在动力学方程中组合出现,是线性相关的,无 :(o)=:(M)=0 Yi.t 法辨识得到单独数值,只能求得组合值.经过对惯 式中:qmin、gmin、min、qmax、gmax和amax是各个关节 性参数进行重组后,得到能够可辨识参数的最小 角,关节速度,关节加速度的边界值;to、tM分别为 集合,即最小惯性参数集,式(4)可进一步表达为: 表示起始和终止时刻,由于采用傅里叶变换作为 Tr=Φr(q,q,4)8+Tr (5) 激励曲线,其周期性确保了起始和终止时刻的运 式中:中为重组后的观测矩阵:a为最小惯性参数 动参数一致连续性,在实际优化计算中省略对终 集向量. 止时刻的约束 对于模型精度,本文以预测力矩(计算力矩) 式(8)是一个非线性多约束的优化问题,可以 相对于实际测量力矩的均方根误差作为评价标 采用NSGA等目标优化算法四对其进行优化,得 准.若均方根误差较小,则说明模型精度高,反之 到优化后的激励轨迹如图3所示.三张图中,横轴 则精度较低 均为时间,纵轴依次为角位移,角速度和角加速 度.从图中可以看出,轨迹变化平滑,起止点均为 2激励轨迹生成 零,运动幅值较大,但也未超出限制范围,该优化 不解体实验测量方法需要驱动机器人运动以 后的激励轨迹将用于第4节的实验研究 获取数据,考虑到计算精度和实验可行性,机器人 3 深度循环神经网络误差补偿 运动轨迹即激励轨迹需要满足多种条件.六轴机 器人动力学运算复杂度高,在辨识后三轴的动力 循环神经网络(Recurrent neural network,RNN) 学参数时可以锁定前三轴单独实验,辨识的难度 是一类用于处理序列数据的神经网络,其中的长 大大降低,更具针对性且减小了运算量限于篇 短期记忆(Long short-term memory,LSTM)单元网 幅和运算量,本文仅对协作机器人末端轴4至轴 络相比于普通的人工神经网络,解决了早期 6的动力学参数进行了辨识和研究.实验采用傅 RNN网络存在的长时期依赖,梯度爆炸和梯度消 里叶级数前五项,即式(5)作为激励轨迹.由于是 失等问题?2刘,在对历史信息的保留和对未来信 周期函数,便于重复多次进行该实验,同时与驱动 息的预测上有较大进步.本研究将进一步探索LSTM
q q˙ q¨ M(q) H(q, q˙) G(q) τf 式中: 为关节角向量; 为关节角速度向量; 为关 节 角 加 速 度 向 量 ; 为 机 械 臂 惯 性 矩 阵 ; 为离心力和科里奥利力矩阵; 为重力矩 阵; 为摩擦力项. 机器人关节的减速机、轴承等带来的摩擦影 响较大[15] ,导致角速度换向处,即在速度零点附 近,计算力矩相对实际误差较大. 针对该现象,采 用 Stribeck 摩擦力模型对关节摩擦机械建模,其摩 擦力矩为: τf = Dq˙ +µsgn(q˙) (2) 式中: D 为黏滞摩擦系数矩阵; µ 为库伦摩擦系数. 综合式(1)和(2),可以得到方程: τ = M(q) q¨ + H(q, q˙)+G(q)+ Dq˙ +µsgn(q˙) (3) 故方程(1)可改成如下线性形式: τr = Φ(q, q˙, q¨)θ+τf (4) Φ(q, q˙, q¨) θ 式中, 为观测矩阵,仅与关节位置、速度、 加速度及机器人的结构参数相关. 表示基本惯性 参数向量,其包括机器人连杆质量、质心和转动惯 量等参数,但由于结构和安装特点,有部分参数对 机器人工作时的力矩没有贡献,在方程组中系数始 终为 0,这部分参数是无法辨识得到的;还有部分 元素在动力学方程中组合出现,是线性相关的,无 法辨识得到单独数值,只能求得组合值. 经过对惯 性参数进行重组后,得到能够可辨识参数的最小 集合,即最小惯性参数集,式(4)可进一步表达为: τr = Φr(q, q˙, q¨)θr +τf (5) 式中: Φr为重组后的观测矩阵; θr为最小惯性参数 集向量. 对于模型精度,本文以预测力矩(计算力矩) 相对于实际测量力矩的均方根误差作为评价标 准. 若均方根误差较小,则说明模型精度高,反之 则精度较低. 2 激励轨迹生成 不解体实验测量方法需要驱动机器人运动以 获取数据,考虑到计算精度和实验可行性,机器人 运动轨迹即激励轨迹需要满足多种条件. 六轴机 器人动力学运算复杂度高,在辨识后三轴的动力 学参数时可以锁定前三轴单独实验,辨识的难度 大大降低,更具针对性且减小了运算量[16] . 限于篇 幅和运算量,本文仅对协作机器人末端轴 4 至轴 6 的动力学参数进行了辨识和研究. 实验采用傅 里叶级数前五项,即式(5)作为激励轨迹. 由于是 周期函数,便于重复多次进行该实验,同时与驱动 器通信采集位移、速度和电流等信息. qi(t) = qi,0 + ∑5 k ( ai,ksin(kωf t)+bi,kcos(kωf t) ) (6) qi(t) ∈ R n ωf qi,0 (t) ∈ R n ai,k bi,k qi,0 ωf = 1 式中: 为关节 i 在关节空间中的轨迹关于 时间 t 的函数; 是基频; 为常量偏移;每 条轨迹包含 11 个参数,即 , , 和 . 激励轨迹的优劣与观测矩阵抑制噪声的能力 和其病态性息息相关,直接影响辨识参数的精度, 这里通过观测矩阵 W 的条件数来定义目标函数: J = Cond(W) (7) Cond(W) = σmax (W) /σmin (W) σmax (W) σmin (W) 式中: , 和 分别为 W 的最大和最小奇异值. 目标函数值越小,则辨识参数 θ 对测量误差的 敏感度越低,实验辨识得到的参数精度就有可能 更高. 同时还要考虑实际机器人有运动性能的限 制,以运动范围、起始和停止阶段的速度和加速度 为约束,则该激励轨迹优化问题可描述为: min(J) qmin ⩽ |qi(t)| ⩽ qmax ∀i,t q˙min ⩽ |q˙i(t)| ⩽ q˙max ∀i,t q¨min ⩽ |q˙i(t)| ⩽ q¨max ∀i,t qi(t0) = qi(tM) = 0 ∀i,t q˙i(t0) = q˙i(tM) = 0 ∀i,t q¨i(t0) = q¨i(tM) = 0 ∀i,t (8) qmin q˙min q¨min qmax q˙max q¨maxt0 tM 式中: 、 、 、 、 和 是各个关节 角,关节速度,关节加速度的边界值; 、 分别为 表示起始和终止时刻,由于采用傅里叶变换作为 激励曲线,其周期性确保了起始和终止时刻的运 动参数一致连续性,在实际优化计算中省略对终 止时刻的约束. 式(8)是一个非线性多约束的优化问题,可以 采用 NSGA 等目标优化算法[22] 对其进行优化,得 到优化后的激励轨迹如图 3 所示. 三张图中,横轴 均为时间,纵轴依次为角位移,角速度和角加速 度. 从图中可以看出,轨迹变化平滑,起止点均为 零,运动幅值较大,但也未超出限制范围,该优化 后的激励轨迹将用于第 4 节的实验研究. 3 深度循环神经网络误差补偿 循环神经网络(Recurrent neural network,RNN) 是一类用于处理序列数据的神经网络,其中的长 短期记忆(Long short-term memory,LSTM)单元网 络相比于普通的人工神经网络 ,解决了早期 RNN 网络存在的长时期依赖,梯度爆炸和梯度消 失等问题[23– 24] ,在对历史信息的保留和对未来信 息的预测上有较大进步. 本研究将进一步探索 LSTM 徐 征等: 基于深度循环神经网络的协作机器人动力学误差补偿 · 997 ·
998 工程科学学报,第43卷,第7期 2.5 3 (a) Axis-4 (b) 2.0 -Axis-5 A时 15 --Axis-6 \xis-6 1.0 0.5 0 0 -0.5 -1.0 -1.5 2 -2.0 -3 0 1000200030004000500060007000 01000200030004000500060007000 Time/ms Time/ms 5 (c) Axis-4 Axis-5 3 Axis-6 (s-P)o 2 0 1000200030004000500060007000 Time/ms 图3参数辨识所用激励轨迹.(a)位移:(b)速度:(c)加速度 Fig.3 Excitation trajectory for parameter identification:(a)position;(b)velocity;(c)acceleration 在机器人动力学方面的应用 机器人运动学和动力学数据在时间上连续相 关,且摩擦力的记忆特性和电机参数随温度变化 带来的时变特性,采用LSTM网络可以很好地补 偿这些因素.本研究采用具有细胞状态和门控结 C-1h 构的LSTM细胞单元以期实现较好的补偿效果 如图4所示,LSTM细胞单元增加了细胞状态 tanh 向量C和相关的门控结构,以控制遗忘和记忆的 方法较好地解决了普通RNN Cell存在的梯度爆炸 和梯度消失问题其前向运算过程为: fi=(Wr [h-1,x]+be) 图4LSTM隐含层细胞结构 i4=o(W:·[h-l,x]+b) Fig.4 LSTM cell of hidden layer C:tanh (Wc.[h-1,x]+bc) (9) Cr=fi*C1-1+ir*C LSTM网络训练过程采用是随时间反向传播 or=(Wo [h-1,x]+bo) 算法(Back propagation trough time,BPTT),与经典 h:=o:*tanh(C) 的反向传播算法类似,包括前向计算、反向计算、 式中:o为sigmoid函数;f为遗忘门输出量:W% 计算梯度、更新参数等步骤 W、Wc和W。依次为遗忘门、输入门、更新状和输 其中基于梯度的优化算法种类众多,本文选 出门状态参数;brb、bc和b依次为遗忘门、输人 用适应性动量估计(Adaptive moment estimation, 门、更新状和输出门状态的偏移量:C和h分别为 Adam)算法2.该算法是一种有效的基于梯度的 细胞输出向量和隐含状态,x为输入向量,i和C为 随机优化方法,能够对不同参数计算适应性学习 细胞更新状态中间变量,0为输出门中间变量,以 率且占用存储资源较少,相比于其他随机优化方 上各变量下角标为时间序列编号, 法,Adam算法在实际应用中整体表现更优
在机器人动力学方面的应用. 机器人运动学和动力学数据在时间上连续相 关,且摩擦力的记忆特性和电机参数随温度变化 带来的时变特性,采用 LSTM 网络可以很好地补 偿这些因素. 本研究采用具有细胞状态和门控结 构的 LSTM 细胞单元以期实现较好的补偿效果. 如图 4 所示,LSTM 细胞单元增加了细胞状态 向量 C 和相关的门控结构,以控制遗忘和记忆的 方法较好地解决了普通 RNN Cell 存在的梯度爆炸 和梯度消失问题. 其前向运算过程为: ft = σ(Wf ·[ht−1, xt]+bf) it = σ(Wi ·[ht−1, xt]+bi) C˜ t = tanh(WC ·[ht−1, xt]+bC) Ct = ft∗Ct−1 +it ∗C˜ t ot = σ(Wo [ht−1, xt]+bo) ht = ot ∗ tanh(Ct) (9) C˜ 式中 : σ 为 sigmoid 函数 ; f t 为遗忘门输出量 ; Wf, Wi、WC 和 Wo 依次为遗忘门、输入门、更新状和输 出门状态参数;bf,bi、bC 和 bo 依次为遗忘门、输入 门、更新状和输出门状态的偏移量;C 和 h 分别为 细胞输出向量和隐含状态,x 为输入向量,i 和 为 细胞更新状态中间变量,o 为输出门中间变量,以 上各变量下角标为时间序列编号. LSTM 网络训练过程采用是随时间反向传播 算法 (Back propagation trough time,BPTT),与经典 的反向传播算法类似,包括前向计算、反向计算、 计算梯度、更新参数等步骤. 其中基于梯度的优化算法种类众多,本文选 用适应性动量估 计 (Adaptive moment estimation, Adam) 算法[25] . 该算法是一种有效的基于梯度的 随机优化方法,能够对不同参数计算适应性学习 率且占用存储资源较少,相比于其他随机优化方 法,Adam 算法在实际应用中整体表现更优. (a) 2.5 2.0 1.5 1.0 0.5 0 −0.5 −1.0 −1.5 −2.0 3 2 1 0 −1 −2 −3 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 Position/rad Acceleration/(rad·s−2 ) Velocity/(rad·s−1 ) (c) 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 (b) 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 5 4 3 2 1 0 −1 −2 −3 −4 −5 Axis-4 Axis-5 Axis-6 Axis-4 Axis-5 Axis-6 Axis-4 Axis-5 Axis-6 图 3 参数辨识所用激励轨迹. (a)位移;(b)速度;(c)加速度 Fig.3 Excitation trajectory for parameter identification: (a) position; (b) velocity; (c) acceleration Ct−1 ht−1 xt σ σ σ tanh tanh ht ft it Ct Ot Ct ht ~ 图 4 LSTM 隐含层细胞结构 Fig.4 LSTM cell of hidden layer · 998 · 工程科学学报,第 43 卷,第 7 期