第11章迭代学习控制 实际控制中存在一类轨迹跟踪问题,它的控制任务是 寻找控制律(),使得被控对象输出()在有限时间[O,] 上沿着整个期望轨迹实现零误差轨迹跟踪。这列跟踪问题是 具有挑战性的控制问题。 人们在处理实际场合中的重复操作任务时,往往依据 对象的可重复动态行为与期望行为的差距来调整决策。通过 重复操作,使得对象行为与期望行为的配合达到要求。这时, 衡量动态行为的指标是某种满意指标
第11章 迭代学习控制 实际控制中存在一类轨迹跟踪问题,它的控制任务是 寻找控制律 ,使得被控对象输出 在有限时间 上沿着整个期望轨迹实现零误差轨迹跟踪。这列跟踪问题是 具有挑战性的控制问题。 人们在处理实际场合中的重复操作任务时,往往依据 对象的可重复动态行为与期望行为的差距来调整决策。通过 重复操作,使得对象行为与期望行为的配合达到要求。这时, 衡量动态行为的指标是某种满意指标。 u t y t 0,T
迭代学习控制(ILC,Iterative Learning Control)的思想最 初由日本学者Uchiyama于1978年提出[23],于1984年由Arimoto等 人[24]做出了开创性的研究。这些学者借鉴人们在重复过程中追求 满意指标达到期望行为的简单原理,成功地使得具有强耦合非线性 多变量的工业机器人快速高精度地执行轨迹跟踪任务。其基本做法 是对于一个在有限时间区间上执行轨迹跟踪任务的机器人,利用前 一次或前几次操作时测得的误差信息修正控制输入,使得该重复任 务在下一次操作过程中做得更好。如此不断重复,直至在整个时间 区间上输出轨迹跟踪上期望轨迹。 迭代学习控制适合于具有重复运动性质的被控对象,通过迭代 修正达到某种控制目标的改善。迭代学习控制方法不依赖于系统的 精确数学模型,能在给定的时间范围内,以非常简单的算法实现不确 定性高的非线性强耦合动态系统的控制,并高精度跟踪给定期望轨 迹,因而一经推出,就在运动控制领域得到了广泛的运用
迭代学习控制(ILC,Iterative Learning Control)的思想最 初由日本学者Uchiyama于1978年提出[23],于1984年由Arimoto等 人[24]做出了开创性的研究。这些学者借鉴人们在重复过程中追求 满意指标达到期望行为的简单原理,成功地使得具有强耦合非线性 多变量的工业机器人快速高精度地执行轨迹跟踪任务。其基本做法 是对于一个在有限时间区间上执行轨迹跟踪任务的机器人,利用前 一次或前几次操作时测得的误差信息修正控制输入,使得该重复任 务在下一次操作过程中做得更好。如此不断重复,直至在整个时间 区间上输出轨迹跟踪上期望轨迹。 迭代学习控制适合于具有重复运动性质的被控对象,通过迭代 修正达到某种控制目标的改善。迭代学习控制方法不依赖于系统的 精确数学模型,能在给定的时间范围内,以非常简单的算法实现不确 定性高的非线性强耦合动态系统的控制,并高精度跟踪给定期望轨 迹,因而一经推出,就在运动控制领域得到了广泛的运用
迭代学习控制方法具有很强的工程背景,这些背景包括: 执行诸如焊接、喷涂、装配、搬运等重复任务的工业机器人; 指令信号为周期函数的伺服系统;数控机床;磁盘光盘驱动 系统;机械制造中使用的坐标测量机等。 由于迭代学习控制模拟了人脑学习和自我调节的功能, 因而是一种典型的智能控制方法[25]。经历了三十多年的发 展,迭代学习控制已成为智能控制中具有严格数学描述的一 个分支。目前,迭代学习控制在学习算法、收敛性、鲁棒性、 学习速度及工程应用研究上取得了很大的进展
迭代学习控制方法具有很强的工程背景,这些背景包括: 执行诸如焊接、喷涂、装配、搬运等重复任务的工业机器人; 指令信号为周期函数的伺服系统;数控机床;磁盘光盘驱动 系统;机械制造中使用的坐标测量机等。 由于迭代学习控制模拟了人脑学习和自我调节的功能, 因而是一种典型的智能控制方法[25]。经历了三十多年的发 展,迭代学习控制已成为智能控制中具有严格数学描述的一 个分支。目前,迭代学习控制在学习算法、收敛性、鲁棒性、 学习速度及工程应用研究上取得了很大的进展
11.1基本原理 设被控对象的动态过程为 (t)=f(x(t),u(t),t),y(t)=g(x(t),u(t),t) (11.1) 式中,x∈R、yeR"、ueR分别为系统的状态,输出和输入变 量,∫()、8()为适当维数的向量函数,其结构与参数均未 知。若期望控制“④存在,则迭代学习控制的目标为:给定 期望输出y()和每次运行的初始状态x(O),要求在给定的时 间te[0,T]内,按照一定的学习控制算法通过多次重复的运行, 使控制输入u)→u),而系统输出y@→y(0第k次运行 时,式(11.1)表示为:
11.1 基本原理 设被控对象的动态过程为 , (11.1) 式中, 分别为系统的状态,输出和输入变 量, 、 为适当维数的向量函数,其结构与参数均未 知。若期望控制 存在,则迭代学习控制的目标为:给定 期望输出 和每次运行的初始状态 ,要求在给定的时 间 内,按照一定的学习控制算法通过多次重复的运行, 使控制输入 ,而系统输出 第k 次运行 时,式(11.1) 表示为: x(t) f (x(t),u(t),t) y(t) g(x(t),u(t),t) n m r xR 、yR 、uR f () g() d u (t) d y (t) (0) k x t 0,T d ( ) ( ) k u t u t d ( ) ( ) k y t y t
x()=fx(t),u4(),t),y(t)=g&(),u(),t) (11.2) 跟踪误差为: e()=y:(@)-y(t) (11.3) 迭代学习控制可分为开环学习和闭环学习。 开环学习控制的方法是:第k+1次的控制等于第k次控制 再加上第k次输出误差的校正项,即 uk+()=L(u(),ex() (11.4) 闭环学习策略是:取第K+1次运行的误差作为学习的修正 项,即 u(t)=L(u(t),(t) (11.5) 式中,L为线性或非线性算子
(11.2) 跟踪误差为: (11.3) 迭代学习控制可分为开环学习和闭环学习。 开环学习控制的方法是:第k+1次的控制等于第k次控制 再加上第k次输出误差的校正项,即 (11.4) 闭环学习策略是:取第K+1次运行的误差作为学习的修正 项,即 (11.5) 式中,L为线性或非线性算子。 ( ) ( ( ), ( ), ) ( ) ( ( ), ( ), ) k k k k k k x t f x t u t t ,y t g x t u t t d ( ) ( ) ( ) k k e t y t y t 1( ) L( ( ), ( )) k k k t t t u u e 1 1 ( ) L( ( ), ( )) k k k t t t u u e