9.2.6神经网络自适应评判控制 神经网络自适应评判控制通常由两个网络组成,如 图9-8所示。自适应评判网络通过不断的奖励、惩罚等 再励学习,使自己逐渐成为一个合格的“教师”,学习 完成后,根据系统目前的状态和外部激励反馈信号r(t) 产生一个内部再励信号0,以对目前的控制效果作出 评价。控制选择网络相当于一个在内部再励信号()指 导下进行学习的多层前馈神经网络控制器,该网络在进 行学习后,根据编码后的系统状态,在允许控制集中选 择下一步的控制作用
9.2.6 神经网络自适应评判控制 神经网络自适应评判控制通常由两个网络组成,如 图9-8所示。自适应评判网络通过不断的奖励、惩罚等 再励学习,使自己逐渐成为一个合格的“教师” ,学习 完成后,根据系统目前的状态和外部激励反馈信号r(t) 产生一个内部再励信号 ,以对目前的控制效果作出 评价。控制选择网络相当于一个在内部再励信号 指 导下进行学习的多层前馈神经网络控制器,该网络在进 行学习后,根据编码后的系统状态,在允许控制集中选 择下一步的控制作用。 r(t) r(t)
自适应 评价网络 外部再励反馈 内部再励 r() ) 控制选 u() ) 编码器 择网络 对象 图9-8神经网络自适应评判控制
自适应 评价网络 控制选 择网络 对象 ut yt 编码器 rt rˆt 内部再励 外部再励反馈 图9-8 神经网络自适应评判控制
9.2.7神经网络混合控制 该控制方法是集成人工智能各分支的优点,由神 经网络技术与模糊控制、专家系统等相结合而形成的 一种具有很强学习能力的智能控制系统。 由神经网络和模糊控制相结合构成模糊神经网络, 由神经网络和专家系统相结合构成神经网络专家系统。 神经网络混合控制可使控制系统同时具有学习、推理 和决策能力
9.2.7 神经网络混合控制 该控制方法是集成人工智能各分支的优点,由神 经网络技术与模糊控制、专家系统等相结合而形成的 一种具有很强学习能力的智能控制系统。 由神经网络和模糊控制相结合构成模糊神经网络, 由神经网络和专家系统相结合构成神经网络专家系统。 神经网络混合控制可使控制系统同时具有学习、推理 和决策能力
9.3单神经元网络控制 9.3.1单神经元自适应控制算法 单神经元自适应控制的结构如图9-9所示。 ) △(k) y() 对象 图99单神经元自适应PD控制结构
9.3.1 单神经元自适应控制算法 单神经元自适应控制的结构如图9-9所示。 图9-9 单神经元自适应PID控制结构
1 W1 W2 △U 单神经网络控制器