85.2动态规划的基本概念和基本思想一、基本概念使用动态规划方法求解决策问题首先要将问题改造成符合动态规划求解要求的形式要涉及以下概念:(2)状态(1)阶段(3)决策与策略(4)状态转移(5)指标函数
使用动态规划方法求解决策问题首先要将 问题改造成符合动态规划求解要求的形式, 要涉及以下概念: (1)阶段 (2)状态 (3)决策与策略 (4)状态转移 (5)指标函数 §5.2 动态规划的基本概念和基本思想 一、基本概念
(1)划分阶段把一个复杂决策问题按时间或空间特征分解为若干(n)个相互联系的阶段(stage),以便按顺序求解;阶段变量描述当前所处的阶段位置,一般用下标k表示;
(1) 划分阶段 把一个复杂决策问题按时间或空间特 征分解为若干(n)个相互联系的阶段 (stage), 以便按顺序求解; 阶段变量描述当前所处的阶段位置,一 般用下标 k 表示;
(2)确定状态每阶段有若干状态(state),表示某一阶段决策面临的条件或所处位置及运动特征的量,称为状态。反映状态变化的量叫作状态变量。k阶段的状态特征可用状态变量sk或x描述;状态有起始、中间、最终状态之分,每一阶段的全部状态构成该阶段的状态集合Sk,并有SkES,或xiESk。每个阶段的状态可分为初始状态和终止状态,或称输入状态和输出状态阶段的初始状态记作sk,终止状态记为sk+1
每阶段有若干状态(state), 表示某一阶段决策面 临的条件或所处位置及运动特征的量,称为状 态。反映状态变化的量叫作状态变量。 k 阶 段的状态特征可用状态变量 sk 或 xk描述; 状态有起始、中间、最终状态之分,每一阶段 的全部状态构成该阶段的状态集合Sk,并有 skSk或xkSk。每个阶段的状态可分为初始状 态和终止状态,或称输入状态和输出状态, 阶段的初始状态记作sk ,终止状态记为sk+1 (2) 确定状态
(3)决策、决策变量所谓决策就是确定系统过程发展的方案决策的实质是关于状态的选择,是决策者从给定阶段状态出发对下一阶段状态作出的选择。用以描述决策变化的量称之决策变量,和状态变量一样,决策变量可以用一个数一组数或一向量来描述.也可以是状态变量的函数,记以u=u(sk),表示于k阶段状态S时的决策变量
(3) 决策、决策变量 所谓决策就是确定系统过程发展的方案, 决策的实质是关于状态的选择,是决策者 从给定阶段状态出发对下一阶段状态作出 的选择。 用以描述决策变化的量称之决策变量, 和状态变量一样,决策变量可以用一个数, 一组数或一向量来描述.也可以是状态变量 的函数,记以 ,表示于k 阶段状 态 sk 时的决策变量. ( ) k k k u = u s
决策变量的取值往往也有一定的容许范围称之允许决策集合决策变量u(s)的允许决策集用 Uk(Sk)表示,u;(s) EUk(S),允许决策集合实际是决策的约束条件
决策变量的取值往往也有一定的容许范围, 称之允许决策集合.决策变量 uk (sk )的允许决 策集用 UK (SK )表示, uk (sk ) UK (SK ) , 允许决 策集合实际是决策的约束条件