SHUFE 第二节动态规划原理 策略 policy) 多阶段决策过程中,每一阶段均有一个决策,依序组合成 个全过程的决策序列,称为全过程策略。 PLn(3={x,x2),…,x1},简记p1n={xp,xy…,x 从过程的某个阶段开始到最终阶段结束称为后部子过程。 从第κ阶段开始的后部子策略称为第k子过程策略。 kn(S)={xk(S,xk+1k+),…,xS小},简记pkn={x,x k+19…9 每一阶段有若干状态每个状态又有若干个不同的决策即 有许多策略可供选择。全体策略构成允许策略集合Pkn(S。 能使预期目标达到最优效果的策略称为最优策略Pkn 构成最优策略的各决策称为相应阶段的最优决策xk 上海财经大学国际工商管理学院
上海财经大学国际工商管理学院 SHUFE 11 第二节 动态规划原理 • 策略(policy) ▪ 多阶段决策过程中,每一阶段均有一个决策,依序组合成 一个全过程的决策序列,称为全过程策略。 p1,n(s1 )={x1 (s1 ),x2 (s2 ) ,…, xn (sn )} ,简记p1,n ={x1 , x2 ,…, xn} ▪ 从过程的某个阶段开始到最终阶段结束称为后部子过程。 从第k阶段开始的后部子策略称为第k子过程策略。 pk,n(sk )={xk (sk ), xk+1 (sk+1 ) ,…, xn (sn )} ,简记pk,n={xk , xk+1 ,…, xn} ▪ 每一阶段有若干状态,每个状态又有若干个不同的决策,即 有许多策略可供选择。全体策略构成允许策略集合Pk,n(sk )。 ▪ 能使预期目标达到最优效果的策略称为最优策略P * k,n, ▪ 构成最优策略的各决策称为相应阶段的最优决策x * k
SHUFE 第二节动态规划原理 状态转移方程 n下一阶段状态s+是本阶段状态变量s和决策变量x的函数, 即 k+=(Sk xSk)=t(, xk 从状态s出发到下一阶段状态S+的转移规律称为状态转移 方程。 上海财经大学国际工商管理学院
上海财经大学国际工商管理学院 SHUFE 12 第二节 动态规划原理 • 状态转移方程 ▪ 下一阶段状态sk+1 是本阶段状态变量sk 和决策变量xk的函数, 即 sk+1 =T(sk , xk (sk )) =T(sk , xk ) ▪ 从状态sk出发到下一阶段状态sk+1的转移规律称为状态转移 方程