壽子策略 从k阶段到最终阶段,每一阶段的 决策所形成的序列 Pn(S)={X(S),X+1(Sk+),……,Xn(Sn
Page:11 QSC 华东理工大学 工商经济学院 运筹学 子策略 —— 从k阶段到最终阶段,每一阶段的 决策所形成的序列 Pk ,n (Sk ) Xk (Sk ), Xk +1(Sk 1 ), , Xn (Sn )
最优指标函数 当k阶段的状态为S,并采取最优子策略 Rn(Sk)={Xk(Sk),×k+(SA)…,Xn(Sn)} 此时得到的从k到n+1各阶段指标值的总和 f(S)=Op(1(Sk,X)④r1(Sk+1,X1)…er(Sn,xn)
Page:12 QSC 华东理工大学 工商经济学院 运筹学 最优指标函数 ——当k阶段的状态为Sk,并采取最优子策略 Pk ,n (Sk ) Xk (Sk ), Xk +1(Sk 1 ), , Xn (Sn ) 此时得到的从k到n+1各阶段指标值的总和: f k (Sk ) Optrk (Sk , Xk ) rk+1 (Sk+1 , Xk1 )rn (Sn , Xn )
13 Bellman最优性原理 “作为整个过程的最优策略具有这样的性 质:无论过去的状态和决策如何,相对于 前面决策所形成的状态,余下的决策必然 形成最优子策略
Page:13 QSC 华东理工大学 工商经济学院 运筹学 Bellman最优性原理 “作为整个过程的最优策略具有这样的性 质:无论过去的状态和决策如何,相对于 前面决策所形成的状态,余下的决策必然 形成最优子策略
动态规划递归方程 fK(Sk)=Opt(Sk, Xk)efx+ (Sk-1)) X∈D1(S k=n,n-1,…,1 n+ (S n+1 )=0(or)
Page:14 QSC 华东理工大学 工商经济学院 运筹学 动态规划递归方程 f (S ) Opt r (S ,X ) f (S ) k n, n 1, ,1 f (S ) 0 (or) 1 k k X D (S ) k k k k 1 k 1 n 1 n 1 k k k
15 建立动态规划模型及求解步骤 事划分阶段 确定状态变量及允许状态集合 4确定决策变量及决策空间 4确定状态转移方程 确定转移指标函数并建立递归方程
Page:15 QSC 华东理工大学 工商经济学院 运筹学 建立动态规划模型及求解步骤 划分阶段 确定状态变量及允许状态集合 确定决策变量及决策空间 确定状态转移方程 确定转移指标函数并建立递归方程