子策略 从k阶段到最终阶段,每一阶段的 决策所形成的序列 P, (Sk)=Xk(Sk),Xk+(Sk+1),.,X(Sn)
Page:11 QSC 华东理工大学 工商经济学院 运筹学 子策略 —— 从k阶段到最终阶段,每一阶段的 决策所形成的序列 Pk,n (Sk ) = Xk (Sk ), Xk +1 (Sk +1 ), , Xn (Sn )
最优指标函数 当k阶段的状态为S,并采取最优子策略 2n(S)=(X(Sk),Xk+(Sk)…Ⅹa(Sn} 此时得到的从k到n+1各阶段指标值的总和: fk(Sk)=Opt(K(Sk,Xk )0k+(Sk+,Xk+1)E.r,(Sn, X,)
Page:12 QSC 华东理工大学 工商经济学院 运筹学 最优指标函数 ——当k阶段的状态为Sk,并采取最优子策略 Pk,n (Sk ) = Xk (Sk ), Xk +1 (Sk +1 ), , Xn (Sn ) 此时得到的从k到n+1各阶段指标值的总和: f k (Sk ) = Optr k (Sk ,Xk ) r k+1 (Sk+1 ,Xk+1 )r n (Sn ,Xn )
13 Bellman最优性原理 “作为整个过程的最优策略具有这样的性 质:无论过去的状态和决策如何,相对于 前面决策所形成的状态,余下的决策必然 形成最优子策略
Page:13 QSC 华东理工大学 工商经济学院 运筹学 Bellman最优性原理 “作为整个过程的最优策略具有这样的性 质:无论过去的状态和决策如何,相对于 前面决策所形成的状态,余下的决策必然 形成最优子策略
1 4 动态规划递归方程 (Sk)=Opt rK(Sk, Xk)ofk+ (Sk+)) Xk∈Dk(Sk) k=n.n-1.….1 n (S n 1)=0(or)1
Page:14 QSC 华东理工大学 工商经济学院 运筹学 动态规划递归方程 f (S ) Opt r (S ,X ) f (S ) k n, n 1, ,1 f (S ) 0 (or) 1 k k X D (S ) k k k k 1 k 1 n 1 n 1 k k k = = − = + + + +
建立动态规划模型及求解步骤 4划分阶段 4确定状态变量及允许状态集合 4确定决策变量及决策空间 4确定状态转移方程 4确定转移指标函数并建立递归方程
Page:15 QSC 华东理工大学 工商经济学院 运筹学 建立动态规划模型及求解步骤 划分阶段 确定状态变量及允许状态集合 确定决策变量及决策空间 确定状态转移方程 确定转移指标函数并建立递归方程