常见的指标函数的形式是:过程和它的任一子过程的指标是它所包含的各阶段的指标和。即无后效性n的结果Vk.n(Sk,uk,L ,Sn+1)=a V,((s,,u,)=其中V(s,u;)表示第i阶段的阶段指标。这时6C1上式可写成21El2D183B15F1Vk, n(Sk,uk....C253E2TD2Sn+1)8C33B2F2?E36D383Vs. 6= Vs, 6 (Ss, us, V6, 664C4=ds(Ss,us)+ V6, 6234156
常见的指标函数的形式是: 过程和它的任一子过程的指标是它所包含的各阶段 的指标和。即 无后效性 的结果 其中V(sj , uj ) 表示第 j 阶段的阶段指标。这时 上式可写成 Vk, n (sk ,uk ,., sn+1) = vk (sk ,uk )+ Vk+1, n V5, 6= V5, 6 (s5 , u5 ,V6, 6 ) =d5 (s5 ,u5 )+ V6, 6 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 E3 F1 F2 G 4 5 3 1 3 6 8 7 6 6 8 3 5 3 3 8 2 2 1 2 3 3 3 5 5 2 6 6 4 3 1 2 3 4 5 6
过程和它的任意子过程的指标是它所包含的各阶段的指标的乘积。即Vk.n(Sh,ur,L ,Sn+1)=Ov,(S,u,)j=k可改写成Vh, n(Sk,uk..., Sn+1)= Vr(Skuk) k+1, n(Sk+1, Uk+1, ..., Sn+1)最优值函数:指标函数的最优值,记为fi(s)。表示从第 k阶段的状态s,到第 n 阶段的终止状态的采取最优策略所得到的指标函数值。即fh(sk)= opt Vk.n(Sk,uk,L ,Sn+1)(uk,L,un)
过程和它的任意子过程的指标是它所包含的各 阶段的指标的乘积。即 可改写成 Vk, n (sk ,uk ,., sn+1) = vk (sk ,uk ) Vk+1, n (sk+1, uk+1, ., sn+1) 指标函数的最优值,记为 f k (sk )。表示从第 k 阶 段的状态 sk 到第 n 阶段的终止状态的采取最优策略 所得到的指标函数值。即 最优值函数:
北京交通大学全过程的最优值函数记为fi(s1)经济管理学院SchoolIofEconoics andManagomentBojing Jiaotong Universityf。 (F)=4fo (so)=?fc (F2)=3C162D13B15FC2二s(E)=?5D28C3AB2F2YE36D38344京文6用大
A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 E3 F1 F2 G 4 5 3 1 3 6 8 7 6 6 8 3 5 3 3 8 2 2 1 2 3 3 3 5 5 2 6 6 4 3 1 2 3 4 5 6 f 6 (s6 )=? f 6 (F1 )=4 f 6 (F2 )=3 f 5 (E1 )=? 全过程的最优值函数记为 f 1 (s1 )
北京交通大学经济肇理学院School of Eoics andManagomentBoljingJiaotong University多阶段决策过程的数学模型:(具有无后效性,以和式为例)nVk.n(sk, uk, /4 , Sn+1)=a v;(sj, u)opt(uj, U....,un]j=kSk+1=Tk(Sk, ur)SkSks.t.u,Dkk-1,2, ...,n北京交通大学
多阶段决策过程的数学模型: (具有无后效性, 以和式为 例) opt {u1 , u2 ,.,un } sk+1 =Tk (sk , uk ) skSk ukDk k=1,2, .,n s.t
小结:无后效性动态规划本质上是多阶段决策过程:概念:阶段变量k、状态变量 sk、决策变量uk;方程:状态转移方程Sk+1 = T,(Sk,u,)效益指标:Vk, n= Vk, n (Sk, Uk, Sk+1, Uk+1 , Sn+1)= [Sk, Uk,Vk+1, n (Sk+1, Uk+1, Sn+1)]和、积指标函数形式:可递推fh (sk)=optVk, n(Sk, Uk.....(uk:un!Sn+1)
小结: 方程:状态转移方程 概念:阶段变量 k﹑状态变量 sk﹑决策变量 uk ; 动态规划本质上是多阶段决策过程; 效益 指标函数形式: 和、积 无后效性 可递推 指标: Vk, n= Vk, n (sk , uk ,sk+1, uk+1 , , sn+1 ) f k (sk )= opt Vk, n (sk , uk ,., sn+1) {uk , ., un } = k [sk , uk ,Vk+1, n (sk+1, uk+1 , , sn+1 )]