6、指标函数 用于衡量所选定的策略优劣的数量指标称为指标函数 V1n(s,p)-在初始状态为s时采用原过程策略p,所对应 的指标函数 kn(k,pn)--在第阶段状态为时采用后部子过程 策略p所对应的指标函数 最优策略pn;使指标函数n(,Pn)达到最优的策略 最优值函数f)止采用最优策略p*n时的指标函数值 从第k阶段状态S开始到过程终 ()=Vkn(,P*) *k opt Vknsk, pk Pk.n f(s)-初始状态为s时全过程采用最优策略p* 所对应的指标函数值
6、指标函数 用于衡量所选定的策略优劣的数量指标称为指标函数 ( ) 的指标函数 V1,n s1 , p1,n − −在初始状态为s1 时采用原过程策略p1,n 所对应 ( ) 策略 所对应的指标函数 在第 阶段状态为 时采用后部子过程 k n k n k k n k p V s p k s , , , , − − − 最优策略 p * k ,n :使指标函数Vk,n (sk , pk,n )达到最优的策略 ( ) k k 最优值函数f s ( ) 所对应的指标函数值 初始状态为 时全过程采用最优策略p n f s s 1 1 − − 1 * 1, 止采用最优策略 时的指标函数值 从第 阶段状态 开始到过程终 k n k p k s * , − − − ( ) k k f s ( ) k n k k n p P opt V s p k n k n , , , , , ( ) = k n k p k n V s , * , =
最优化原理: 个过程的最优策略具有这样的性质,即无论初始 状态及初始决策如何,对于先前决策所形成的状态 而言,其以后的所有决策必构成最优策略 对最短路问题: = 若C→D2→>E1→>F是C到F的最优策略(最短路) 则不论前面A如何到达B,B又如何到达C1 对状态C1来说,必有: D2→>E1→>F是D2到F的最优策略 E1→F是E1到F的最优策略
二、最优化原理: 一个过程的最优策略具有这样的性质,即无论初始 状态及初始决策如何,对于先前决策所形成的状态 而言,其以后的所有决策必构成最优策略 对最短路问题: 若C1 → D2 → E1 → F 是C1 到F的最优策略(最短路) 对状态C1 来说,必有: ○A ○B1 ○F ○B2 ○B3 ○C1 ○C2 ○ ○C3 D2 ○D1 ○E2 ○E1 则不论前面A如何到达B,B又如何到达C1 D2 → E1 → F是D2 到F的最优策略 E1 → F是E1 到F的最优策略