§2 基本概念、基本方程与最优化原理 、基本概念: 1、阶段k:表示决策顺序的离散的量,阶段可以按时间或空间划 分。(顺序编号法、逆序编号法) 2、状态S:反应前一阶段决策的结果,又是本阶段作决策的依据 和出发点(能确定地表示决策过程当前特征的量)。状态可以是 数量,也可以是字符,数量状态可以是连续的,也可以是离散的。 3、决策x,:从某一状态向下一状态过渡时所做的选择。决策是 所在状态的函数,记为Xk(Sk)。 决策允许集合Dk(Sk):在状态sk下,允许采取决策的全体 2025/4/6 17
2025/4/6 17 一、基本概念: 1、阶段k:表示决策顺序的离散的量,阶段可以按时间或空间划 分。(顺序编号法、逆序编号法) 2、状态sk:反应前一阶段决策的结果,又是本阶段作决策的依据 和出发点(能确定地表示决策过程当前特征的量)。状态可以是 数量,也可以是字符,数量状态可以是连续的,也可以是离散的。 3、决策xk:从某一状态向下一状态过渡时所做的选择。决策是 所在状态的函数,记为xk (sk )。 决策允许集合Dk (sk ):在状态sk下,允许采取决策的全体 §2 基本概念、基本方程与最优化原理
4、策略Pkm(S):从第k阶段开始到最后第n阶段的决策序列, 称k子策略。P1,n(S1)即为全过程策略。 5、状态转移方程Sk+1=Tk(Sk,X):某一状态以及该状态下 的决策,与下一状态之间的函数关系。 6、阶段指标函数Vk(S,X):从状态Sk出发,选择决策Xk所产 生的第k阶段指标。 过程指标函数Vkn(Sk;XX,X:从状态Sk出发,选 择决策XkXk+1,Xn所产生的过程指标。 2025/4/6 18
2025/4/6 18 4、策略Pk,n(sk ):从第k阶段开始到最后第n阶段的决策序列, 称k子策略。P1,n(s1 )即为全过程策略。 5、状态转移方程Sk+1=Tk (Sk , Xk ):某一状态以及该状态下 的决策,与下一状态之间的函数关系。 6、阶段指标函数Vk (Sk , Xk ):从状态Sk出发,选择决策Xk所产 生的第k阶段指标。 过程指标函数Vk,n(Sk;Xk , Xk+1,., Xn ):从状态Sk出发,选 择决策Xk , Xk+1, ., Xn所产生的过程指标