动态规划是用来解决多阶段决策过程最优化的一种方法,多阶段决策:是动态决策问题的一种特殊形式:系统的动态过程可以按照时间等进程分为状态相互联系而又相互区别的各个阶段:每个阶段都要进行决策,目的是使整个过程的决策达到最优效果多阶段决策求解思路将多阶段决策问题(n阶段)分解成n个具有递推关系的单阶段决策问题,进行正推或逆推计算。2023/1/2012
动态规划是用来解决多阶段决策过程最优化的一种方法。 多阶段决策: 是动态决策问题的一种特殊形式; 系统的动态过程可以按照时间等进程分为状态相互联系 而又相互区别的各个阶段; 每个阶段都要进行决策,目的是使整个过程的决策 达到 最优效果 多阶段决策求解思路: 将多阶段决策问题(n阶段)分解成n个具有递推关系的单阶 段决策问题,进行正推或逆推计算。 2023/1/20 12
s2基本概念、基本方程与最优化原理一、基本概念:1、阶段k:表示决策顺序的离散的量,阶段可以按时间或空间划分。(顺序编号法、逆序编号法)2、状态s:反应前一阶段决策的结果,又是本阶段作决策的依据和出发点(能确定地表示决策过程当前特征的量)。状态可以是数量,也可以是字符,数量状态可以是连续的,也可以是离散的。3、决策x:从某一状态向下一状态过渡时所做的选择。决策是所在状态的函数,记为x(sk)。决策允许集合Dk(sk):在状态sk下,允许采取决策的全体2023/1/2013
一、基本概念: 1、阶段k:表示决策顺序的离散的量,阶段可以按时间或空间划 分。(顺序编号法、逆序编号法) 2、状态s k:反应前一阶段决策的结果,又是本阶段作决策的依据 和出发点(能确定地表示决策过程当前特征的量)。状态可以是 数量,也可以是字符,数量状态可以是连续的,也可以是离散的。 3、决策xk:从某一状态向下一状态过渡时所做的选择。决策是 所在状态的函数,记为xk (sk )。 决策允许集合Dk (sk ):在状态sk下,允许采取决策的全体 §2 基本概念、基本方程与最优化原理 2023/1/20 13
4、策略Pkn(s):从第k阶段开始到最后第n阶段的决策序列,称k子策略。Pi.n(s)即为全过程策略。5、状态转移方程 Sk+1=T(Sk,Xl):某一状态以及该状态下的决策,与下一状态之间的函数关系。6、阶段指标函数V(Sk,X.):从状态S出发,选择决策X所产生的第k阶段指标。过程指标函数Vk.n(Sk;XkXk+1..,X,):从状态Sk出发,选择决策Xk,Xk+1,,Xn所产生的过程指标。2023/1/2014
4、策略Pk,n(sk ):从第k阶段开始到最后第n阶段的决策序列, 称k子策略。P1,n(s1)即为全过程策略。 5、状态转移方程 Sk+1=Tk(Sk, Xk):某一状态以及该状态下的 决策,与下一状态之间的函数关系。 6、阶段指标函数Vk (Sk , Xk ):从状态Sk出发,选择决策Xk所产 生的第k阶段指标。 过程指标函数Vk,n(Sk;Xk , Xk+1,., Xn ):从状态Sk出发,选 择决策Xk, Xk+1, ., Xn所产生的过程指标。 2023/1/20 14