第八章动态规划s 1多阶段决策最优化问题举例S2基本概念、基本方程与最优化原理83离散确定性动态规划求解2024-10-27
2024-10-27 2 第八章 动态规划 §1 多阶段决策最优化问题举例 §2 基本概念、基本方程与最优化原理 §3 离散确定性动态规划求解
$1多阶段决策过程最优化问题举例例1最短路径问题下图表示从起点A到终点E之间各点的距离。求A到E的最短路径。RDB2024-10-27
2024-10-27 3 §1 多阶段决策过程最优化问题举例 例1 最短路径问题 下图表示从起点A到终点E之间各点的距离。求A到E的最 短路径。 A B B C D B C D E C 2 1 2 3 1 2 3 1 2 5 7 6 3 2 4 5 1 5 1 4 6 3 3 3 3 4 3
动态规划是用来解决多阶段决策过程最优化的一种方法。多阶段决策:是动态决策问题的一种特殊形式:系统的动态过程可以按照时间等进程分为状态相互联系而又相互区别的各个阶段每个阶段都要进行决策,目的是使整个过程的决策达到最优效果。多阶段决策求解思路:将多阶段决策问题(n阶段)分解成n个具有递推关系的单阶段决策问题,进行正推或逆推计算。2024-10-27
2024-10-27 4 动态规划是用来解决多阶段决策过程最优化的一种方法。 多阶段决策: 是动态决策问题的一种特殊形式; 系统的动态过程可以按照时间等进程分为状态相互联系 而又相互区别的各个阶段; 每个阶段都要进行决策,目的是使整个过程的决策 达到 最优效果。 多阶段决策求解思路: 将多阶段决策问题(n阶段)分解成n个具有递推关系的单阶 段决策问题,进行正推或逆推计算
82基本概念、基本方程与最优化原理一、基本概念:1.阶段k:表示决策顺序的离散的量,阶段可以按时间或空间划分。(顺序编号法、逆序编号法)2.状态sk:反应前一阶段决策的结果,又是本阶段作决策的依据和出发点(能确定地表示决策过程当前特征的量)。状态可以是数量,也可以是字符,数量状态可以是连续的,也可以是离散的。3.决策x:从某一状态向下一状态过渡时所做的选择。决策是所在状态的函数,记为x,(s)。决策允许集合D(s):在状态s下,允许采取决策的全体。2024-10-275
2024-10-27 5 一、基本概念: 1. 阶段k:表示决策顺序的离散的量,阶段可以按时间或空间划 分。(顺序编号法、逆序编号法) 2. 状态sk:反应前一阶段决策的结果,又是本阶段作决策的依据 和出发点(能确定地表示决策过程当前特征的量)。状态可以 是数量,也可以是字符,数量状态可以是连续的,也可以是离 散的。 3. 决策xk:从某一状态向下一状态过渡时所做的选择。决策是所 在状态的函数,记为xk(sk)。 决策允许集合Dk(sk):在状态sk下,允许采取决策的全体。 §2 基本概念、基本方程与最优化原理
4.含n个阶段的全过程策略「xi(si),x2(s2),…,xn(s)|:从第1阶段开始到最后第n阶段的决策序列;k子策略|xx(s),Xk+(Sk+1),.….,xn(sn)「:从第k阶段开始到最后第n阶段的决策序列。5. 状态转移方程 Sk+I=T(Sk,xi):某一状态以及该状态下的决策,与下一状态之间的函数关系。6.阶段指标函数V(Sk,X):从状态s出发,选择决策x所产生的第k阶段指标。过程指标函数Vk.n(SXk,Xk+1.xn):从状态t出发,选择决策xk,Xk+1,…,x,所产生的过程指标。2024-10-276
2024-10-27 6 4. 含n个阶段的全过程策略丨x1(s1), x2(s2), . , xn (sn )丨:从第1 阶段开始到最后第n阶段的决策序列; k子策略丨xk(sk), xk+1(sk+1), . , xn (sn )丨:从第k阶段开始到最 后第n阶段的决策序列。 5. 状态转移方程 sk+1=T(sk , xk):某一状态以及该状态下的决 策,与下一状态之间的函数关系。 6. 阶段指标函数Vk(sk , xk):从状态sk出发,选择决策xk所产生 的第k阶段指标。 过程指标函数Vk,n (sk , xk , xk+1 ,., xn ):从状态sk出发,选择 决策xk , xk+1 , ., xn所产生的过程指标