4-2动态规划的 婷。基本概念和模型
4-2 动态规划的 基本概念和模型
基本概念 DP中描述多殿决策过程的基本概念主要有 ●阶段和阶段变量 ●状态和状态变量; ●决策、决策变量和决策序列 ●状态转移方程 ●阶段效应和目标函数等
一、基本概念 DP中描述多段决策过程的基本概念主要有: 阶段和阶段变量; 状态和状态变量; 决策、决策变量和决策序列; 状态转移方程; 阶段效应和目标函数等
1.阶段和阶段变量 把所研究的多段决策过程恰当地划分为着干 个相互独立又相互联系的部分,每一个部分 就称为一个阶段。事实上一个阶段也就是需 要作出一个决策的子问题部分。通常阶段是 按照过程进行的时间和空间上的先后顺序划 分的,并用阶段变量k表示。阶段数等于多段 决策过程中从开始到结束所需要作出决策的 数目,划分阶段的目的是便于求解
1. 阶段和阶段变量 把所研究的多段决策过程恰当地划分为若干 个相互独立又相互联系的部分,每一个部分 就称为一个阶段。事实上一个阶段也就是需 要作出一个决策的子问题部分。通常阶段是 按照过程进行的时间和空间上的先后顺序划 分的,并用阶段变量k表示。阶段数等于多段 决策过程中从开始到结束所需要作出决策的 数目,划分阶段的目的是便于求解
2.状态和状态变量 状态是描述系统状况所必须的信息。一般 定义为某一个阶段的初始点、初始位置或 初始情况。状态变量必须包含在给定的阶 段上确定全部允许决策所需要的信息,阶 段k的状态表示为X。比如:在最短路问 题中,状态就是网络中的各个节点
2. 状态和状态变量 状态是描述系统状况所必须的信息。一般 定义为某一个阶段的初始点、初始位置或 初始情况。状态变量必须包含在给定的阶 段上确定全部允许决策所需要的信息,阶 段k的状态表示为xk。比如:在最短路问 题中,状态就是网络中的各个节点
状态变量的取值有一定的允许范围, 称为状态可能集。状态可能集可以是 个离散取值的集合,也可以是一个 ∠连续的区间,视所给问题而定。 状态可能集是关于状态的约束条件 状态可能集用相应阶段状态x的大写 字母X表示,其中 Xk∈Nk
状态变量的取值有一定的允许范围, 称为状态可能集。状态可能集可以是 一个离散取值的集合,也可以是一个 连续的区间,视所给问题而定。 状态可能集是关于状态的约束条件。 状态可能集用相应阶段状态xk的大写 字母Xk表示,其中xkXk