动态视问氩宾俐 状态1状态2状态3 状态4 状态5状态6状态7 2 3 B1¥3 A E G 2 B 第1阶段第2阶段第3阶段第4阶段|第5阶段「第6阶段
A 动态规划问题实例 C4 C2 D3 D2 G B2 B1 C1 C3 D1 E3 E2 E1 F2 F1 5 3 1 3 6 8 7 6 6 8 3 5 3 3 8 4 2 2 1 2 3 3 3 5 5 2 6 6 4 3 第1阶段 第2阶段 第3阶段 第4阶段 第5阶段 状态1 状态2 状态3 状态4 状态5 状态6 第6阶段 状态7
动态說剡的基本食 3决策 当一阶段的状态确定后,可以作出不同的选择从而 演变到下一阶段的某个状态,这种选择手段称为决簟。 在最优控制问题中也称为控制。 描述决策的变量,称为决策变量。决策变量的允许 取值的范圆称为允许决簟集合。决策变量是状态变量的 函数。用u()表示第K阶段处于状态Sk时的决簟变量; D(Sk)表示Sk的允许决策集合
动态规划的基本概念 3.决策 当一阶段的状态确定后,可以作出不同的选择从而 演变到下一阶段的某个状态,这种选择手段称为决策。 在最优控制问题中也称为控制。 描述决策的变量,称为决策变量。决策变量的允许 取值的范围称为允许决策集合。决策变量是状态变量的 函数。用uk (sk )表示第K阶段处于状态sk时的决策变量; Dk (sk )表示sk的允许决策集合
动态视问氩宾俐 状态1状态2状态3 状态4 状态5状态6状态7 D26)={C、 2 3 B1¥3 A E G 2 B 第1阶段第2阶段第3阶段第4阶段|第5阶段「第6阶段
A 动态规划问题实例 C4 C2 D3 D2 G B2 B1 C1 C3 D1 E3 E2 E1 F2 F1 5 3 1 3 6 8 7 6 6 8 3 5 3 3 8 4 2 2 1 2 3 3 3 5 5 2 6 6 4 3 第1阶段 第2阶段 第3阶段 第4阶段 第5阶段 状态1 状态2 状态3 状态4 状态5 状态6 第6阶段 状态7 u2 (B2 )=C2 D2 (B2 )={C2 ,C3 ,C4 }
动态說剡的基本食 4.策略 个按顺序排列的决篥组成的集合。由过程的 第K阶段开始到终止阶段为止的过程称为问题的后 部子过程。由每段的决簑按顺序排列组成的决簟 函教序列{k(Sk),un(Sn}称为K子过程策略,简称 子簟略,记为Pkn(Sk) 当K=1时,此决策函数序列称为全过程的一 个策略,简称篥略,记为P,n(S1),即: P1,n(S1)={u1(S1),u2(S2),…,un(Sn)
动态规划的基本概念 4.策略 一个按顺序排列的决策组成的集合。由过程的 第K阶段开始到终止阶段为止的过程称为问题的后 部子过程。由每段的决策按顺序排列组成的决策 函数序列{uk (sk ),…,un (sn )}称为K子过程策略,简称 子策略,记为pk,n(sk )。 当K=1时,此决策函数序列称为全过程的一 个策略,简称策略,记为p1,n(s1 ),即: p1,n(s1 )= {u1 (s1 ), u2 (s2 ),…,un (sn )}
动态视问氩宾俐 状态1状态2状态3 状态4 状态5状态6状态7 2 3 B1¥3 A E G 2 B E p3.6(C2)={u3(C2),u4(D2,u5(E3),6(F1 P1.6(4)={u1(4),u2(B1),u3(C2),u4D2),u5(E3,u6(F1)
A 动态规划问题实例 C4 C2 D3 D2 G B2 B1 C1 C3 D1 E3 E2 E1 F2 F1 5 3 1 3 6 8 7 6 6 8 3 5 3 3 8 4 2 2 1 2 3 3 3 5 5 2 6 6 4 3 状态1 状态2 状态3 状态4 状态5 状态6 状态7 p3,6 (C2 )={u3 (C2 ), u4 (D2 ), u5 (E3 ), u6 (F1 )} p1,6 (A)={u1 (A), u2 (B1 ), u3 (C2 ), u4 (D2 ), u5 (E3 ), u6 (F1 )}