动态剡 本章内容重点 √多阶段决策过程的录优化 √动态规划的基本概念和基本原理 √动态规划方法的基本步栗 √动态规划方油应用举例
动态规划 本章内容重点 ✓多阶段决策过程的最优化 ✓动态规划的基本概念和基本原理 ✓动态规划方法的基本步骤 ✓动态规划方法应用举例
动态视 动态规划是解决多阶段决簟过程最优化的一种数学方 法。1951年美国数学家贝尔曼等人根据一类多阶段决策问 题的特点,把多阶段决簟闷題变换为一糸列互相联糸的 阶段闷题,然后逐个加以解决。贝尔曼的《动态规划》于 1957年出版。 动态规划方油与“时间”头糸很密切,随着时间过程 的发展而决定各肘段的决簟,产生一个决簟序列,这就是 “动态”的意思。然而它也可以处理与肘问无关的静态问 题,只要在问题中人为地引入“附段”因素,就可以将其 转化为一个多阶段决簟问题。在本章中将介绍这种处理方 法
动态规划 动态规划是解决多阶段决策过程最优化的一种数学方 法。1951年美国数学家贝尔曼等人根据一类多阶段决策问 题的特点,把多阶段决策问题变换为一系列互相联系的单 阶段问题,然后逐个加以解决。贝尔曼的《动态规划》于 1957年出版。 动态规划方法与“时间”关系很密切,随着时间过程 的发展而决定各时段的决策,产生一个决策序列,这就是 “动态”的意思。然而它也可以处理与时间无关的静态问 题,只要在问题中人为地引入“时段”因素,就可以将其 转化为一个多阶段决策问题。在本章中将介绍这种处理方 法
动态视 所谓多阶段决策闷题是指这样的决问题:其过程可分 为若干个相互联的阶段,每一阶段都对应着一组可供选择 的决策,每一决簟的选定即依赖于当前面临的状态,又影 响以后总体的效果。当每一阶段的决簟选定以后,就构成 个决策序列,称为一个簟略,它对应着一个确定的效果。 多阶段决策问题就是寻找使此效果录好的策略。 决戴决簟2 决Uk 决策Un 状态醉段1犬态醉段2状态找态醉段k状态状态醉段n状毒 3 k k+1 n n+1 2
动态规划 所谓多阶段决策问题是指这样的决策问题:其过程可分 为若干个相互联的阶段,每一阶段都对应着一组可供选择 的决策,每一决策的选定即依赖于当前面临的状态,又影 响以后总体的效果。当每一阶段的决策选定以后,就构成 一个决策序列,称为一个策略,它对应着一个确定的效果。 多阶段决策问题就是寻找使此效果最好的策略。 状态 x1 阶段1 T1 决策u1 状态 x2 决策u2 阶段2 T2 状态 x3 ... 状态 xk 决策uk 阶段k Tk 状态 xk+1 ... 状态 xn 决策un 阶段n Tn 状态 xn+1
多阶殷决策间题 工厂生产过程:由于市场需求是一随着肘间而变化的因素, 因此,为了取得金年录佳经济效益,就要在金年的生产过 程中,遜月或者逐季度地根据庠存和需求情况决定生产计 划安排。 设备更新闷题:一般企业用于生产活动的设备,刚买来时故 障少,经济效益高,即使迸行转让,处理价值也高,随着 使用年限的增加,就会還渐`为故障多,维修费用增加, 可正常使用的工肘减少,加工质量下降,经济效益差,并 且,使用的年限越长、处狸价值也越低,自然,如果卖去 旧的买新的,还需要付出更新费、因此就需要综合权衡决 定设备的使用年限,使恿的经济效益最好
多阶段决策问题 工厂生产过程:由于市场需求是一随着时间而变化的因素, 因此,为了取得全年最佳经济效益,就要在全年的生产过 程中,逐月或者逐季度地根据库存和需求情况决定生产计 划安排。 设备更新问题:一般企业用于生产活动的设备,刚买来时故 障少,经济效益高,即使进行转让,处理价值也高,随着 使用年限的增加,就会逐渐变为故障多,维修费用增加, 可正常使用的工时减少,加工质量下降,经济效益差,并 且,使用的年限越长、处理价值也越低,自然,如果卖去 旧的买新的,还需要付出更新费.因此就需要综合权衡决 定设备的使用年限,使总的经济效益最好
多阶殷决策间题 连生产过程的控制问题:一般化工生产过程中,常包含一 糸列完成生产过程的设备,前一工序设备的輪出则是后一 工序设备的輪入,因此应该如何根据各工序的运行工况, 控制生产过程中各设备的輪入和輪出,以使总产量最大。 资源分配问题:资源分配问题属于静态问题。如某工业部门 或公司,拟对其所属企业进行稀缺资源分配,为此需要制 定出收益录大的资源分配方。这种问题原本要求一次确 定出对各企业的资源分配量,它与肘间因素无关,不属动 态决策,但是,我们可以人为地规定一个资憑分配的阶段 和顺序,从而使其变成一个多阶段决策问题
多阶段决策问题 连续生产过程的控制问题:一般化工生产过程中,常包含一 系列完成生产过程的设备,前一工序设备的输出则是后一 工序设备的输入,因此应该如何根据各工序的运行工况, 控制生产过程中各设备的输入和输出,以使总产量最大。 资源分配问题:资源分配问题属于静态问题。如某工业部门 或公司,拟对其所属企业进行稀缺资源分配,为此需要制 定出收益最大的资源分配方案。这种问题原本要求一次确 定出对各企业的资源分配量,它与时间因素无关,不属动 态决策,但是,我们可以人为地规定一个资源分配的阶段 和顺序,从而使其变成一个多阶段决策问题