第十一章二人有限零和对策 二人有限零和对策是对策论(Game Theory)最基本的内容。 Game Theory也可译为博弈论,是研究 决策主体的行为发生直接相互作用时的决 策以及这种决策的均衡问题的学科。 1994年诺贝尔经济学奖授给了三位博 弈论专家:纳什、泽尔腾、海萨尼。博弈 论已经成为当代经济学的基石
第十一章 二人有限零和对策 二人有限零和对策是对策论(Game Theory)最基本的内容。 Game Theory也可译为博弈论,是研究 决策主体的行为发生直接相互作用时的决 策以及这种决策的均衡问题的学科。 1994年诺贝尔经济学奖授给了三位博 弈论专家:纳什、泽尔腾、海萨尼。博弈 论已经成为当代经济学的基石
第 基本概 、对策现象与对策论 1.对策现象 ①下棋:围棋源于我国殷代 ②齐王赛马:齐王与大将田忌赛马,各自的马都分为三 等,但齐王的同等马均强于田忌。孙膑给田忌出主意, 用下--上,上--中,中--下 结果田忌胜出。 顾石头剪子布 ③猜手小孩A与B猜手若规定赢01-1 得1分,平得0分,输得-1分,剪子-101 则A的赢得可用右表来表示 布 10
第一节 基本概念 一、对策现象与对策论 1. 对策现象 ①下棋:围棋源于我国殷代。 1 -1 0 -1 0 1 0 1 -1 A 石头 剪子 石头 剪子 布 赢 B 布 猜手:小孩A与B猜手,若规定赢 得1分,平得0分,输得 -1分, 则 A的赢得可用右表来表示。 ③ 齐王赛马:齐王与大将田忌赛马,各自的马都分为三 等,但齐王的同等马均强于田忌。孙膑给田忌出主意, 用下----上,上----中,中----下, 结果田忌胜出。 ②
2.对策论的产生 1944年,纽曼与曼彻斯特发表了题为《对策论和经 济行为》。二次大战前后,由于军事需要,抽象成数学 模型。 50年代是对策论发展的鼎盛时期,纳什和夏普利等 提出了讨价还价模型和合作对策的“核”的概念。同时 ,非合作对策也开始创立。纳什于1950和1951年发表了 两篇关于非合作对策的文章,图克于1950年定义了“囚 徒困境”问题 60年代,泽尔腾(1965)引入动态分析,提出“精 练纳什均衡”概念。海萨尼(1967-1968)则把不完全信 息引入对策论的研究
2 . 对策论的产生 1944年,纽曼与曼彻斯特发表了题为《对策论和经 济行为》。二次大战前后,由于军事需要,抽象成数学 模型。 50年代是对策论发展的鼎盛时期,纳什和夏普利等 提出了讨价还价模型和合作对策的“核”的概念。同时 ,非合作对策也开始创立。纳什于1950和1951年发表了 两篇关于非合作对策的文章,图克于1950年定义了“囚 徒困境”问题。 60年代,泽尔腾(1965)引入动态分析,提出“精 练纳什均衡”概念。海萨尼(1967-1968)则把不完全信 息引入对策论的研究
对策问题的组成 局中人(参加者):一局对策的参加者。 2策略:局中人在一局对策中对付对手的一个完整的方案 策略集:局中人在一局对策中所有策略的全体。记为S (分为有限和无限)问:田忌和齐王的S 3.局势:在一局对策中,每个局中人都选定一策略后的各 策略总和 如在二人对策中,设S1={a1…,an},S2={A,…,Bn} 则局势为(a,B)i=1…,m,j=l…,n 4.支付:局势给定后,局中人的得失(是局势的函数)。 分为零和:各局中人的得失之和为0 非零和:各局中人的得失之和非0
二 、对策问题的组成 1.局中人(参加者):一局对策的参加者。 2.策略:局中人在一局对策中对付对手的一个完整的方案。 策略集:局中人在一局对策中所有策略的全体。记为S (分为有限和无限)问:田忌和齐王的S=? 3. 局势:在一局对策中,每个局中人都选定一策略后的各 策略总和。 0 0 零和:各局中人的得失之和为 分为 非零和:各局中人的得失之和非 4. 支付:局势给定后,局中人的得失(是局势的函数)。 如在二人对策中 , , , , , , ,设 1 1 2 1 , 1, , , 1, , m n i j S S i m j n = = 则局势为( , ) = =
第二节矩阵对策的最优纯策略 矩阵对策 设二人有限零和对策问题的局中人为I,∏ 策略集为S1={a,a2 },S2={B1,B2 Bi 则支付可以用矩阵A :表示 其中an为的得(也是∏的失),∏的得即为an0 故又称二人有限零和对策为矩阵对策,记为G=(S1,S2A
M 第二节 矩阵对策的最优纯策略 1 2 11 1 1 1 2 S { },S { } A , , m n n m mn ij ij a a a a a a G S S A = = = 1 2 1 2 设二人有限零和对策问题的局中人为 , 策略集为 , , , , , , 则支付可以用矩阵 = 表示, 其中 为 的得(也是 的失), 的得即为- 。 故又称二人有限零和对策为矩阵对策,记为 ( ) 一、矩阵对策 mn1