4.博弈的描述方法 1)策略式描述:表述规定和定义,P276; 完全信息下的静态博弈的策略表述:用支付矩 阵形式直观表描述。 邦德 坦白 抵赖 詹/想白 8,-8 0,-10 尼抵额-10,0 -1,-1
6 4.博弈的描述方法 1)策略式描述:表述规定和定义,P276; 完全信息下的静态博弈的策略表述:用支付矩 阵形式直观表描述。 -8,-8 0,-10 -10,0 -1,-1 坦白 抵赖 坦白 抵赖 詹 尼 邦 德
2)扩展式表述。表述规定,P277。 如例1,甲乙两个小孩往地上抛硬币,甲先乙后, 若硬币同面,则甲赢得乙一个硬币,若硬币异面 则甲输给乙一个硬币。由此可给出该博弈的博弈 树 正 1,-1 乙 正 甲 反正 反 反
7 2)扩展式表述。表述规定,P277。 如例1,甲乙两个小孩往地上抛硬币,甲先乙后, 若硬币同面,则甲赢得乙一个硬币,若硬币异面 则甲输给乙一个硬币。由此可给出该博弈的博弈 树: 1,-1 -1,1 -1,1 1,-1 正 正 正 反 反 反 甲 乙 乙
第二节零和(常数和)博奕 A可能的收益表 BB1 B2 B3 、收益矩阵 1 3 设有厂商A、B为双头垄断, 各自的收益是彼此价格的 A211.53 函数,市场需求为单一弹 性,因此不管对手采取何 B可能的收益表 种价格策略,其收益总是 恒等于一个常数。即 A BB 1 B。B 2 3 RAf(P, PB) A342 Rg=fB(PB, Pu A254.53 R4+RB=K(常数) 8
8 第二节 零和(常数和)博奕 一、收益矩阵 设有厂商A、B为双头垄断, 各自的收益是彼此价格的 函数,市场需求为单一弹 性,因此不管对手采取何 种价格策略,其收益总是 恒等于一个常数。即 R R K R f P P R f P P A B B B B A A A A B + = = = ( , ) ( , ) (常数) A可能的收益表 A1 3 2 4 A2 1 1.5 3 A B B1 B2 B3 B1 B2 B3 A1 3 4 2 A2 5 4.5 3 A B B可能的收益表
上述两表改为矩阵形式即称收益矩阵: 324 A 1412413 153 210422023 13342 b21b b 54.53 22123 A+B a1+b1412+b2413+h13 a21+h2(2+b2a23+b23 6 66 6 6 即常数和矩阵
9 上述两表改为矩阵形式即称收益矩阵: + + + + + + + = = = = = 2 1 2 1 2 2 2 2 2 3 2 3 1 1 1 1 1 2 1 2 1 3 1 3 2 1 2 2 2 3 1 1 1 2 1 3 2 1 2 2 2 3 1 1 1 2 1 3 a b a b a b a b a b a b A B b b b b b b B a a a a a a A 3 2 4 1 1.5 3 3 4 2 5 4.5 3 = 6 6 6 6 6 6 = 6 1 1 1 1 1 1 即常数和矩阵
上述常数和矩阵可变成零和矩阵,方法是从 任一收益矩阵中减去常数和加上另一矩阵: 3626463423-4-2342000 61563-65454-54545454000 当两人收益总和为零和矩阵时,叫两人零和对策如果把A、B两 个厂商的收益看成是收益增量,则常数和对策就变成了零和对 策。因为既然市场需求为单一弹性,那么任一厂商收益的增加 就意味着竞争对方收益的减少,或A的收益矩阵即B的损失矩阵。 、“最大—最小值定理”(“Min-Max定理”) 假定有A和B两个厂商,当他们互相不了解对方将采取何种策略 时,为避免风险,必须谨慎行事,作最坏的打算,A先找岀自己 收益矩阵中各种策略所能获得的最小收益,然后选择其中最大 的收益作为自己的最优策略;B也如此行事,但A的所得即B的所 失,因此B将从最大损失中选出最小的一个作为其最优的策略
10 上述常数和矩阵可变成零和矩阵,方法是从 任一收益矩阵中减去常数和加上另一矩阵: 3-6 2-6 4-6 1-6 1.5-6 3-6 + = 3 4 2 5 4.5 4 -3 - 4 -2 -5 -4.5 -4 + 3 4 2 5 4.5 4 = 0 0 0 0 0 0 当两人收益总和为零和矩阵时,叫两人零和对策.如果把A、B两 个厂商的收益看成是收益增量,则常数和对策就变成了零和对 策。因为既然市场需求为单一弹性,那么任一厂商收益的增加 就意味着竞争对方收益的减少,或A的收益矩阵即B的损失矩阵。 二、“最大—最小值定理”(“Min-Max定理”) 假定有A和B两个厂商,当他们互相不了解对方将采取何种策略 时,为避免风险,必须谨慎行事,作最坏的打算,A先找出自己 收益矩阵中各种策略所能获得的最小收益,然后选择其中最大 的收益作为自己的最优策略;B也如此行事,但A的所得即B的所 失,因此B将从最大损失中选出最小的一个作为其最优的策略