(2)帕累托最优与有效结局 数理经济学的 Pareto最优在博弈论中可以 表述为:如果不存在其它的结局使得某些 局中人的效用(或盈利)比这个结局的效用 好得多,同时又不会使其他局中人的效用 (或盈利)变的更差,则称博弈的这个结局 是有效的 局中人理性行为的结果可以不是有效的! (3)两人0和博弈的混合策略解 局中人2 AB设局中人1,2采取行动AB的概率分别为 矩 ·局中人1的混合策略(1P2)=(p,1-p) B|-21 局中人2的混合策略(q1,q2)=(q,1-q) 居中人1:采取行动A的期望收益为:2q-(1-q)≥0=>3q-120 采取行动B的期望收益为:-2q+(1-q)≥0=>-3q+1≥0 居中人2:采取行动A的期望收益为:2p2(1-p)≤0→>4p2≤0 采取行动B的期望收益为:-p+(1-p)≤0=>-2p+1≤0 居中人1的混合策略(,P)=(12,1/2) 居中人2的混合策略(q1,呸)=(1/3,2/3)
第1章 信息经济学 11 (2) 帕累托最优与有效结局 •数理经济学的Pareto最优在博弈论中可以 表述为:如果不存在其它的结局使得某些 局中人的效用(或盈利)比这个结局的效用 好得多,同时又不会使其他局中人的效用 (或盈利)变的更差,则称博弈的这个结局 是有效的。 •局中人理性行为的结果可以不是有效的! (3)两人0和博弈的混合策略解 局中人 1 盈 利 矩 阵 1 局中人 2 设局中人1,2 采取行动A,B的概率分别为 •局中人1的混合策略 (p1 ,p2 )= (p,1-p) •局中人2的混合策略(q1 ,q2 )= (q, 1-q) 居中人1:采取行动A的期望收益为:2q-(1-q) ³ 0 => 3q-1³ 0 采取行动B的期望收益为:-2q+(1-q) ³ 0 => -3q+1³ 0 居中人2:采取行动A的期望收益为:2p-2(1-p) £ 0 => 4p-2£ 0 采取行动B的期望收益为:-p+(1-p) £ 0 => -2p+1£ 0 B -2 1 A 2 -1 A B •居中人1的混合策略 (p1,p2 )= (1/2,1/2) •居中人2的混合策略(q1,q2 )= (1/3,2/3)
混合策略的数学表述 局中人i=1,2,3,n,的一个混合策略是其 纯策略空间S,=(s1,s2…,S)上的概率分 布,记为 n个局中人的混合策略向量为σ=(σ1, σ2,…,σn)称为混合策略组合或混合策略 剖面,其中σ1,O2,…,On是统计独立的 ·局中人i在混合策略剖面σ上的期望赢利: l(G)=∑o(s)∑a1(S1)… o1(1-114 0.,(S. Gn(Sn)·(S1.,S 1, S n 在上例中 1(a)=∑o1(s,)∑o2(S2)(sp,S2) 2 2 2+一× ×(-2) l2()=∑aS21)∑o1(s1)(,52y) (-2)+-×2+ 1+一 =0 3(22 注解:纯策略空间上的概率分布称为退化分布
第1章 信息经济学 12 混合策略的数学表述 •局中人 i=1,2,3,… ,n,的一个混合策略是其 纯策略空间 上的概率分 布,记为:si 。 •n个局中人的混合策略向量为: s =(s1 , s2 , …,sn ) 称为混合策略组合或混合策略 剖面,其中s1 , s2 , …,sn 是统计独立的; •局中人 i 在混合策略剖面s上的期望赢利: ( , , , ) 1 2 i i i i ik S = s s L s å å å å å = = = + + = - - = × = + + + - - - n n n n i l i i i l i i i k l n nl i l l ij nl k l k l i i l k l l i i l k j i i ij s u s s s s u s s s s 1 1 2 1 1 1 1 1 1 1 1 1 1 ( ) ( , , , , , ) ( ) ( ) ( ) ( ) ( ) 1 2 1 1 1 1 1 1 1 1 1 L L L L s s s s s s 在上例中: å å = = = 2 1 2 2 1 1 2 2 1 1 1 1 ( ) ( ) ( ) ( , ) l l j l j j u s s s s s u s s ( ) ( ) 1 0 3 2 2 3 1 2 1 1 3 2 2 3 1 2 1 ÷ = ø ö ç è æ ÷ + ´ - + ´ ø ö ç è æ = ´ + ´ - å å = = = 2 1 1 1 2 1 2 2 1 2 2 2 ( ) ( ) ( ) ( , ) l l l j j j u s s s s s u s s ( ) ( 1) 0 2 1 1 2 1 3 2 2 2 1 2 2 1 3 1 ÷ = ø ö ç è æ ÷ + ´ + ´ - ø ö ç è æ = ´ - + ´ B -2,2 1,-1 A 2,-2 -1,1 A B 注解:纯策略空间上的概率分布称为退化分布
4)累次严优法(非O和) 局中人2 L M R 局中人2 L R 局U4,35,16,2 中 局U|456 人M2.18.436 中人 M D3,09,62,8 1D392 局中人2 局中人2的策略M称为其 L M R 相对于策略R的“严劣策局U312 略”—可以删除! 中 人M146 1D068 局中人2 局中人2 L R R 局U4,36,2 中 局U4 6 M2,13,6 1D3,02,8 人 1D3 2 局中人2 解:(U,L),(4,3) 局中人 R U4,36,2 注解:并非所有的博弈问题都有累次严优解!
第1章 信息经济学 13 (4)累次严优法(非O和) D 3, 0 9, 6 2, 8 M 2, 1 8, 4 3, 6 U 4, 3 5, 1 6, 2 L M R 局 中 人 1 局中人2 D 3 9 2 M 2 8 3 U 4 5 6 L M R 局 中 人 1 局中人2 D 0 6 8 M 1 4 6 U 3 1 2 L M R 局 中 人 1 局中人2 局中人2的策略M称为其 相对于策略R的“严劣策 略”— — 可以删除! D 3, 0 2, 8 M 2, 1 3, 6 U 4, 3 6, 2 L R 局 中 人 1 局中人2 U 4, 3 6, 2 局 L R 中 人 1 局中人2 解: (U,L),(4,3) 注解:并非所有的博弈问题都有累次严优解! D 3 2 M 2 3 U 4 6 L R 局 中 人 1 局中人2
2,4囚徒困境与纳什均衡 (1)完全信息静态博弈的纳什均衡: 假设有n个人参加博弈,在给定其他人策略的 条件下,每个人选择自己的相对最优策略(可 能依赖于他人的策略或不依赖),所有参与人 选择的策略一起构成一个战略组合,即为纳什 均衡。(僵局) 注解:Nash均衡策略是指这样一个策略组合(或 剖面),为了极大化自己的盈利(或效用),每 个局中人所采取的策略一定应该是关于其他局 中人所采取策略的最佳反应。因此没有一个局中 人会轻率地偏离这个策略组合(或剖面)而使自 己蒙受损失。 (2)囚徒困境 囚徒2 坦白不坦白 徒坦白80,-15 不坦白-15,0-1,-1 解:(坦白,坦白),(-8,-8) 当累次严优解不存在时,即局中人采用 某策略时A优于B,而采用另一策略时B优 于A时
第1章 信息经济学 14 (1) 完全信息静态博弈的纳什均衡: – 假设有 n 个人参加博弈,在给定其他人策略的 条件下,每个人选择自己的相对最优策略(可 能依赖于他人的策略或不依赖),所有参与人 选择的策略一起构成一个战略组合,即为纳什 均衡。(僵局) • 注解: Nash均衡策略是指这样一个策略组合(或 剖面),为了极大化自己的盈利(或效用),每 一个局中人所采取的策略一定应该是关于其他局 中人所采取策略的最佳反应。因此没有一个局中 人会轻率地偏离这个策略组合(或剖面)而使自 己蒙受损失。 2.4 囚徒困境与纳什均衡 不坦白 -15,0 -1,-1 坦白 -8,-8 0,-15 坦白 不坦白 囚徒 2 囚徒 1 解:(坦白,坦白), (-8,-8) •当累次严优解不存在时,即局中人采用 某策略时A优于B,而采用另一策略时B优 于A时。 (2) 囚徒困境
(3)Nash均衡的求解(下画线法) L R U a,e b, f (U,L)为纯策略Nash均衡 D相对于U为严劣策略 甲Dc,gd,h R L R 没有劣纯Ua,eb,f U a,e b, f 策略情况 Dc,g d,h Dc,gd,h R U a,eb,f 多重Nash均衡情况 Dc,g d,h (4)Nash均衡的数学表述 完全信息静态博弈问题中的混合策略剖面 ,如果对所有的局中人i(i=1,2,,n)均成 l1(o1,01)≥l(o,2) 那么,σ*被称为该博弈的Nash均衡; 如果。*是退化的混合策略(纯策略空间上的 概率分布称为退化分布),那么,所得到的 是纯策略Nash均衡
第1章 信息经济学 15 (3) Nash均衡的求解(下画线法) D c,g d,h U a,e b,f L R 乙 甲 ( U , L ) 为纯策略Nash均衡 D相对于U为严劣策略 D c,g d,h U a,e b,f L R 没有劣纯 策略情况 D c,g d,h U a,e b,f L R D c,g d,h U a,e b,f L R 多重Nash均衡情况 (4) Nash均衡的数学表述 •完全信息静态博弈问题中的混合策略剖面 s*,如果对所有的局中人i (i=1,2,… ,n)均成 立: 那么, s*被称为该博弈的Nash均衡; •如果s*是退化的混合策略(纯策略空间上的 概率分布称为退化分布),那么,所得到的 是纯策略Nash均衡。 * * * * ( , ) ( , ) i i i i i i i i u s s- ³ u s s - "s ¹ s