第一节零和对策 在对策中妄图猜测对方出哪一面硬币当然是 一种不明智的做法,也不是对策论的主题。玩家 最明智的做法是事先估算一下赢或输的可能性。 现在由于对策的各种数字完全具有对称性,所以 玩家一最明智的做法是,出示硬币正面与反面的 机会是一半对一半。也就是说他采用了混合策略 (1-p,p)=(1/2,12)。这样,当玩家二选择策略P 时,玩家一的期望值是 E=E(p,P)=5(1)+5(-1)=0 28
28 在对策中妄图猜测对方出哪一面硬币当然是 一种不明智的做法,也不是对策论的主题。玩家 最明智的做法是事先估算一下蠃或输的可能性。 现在由于对策的各种数字完全具有对称性,所以 玩家一最明智的做法是,出示硬币正面与反面的 机会是一半对一半。也就是说他采用了混合策略 (1-p,p)=(1/2,1/2)。这样,当玩家二选择策略P 时,玩家一的期望值是 第一节 零和对策 E = E( p, P) = ( ) + (− ) = 1 2 1 1 2 1 0
第一节零和对策 同样,当玩家二选择策略N时,玩家一的期 望值是 E=E(p,N)=(-1)+(1)=0 现在玩家一采取的最保险的选择使得事态平 均结果为零,即不输不嬴的局面,我们把这个零 值称为对策的值。这是一个统计意义的值(即必 需进行对策成千上万次才有意义)。不言而渝, 在每一次具体的对策中,要不是赢得一枚硬币, 便是输掉一枚 29
29 同样,当玩家二选择策略N时,玩家一的期 望值是 第一节 零和对策 现在玩家一采取的最保险的选择使得事态平 均结果为零,即不输不蠃的局面,我们把这个零 值称为对策的值。这是一个统计意义的值(即必 需进行对策成千上万次才有意义)。不言而渝, 在每一次具体的对策中,要不是蠃得一枚硬币, 便是输掉一枚。 E = E( p, N ) = (− ) + ( ) = 1 2 1 1 2 1 0
第一节零和对策 因此我们上面说的对策的值,其意义是:玩 家在相当多次对策以后,公平竟争的期望值为零。 因此玩家一的最佳策略是出示正反面一半对一半。 同理,玩家二的最佳策略也是一半对一半。 30
30 因此我们上面说的对策的值,其意义是:玩 家在相当多次对策以后,公平竟争的期望值为零。 因此玩家一的最佳策略是出示正反面一半对一半。 同理,玩家二的最佳策略也是一半对一半。 第一节 零和对策
第一节零和对策 如果玩家二已经知道玩家一用了最佳混合 策略(12,1/2),则他将一无所得。另一方面, 如果玩家二事先已经知道玩家一采用了非最佳策 略,p,1p),(p≠0.5),则他完全可以通过增加 赢面的办法去提高他的期望值,使之为一个负数 可见,在混合对策的情况下,隐藏意图对于玩家 来说是非常重要的事! 31
31 如果玩家二已经知道玩家一用了最佳混合 策略(1/2,1/2),则他将一无所得。另一方面, 如果玩家二事先已经知道玩家一采用了非最佳策 略,(p ,1-p),(p0.5), 则他完全可以通过增加 蠃面的办法去提高他的期望值,使之为一个负数! 可见,在混合对策的情况下,隐藏意图对于玩家 来说是非常重要的事! 第一节 零和对策
第一节零和对策 例如,玩家一的策略是(13,23),于 玩家二 的策略是(23,13),玩家二的期望值是-1/9,而 玩家一的期望值也是-1/9。 玩家二 2/3 1/3 P N 玩家一 1/3P +1 -1 213 N -1 +1 32
32 例如,玩家一的策略是(1/3,2/3),玩家二 的策略是(2/3,1/3),玩家二的期望值是-1/9,而 玩家一的期望值也是-1/9。 第一节 零和对策 玩家二 玩家一