第一节零和对策 玩家二 P N 玩家一 P +1 -1 N -1 +1 在这张表格里,玩家一与玩家二各两个对策 P或N。局势表里的数字表示玩家一的赢数或玩 家二的输数。因此对于玩家一(二)来说,局势表 里出现正(负)数是好事,因为玩家一的羸数便是 玩家二的输数 23
23 玩家二 第一节 零和对策 玩家一 在这张表格里,玩家一与玩家二各两个对策 P或N。局势表里的数字表示玩家一的蠃数或玩 家二的输数。因此对于玩家一(二)来说,局势表 里出现正(负)数是好事,因为玩家一的羸数便是 玩家二的输数! 1 1 1 1 P N P N + − − +
第一节零和对策 现在玩家一选择P时便有两种局势:1与-1, 即矩阵的第一横行。而玩家二选择N的局势也有 两种:-1与1,即矩阵的第二竖列。一个局势表 示一次对策的结果:或者赢一枚硬币,或者输一 枚。某玩家在经过多次对策以后,他能选择的两 个策略P和N,每一个都有一个可能的出现频率 数,即该策略的概率 24
24 现在玩家一选择P时便有两种局势:1与-1, 即矩阵的第一横行。而玩家二选择N的局势也有 两种:-1与1,即矩阵的第二竖列。一个局势表 示一次对策的结果:或者蠃一枚硬币,或者输一 枚。某玩家在经过多次对策以后,他能选择的两 个策略P和N,每一个都有一个可能的出现频率 数,即该策略的概率。 第一节 零和对策
第一节零和对策 例如他每出示五次硬币总是三次正面P) 二次反面N),则P的概率是3/5,N的概率是25。 在玩家二选择某策略后,如果玩家一出示硬币P 与N的机会或概率分别是p1,P2,我们就说他选 择了一个混合策略p,P)。由于Pp2=1,这个 混合策略又可写成(1-p,p),p=P2。 25
25 例如他每出示五次硬币总是三次正面(P), 二次反面(N),则P的概率是3/5,N的概率是2/5。 在玩家二选择某策略后,如果玩家一出示硬币P 与N的机会或概率分别是p1,p2,我们就说他选 择了一个混合策略(p1,p2 )。 由于p1+p2=1,这个 混合策略又可写成(1-p,p), p = p2。 第一节 零和对策
第一节零和对策 例如,若玩家二选择策略P,在对策矩阵上 策略P对应竖列的数是(1,-1),则我们就把 E(p1,p2;P)=P1(1)+p2(-1) 称为玩家一采取的混合策略P1?P2)的期望值。 或者,同样地,可以把这个期望值写成 E(p,P)=(1-p)(1)+p(-1) 26
26 例如,若玩家二选择策略P,在对策矩阵上 策略P对应竖列的数是(1,-1),则我们就把 第一节 零和对策 称为玩家一采取的混合策略(p1,p2 )的期望值。 或者,同样地,可以把这个期望值写成 ( 1) 2 (1) 1 ; ) 2 , 1 E( p p P = p + p − E( p, P) = (1 − p)(1) + p(−1)
第一节零和对策 玩家一选择某策略后期望值为正(负)数,表 示他的这个选择能使他在对策中赢面较大,并且, 期望值愈大,赢得愈多。少反之,负(正)期望值 对玩家一意味着输面较大。 27
27 玩家一选择某策略后期望值为正(负)数,表 示他的这个选择能使他在对策中蠃面较大,并且, 期望值愈大,蠃得愈多。少反之,负(正)期望值 对玩家一意味着输面较大。 第一节 零和对策